Bu soru, 1970'lerde Efron ve Morris tarafından yazılan Ampirik Bayes bağlamında James-Stein tahmincisi hakkındaki klasik dizi makalelerde açıkça cevaplanmıştır. Ben esas olarak:
Efron ve Morris, 1973, Stein'ın Tahmin Kuralı ve Rakipleri - Ampirik Bayes Yaklaşımı
Efron ve Morris, 1975, Stein Tahmincisi ile Veri Analizi ve Genellemeleri
Efron ve Morris, 1977, Stein'ın İstatistik Paradoksu
1977 makalesi, mutlaka okunması gereken teknik olmayan bir sergi. Orada beyzbol vuruş örneğini tanıttılar (bağlandığınız iş parçacığında tartışılıyor); bu örnekte, gözlem varyanslarının aslında tüm değişkenler için eşit olduğu varsayılmaktadır ve büzülme faktörü sabittir.c
Bununla birlikte, El Salvador'daki bazı şehirlerde toksoplazmoz oranlarını tahmin eden başka bir örnek vermeye devam ediyorlar. Her şehirde farklı sayıda insan araştırılmıştır ve bu nedenle bireysel gözlemlerin (her şehirde toksoplazmoz oranı) farklı varyansları olduğu düşünülebilir (anket yapılan insan sayısı ne kadar azsa, varyans o kadar yüksek). Sezgi, düşük varyans (düşük belirsizlik) olan veri noktalarının yüksek varyans (yüksek belirsizlik) olan veri noktaları kadar güçlü bir şekilde küçültülmesine gerek olmamasıdır. Analizlerinin sonucu, bunun gerçekten gerçekleştiği görülebilecek aşağıdaki şekilde gösterilmektedir:
Aynı veri ve analiz çok daha teknik 1975 belgesinde, çok daha zarif bir şekilde (maalesef bireysel varyansları göstermiyor) sunulmaktadır, bkz. Bölüm 3:
Orada, aşağıdaki gibi basitleştirilmiş bir Ampirik Bayes tedavisi sunarlar. Let bilinmemektedir. Durumda, tüm özdeş standart Deneysel Bayes tedavi tahmin etmektir olarak ve a posteriori ortalama hesaplamak için olarak hiçbir şey James-Stein tahmincisinden başka.Xi|θi∼N(θi,Di)θi∼N(0,A)
ADi=11/(1+A)(k−2)/∑X2jθiθ^i=(1−11+A)Xi=(1−k−2∑X2j)Xi,
Şimdi ise , daha sonra Bayes güncelleme kuraldır ve biz tahmin etmek aynı Deneysel Bayes hile kullanabilirsiniz , bu durumda için kapalı formül olmasa da (makaleye bakınız). Ancak,Di≠1θ^i=(1−DiDi+A)Xi
AA^
... tüm eşit olduğunda bu kural ve bunun yerine [1973 belgesinde] elde edilen bu tahmin küçük bir varyantını kullanırız. Varyant kuralı , her şehir için farklı bir değer tahmin eder . Bu durumda kurallar arasındaki fark küçüktür, ancak daha küçükse önemli olabilir .DjA^ik
1973 belgesindeki ilgili bölüm Bölüm 8'dir ve biraz daha zor okunur. İlginçtir, yukarıdaki yorumlarda @guy tarafından yapılan öneri hakkında açık bir yorum var:
Bu durum için James-Stein kurallara ulaşmak çok basit bir şekilde tanımlamaktır , böylece , dönüştürülen verilere [orijinal James-Stein kuralını] uygulayın ve sonra orijinal koordinatlarına geri dönün. Ortaya çıkan kural ,
tahmin ederHer aynı faktör tarafından orijine doğru küçüldüğünden bu .x~i=D−1/2ixi,θ~i=D−1/2iθix~i∼N(θ~i,1)θi θ i=(1-k-2θ^i=(1−k−2∑[X2j/Dj])Xi.
XiXi
Sonra devam edip tam olarak okumadığımı itiraf etmem gereken tahmin etmek için tercih ettikleri prosedürü (biraz dahil). Eğer ayrıntılarla ilgileniyorsanız oraya bakmanızı öneririm.A^i