Eşit olmayan varyanslara sahip James-Stein Tahmincisi


11

James-Stein tahmincisinin bulduğum her ifade, tahmin edilen rastgele değişkenlerin aynı (ve birim) varyansa sahip olduğunu varsayar.

Ancak bu örneklerin tümü, JS tahmincisinin, birbirleriyle hiçbir ilgisi olmayan miktarları tahmin etmek için kullanılabileceğinden de bahsetmektedir. Wikipedia örneği Montana ışık, Tayvan çay tüketimi ve domuz ağırlığının hızıdır. Ancak muhtemelen bu üç miktardaki ölçümleriniz farklı "gerçek" varyanslara sahip olacaktır. Bu bir sorun yaratıyor mu?

Bu, bu soru ile ilgili anlamadığım daha büyük bir kavramsal soruna bağlanıyor: James-Stein tahmincisi: Efron ve Morris beyzbol örneği için büzülme faktöründe nasıl hesapladılar ? σ2Büzülme faktörü aşağıdaki gibi hesaplıyoruz :c

c=1(k3)σ2(yy¯)2

Sezgisel olarak, teriminin aslında - tahmin edilen her miktar için farklı olduğunu . Ancak bu sorudaki tartışma sadece toplanmış varyansı kullanmaktan bahsediyor ...σ2σi2

Herkes bu karışıklığı giderebilir eğer gerçekten takdir ediyorum!


3
Varyans ise, James-Stein sorununa geri dönmek için hemen çarpabiliriz . Eğer bilinmeyen, ancak sorun her "gözlem" temelinde hesaplanan bir örnek ortalamas gözlemlere biz tahmin edebilir bazılarıyla ve biz yan çarpma öncesi eğer biz de bir James-Stein durumu olsun umut yerine. D=diag(σ12,,σn2)D1/2DmiDD^D^1/2
adam

2
@guy: Bu mantıklı bir öneri (+1), ancak bu tüm değişkenler için aynı büzülme faktörüne yol açacak, oysa değişkenler değişkenlik / belirsizliklerine bağlı olarak farklı şekilde küçültmek isteyecektir. Az önce gönderdiğim yanıtı görün.
amip

1
@amoeba Tabii; Tahmincimin pratik olduğunu öne sürmüyordum, sadece insanların OP'nin ikinci paragrafında neden bahsettiklerini neden söylediğini resmediyordum.
adam

Yanıtlar:


6

Bu soru, 1970'lerde Efron ve Morris tarafından yazılan Ampirik Bayes bağlamında James-Stein tahmincisi hakkındaki klasik dizi makalelerde açıkça cevaplanmıştır. Ben esas olarak:

  1. Efron ve Morris, 1973, Stein'ın Tahmin Kuralı ve Rakipleri - Ampirik Bayes Yaklaşımı

  2. Efron ve Morris, 1975, Stein Tahmincisi ile Veri Analizi ve Genellemeleri

  3. Efron ve Morris, 1977, Stein'ın İstatistik Paradoksu

1977 makalesi, mutlaka okunması gereken teknik olmayan bir sergi. Orada beyzbol vuruş örneğini tanıttılar (bağlandığınız iş parçacığında tartışılıyor); bu örnekte, gözlem varyanslarının aslında tüm değişkenler için eşit olduğu varsayılmaktadır ve büzülme faktörü sabittir.c

Bununla birlikte, El Salvador'daki bazı şehirlerde toksoplazmoz oranlarını tahmin eden başka bir örnek vermeye devam ediyorlar. Her şehirde farklı sayıda insan araştırılmıştır ve bu nedenle bireysel gözlemlerin (her şehirde toksoplazmoz oranı) farklı varyansları olduğu düşünülebilir (anket yapılan insan sayısı ne kadar azsa, varyans o kadar yüksek). Sezgi, düşük varyans (düşük belirsizlik) olan veri noktalarının yüksek varyans (yüksek belirsizlik) olan veri noktaları kadar güçlü bir şekilde küçültülmesine gerek olmamasıdır. Analizlerinin sonucu, bunun gerçekten gerçekleştiği görülebilecek aşağıdaki şekilde gösterilmektedir:

resim açıklamasını buraya girin

Aynı veri ve analiz çok daha teknik 1975 belgesinde, çok daha zarif bir şekilde (maalesef bireysel varyansları göstermiyor) sunulmaktadır, bkz. Bölüm 3:

resim açıklamasını buraya girin

Orada, aşağıdaki gibi basitleştirilmiş bir Ampirik Bayes tedavisi sunarlar. Let bilinmemektedir. Durumda, tüm özdeş standart Deneysel Bayes tedavi tahmin etmektir olarak ve a posteriori ortalama hesaplamak için olarak hiçbir şey James-Stein tahmincisinden başka.

Xi|θiN(θi,Di)θiN(0,A)
ADi=11/(1+A)(k2)/Xj2θi
θ^i=(111+A)Xi=(1k2Xj2)Xi,

Şimdi ise , daha sonra Bayes güncelleme kuraldır ve biz tahmin etmek aynı Deneysel Bayes hile kullanabilirsiniz , bu durumda için kapalı formül olmasa da (makaleye bakınız). Ancak,Di1

θ^i=(1DiDi+A)Xi
AA^

... tüm eşit olduğunda bu kural ve bunun yerine [1973 belgesinde] elde edilen bu tahmin küçük bir varyantını kullanırız. Varyant kuralı , her şehir için farklı bir değer tahmin eder . Bu durumda kurallar arasındaki fark küçüktür, ancak daha küçükse önemli olabilir .DjA^ik

1973 belgesindeki ilgili bölüm Bölüm 8'dir ve biraz daha zor okunur. İlginçtir, yukarıdaki yorumlarda @guy tarafından yapılan öneri hakkında açık bir yorum var:

Bu durum için James-Stein kurallara ulaşmak çok basit bir şekilde tanımlamaktır , böylece , dönüştürülen verilere [orijinal James-Stein kuralını] uygulayın ve sonra orijinal koordinatlarına geri dönün. Ortaya çıkan kural , tahmin ederHer aynı faktör tarafından orijine doğru küçüldüğünden bu .x~i=Di1/2xi,θ~i=Di1/2θix~iN(θ~i,1)θi θ i=(1-k-2

θ^i=(1k2[Xj2/Dj])Xi.
XiXi

Sonra devam edip tam olarak okumadığımı itiraf etmem gereken tahmin etmek için tercih ettikleri prosedürü (biraz dahil). Eğer ayrıntılarla ilgileniyorsanız oraya bakmanızı öneririm.A^i

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.