James-Stein tahmincisi: Efron ve Morris beyzbol örnekleri için büzülme faktöründe


18

Bradley Efron ve Carl Morris'in "Stein'ın İstatistiklerdeki Paradoksu" adlı 1977 Scientific American gazetesinde James-Stein Büzülme faktörünü hesaplamakla ilgili bir sorum var .

Beyzbol oyuncuları için veri topladım ve aşağıda verilmiştir:

Name, avg45, avgSeason    
Clemente, 0.400, 0.346    
Robinson, 0.378, 0.298    
Howard, 0.356, 0.276    
Johnstone, 0.333, 0.222    
Berry, 0.311, 0.273    
Spencer, 0.311, 0.270    
Kessinger, 0.289, 0.263    
Alvarado, 0.267, 0.210    
Santo, 0.244, 0.269    
Swoboda, 0.244, 0.230    
Unser, 0.222, 0.264    
Williams, 0.222, 0.256    
Scott, 0.222, 0.303    
Petrocelli, 0.222, 0.264    
Rodriguez, 0.222, 0.226    
Campaneris, 0.200, 0.285    
Munson, 0.178, 0.316    
Alvis, 0.156, 0.200

avg45, yarasalarda 45 yaşından sonra ortalamadır ve makalede olarak gösterilmiştir y. avgSeasonsezon ortalamasının sonu.

Ortalama ( z ) için James-Stein tahmincisi tarafından verilir

z=y¯+c(yy¯)
ve büzülme faktörü tarafından verilir (Scientific American 1977 makalesinin 5. sayfası) c
c=1(k3)σ2(yy¯)2,

burada bilinmeyen araçların sayısıdır. Burada 18 oyuncu var yani . değerlerini kullanarak hesaplayabilirim . Ama nasıl hesaplayacağımı bilmiyorum . Yazarlar verilen veri seti için diyorlar .kk=18(yy¯)2avg45σ2c=0.212

için hem hem de kullanmayı denedim ama doğru cevabını vermiyorlarσx2σy2σ2c=0.212

Herkes bu veri kümesi için hesaplamak için bana bildirmek için yeterince nazik olabilir mi?σ2


1
MAD ( en.wikipedia.org/wiki/Median_absolute_deviation ) dalgacık büzülmesinde çok kullanıldığını biliyorum .
robin girard

Yanıtlar:


19

Parametre normalde dağıtılmış kabul her biri vektör bileşenlerinin (bilinmeyen) ortak varyansıdır. Beyzbol verileri için 45 Y ib i n o m ( 45 , p i ) var , bu yüzden binom dağılımına normal yaklaşım ( ^ p i = Y i alarak ) verirσ245Yibinom(45,pi)pi^=Yi

p^inorm(mean=pi,var=pi(1pi)/45).

Bir değere eşit olmuştur sonra havuzlanmış tahmin ile tahmin olabilir Açıkçası bu durumda varyanslar henüz eşit değildir, σ 2 = p ( 1 - p ) s büyük ortalama bir p =1

σ^2=p^(1p^)45,
p^ Efron ve Morris'in yaptığı gibi görünüyor (1977 makalesinde).
p^=11845i=11845Yi=Y¯.

Bunu aşağıdaki R koduyla kontrol edebilirsiniz. İşte veriler:

y <- c(0.4, 0.378, 0.356, 0.333, 0.311, 0.311, 0.289, 0.267, 0.244, 0.244, 0.222, 0.222, 0.222, 0.222, 0.222, 0.2, 0.178, 0.156)

ve için tahmin :σ2

s2 <- mean(y)*(1 - mean(y))/45

ki bu σ 2,004332392 . Kağıttaki büzülme faktörüσ^20.004332392

1 - 15*s2/(17*var(y))

c0.2123905k2k3


Mükemmel açıklama, binomun normal yaklaşımını seviyorum.
Chamberlain Foncha

14

c=0.212

Efron, B. ve Morris, C. (1975). Stein tahmincisi ve genellemeleri kullanılarak veri analizi. Amerikan İstatistik Derneği Dergisi, 70 (350), 311-319 (pdf bağlantısı)

veya daha ayrıntılı

Efron, B. ve Morris, C. (1974). Stein tahmincisi ve genellemeleri kullanılarak veri analizi. R-1394-OEO, RAND Corporation, Mart 1974 (pdf bağlantısı) .

312 Sayfasında, Efron ve Morris'in bu verilerin bir ark sinüs dönüşümü kullandığını göreceksiniz, böylece vuruş ortalamalarının varyansı yaklaşık olarak birliktedir:

> dat <- read.table("data.txt", header=T, sep=",")
> yi  <- dat$avg45
> k   <- length(yi)
> yi  <- sqrt(45) * asin(2*yi-1)
> c   <- 1 - (k-3)*1 / sum((yi - mean(yi))^2)
> c
[1] 0.2091971

z

> zi  <- mean(yi) + c * (yi - mean(yi))
> round((sin(zi/sqrt(45)) + 1)/2,3) ### back-transformation
[1] 0.290 0.286 0.282 0.277 0.273 0.273 0.268 0.264 0.259
[10] 0.259 0.254 0.254 0.254 0.254 0.254 0.249 0.244 0.239

İşte bunlar Stein tahmincisinin değerleri. Clemente için, 1977 makalesinde .294'e oldukça yakın olan .290 elde ediyoruz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.