Stouffer'ın Z-skor yöntemi: biz Özetle ne olur yerine ?


22

Ben yapıyorum aynı boş hipotezi ile bağımsız istatistiksel testler ve bir içine sonuçlarını birleştirmek istiyoruz -değeri. İki "kabul edilmiş" yöntem varmış gibi görünüyor: Fisher yöntemi ve Stouffer yöntemi .pNp

Benim sorum Stouffer'ın yöntemi hakkında. Her ayrı test için, bir z-puanı elde . Boş bir hipotez altında, her biri standart bir normal dağılımla dağıtılır, bu nedenle toplamı değişkenli normal bir dağılımı izler . Bu nedenle Stouffer'ın yöntemi, normalde birim varyans ile dağıtılması gereken yi hesaplamayı önerir ve sonra bunu ortak z-skoru olarak kullanır. Σ z i N Σ z i / ziΣziNΣzi/N

Bu mantıklı, ancak işte geldiğim ve bu da bana mantıklı gelen başka bir yaklaşım. her biri standart bir normal dağılımdan geldiğinden, karelerinin toplamı, serbestlik derecesine sahip bir ki-kare dağılımından gelmelidir . Böylece biri hesaplayabilir ve serbestlik dereceli ( p = 1 − X_N (S) , ki burada X_N , CDF) kümülatif ki-kare dağılım fonksiyonunu kullanarak onu bir -değerine dönüştürebilir . S = Σ z 2 ı K G P , N p = 1 - X, N ( S ) X, NziS=Σzi2NSpNp=1XN(S)XN

Ancak hiçbir yerde bu yaklaşımı bulamıyorum bile. Hiç kullanıldı mı? Bir adı var mı? Stouffer'ın yöntemine kıyasla avantajlar / dezavantajlar neler olabilir? Yoksa aklımda bir kusur mu var?


Dışarı fırlayan göze çarpan bir kusur, Stouffer'ın metodu, z_i'deki sistematik kaymaları algılayabilir zi; ki bu, bir alternatif tutarlı bir şekilde doğru olduğunda genellikle gerçekleşmesi beklenen şeydir; Hızlı bir simülasyon ( N=100 , 104 yineleme) bunun böyle olduğunu gösterir; Ki-kare yöntemi tek taraflı bir alternatifi tespit etmek için ciddi ölçüde daha az güçlüdür.
whuber

2
Sağol Whuber! Simülasyonunuzu daha ayrıntılı olarak anlatabilir misiniz, merak ediyorum. Öte yandan, eğer farklı işaretlere sahip fakat büyük mutlak değerlere sahipse, Stouffer'ın metodu toplam ile , ÇOK anlamlı bir . Sanırım bazı durumlarda daha anlamlı olabilir (ve benim durumumda olduğundan şüpheleniyorum ama emin değilim). z 0 pziz0p
amip diyor Reinstate Monica

1
Haklısın, bu yüzden yorumumu bir cevap olarak göndermedim. Ancak alternatiflerin, her iki yönde de sıfırdan çok radikal bir şekilde değiştiği , yalnız şanstan başka ne tür durumlar vardır ?
whuber

Aklımdaki durum, ampirik bir dağılımın sıfırdan farklı olup olmadığıyla ilgilenen Pearson'un ki-kare testindeki gibi bir durum; sonra her iki yöndeki sapmalar da önemlidir. Ama ikinci bir düşünce verdikten sonra, sezgilerinizin doğru olduğunu ve benim durumumda şüpheli sapmaların tek bir yönde olduğunu tahmin ediyorum. Yorumunuzu bir cevap olarak yayınlarsanız ve hızlı simülasyonunuzla ilgili bazı ayrıntılar verirseniz (ki-kare yönteminin neden daha az güçlü olduğu çok merak ediyorum!), Kabul etmekten mutlu olurum.
amip diyor Reinstate Monica

N Z puanlarının toplamı n? Değişkeni ile dağılıma sahiptir. Varyans neden ortalamanın standart hatasının karesi değil? başlığında belirtildiği gibi toplamı N değişkenliği var. Belki de bariz bir şeyi özlüyorum? Z2
russellpierce 23

Yanıtlar:


17

bir kusur, Stouffer'ın yöntemi, sistematik kaymaları algılayabilir ; ki bu, bir alternatif sürekli olarak doğru olduğunda genellikle gerçekleşmesi beklenen şeydir; oysa ki ki kare yöntem, bunu yapmak için daha az güce sahip gibi görünecektir. Hızlı bir simülasyon, durumun böyle olduğunu gösterir; Ki-kare yöntemi tek taraflı bir alternatifi tespit etmek için daha az güçlüdür. Burada (kırmızı = Stouffer'ın, mavi = Ki-kare) için her iki yöntemde de, p-değerleri histogramlardır bağımsız tekrarlamalar ve çeşitli tek taraflı standart etkilerin hiçbiri arasında değişen ( ) ile SD ( ).10 5 , N = 10 μ μ = 0 0.6 μ = 0.6zi105N=10μμ=00.6μ=0.6

şekil

Daha iyi prosedür sıfıra yakın daha fazla alana sahip olacaktır. Gösterilen değerinin tüm pozitif değerleri için , bu prosedür Stouffer prosedürüdür.μ


R kodu

Bu karşılaştırma için Fisher'ın yöntemini (yorumladı) içerir.

n <- 10
n.iter <- 10^5
z <- matrix(rnorm(n*n.iter), ncol=n)

sim <- function(mu) {
  stouffer.sim <- apply(z + mu, 1, 
                    function(y) {q <- pnorm(sum(y)/sqrt(length(y))); 2*min(q, 1-q)})
  chisq.sim <- apply(z + mu, 1, 
                    function(y) 1 - pchisq(sum(y^2), length(y)))
  #fisher.sim <- apply(z + mu, 1,
  #                  function(y) {q <- pnorm(y); 
  #                     1 - pchisq(-2 * sum(log(2*pmin(q, 1-q))), 2*length(y))})
  return(list(stouffer=stouffer.sim, chisq=chisq.sim, fisher=fisher.sim))
}

par(mfrow=c(2, 3))
breaks=seq(0, 1, .05)
tmp <- sapply(c(0, .1, .2, .3, .4, .6), 
              function(mu) {
                x <- sim(mu); 
                hist(x[[1]], breaks=breaks, xlab="p", col="#ff606060",
                     main=paste("Mu =", mu)); 
                hist(x[[2]], breaks=breaks, xlab="p", col="#6060ff60", add=TRUE)
                #hist(x[[3]], breaks=breaks, xlab="p", col="#60ff6060", add=TRUE)
                })

Tekrar teşekkürler, bu çok hoş. Ve Fisher'ın yöntemini yorumlamazsanız ne olur? Sanırım çoktan denedin. Stouffer sürekli olarak kazanır mı? (Kendimi denememediğim için üzgünüm, fakat R ile hiçbir deneyimim yok ve elimde yok.)
Amip Reinstate Monica

Güncelleme: Fisher ve Stouffer yöntemleri arasındaki karşılaştırma ile ilgili burada güzel bir tartışma buldum . Talep, Stouffer'ın sıfırdan gelen tutarlı sapmalara karşı daha hassas, Fisher ise tekli (ama büyük) sapmalara karşı daha hassastır. Ben tutarlı sapmaları (vardı senin simülasyonunda tahmin hepsi aynı doğru testler),? testten sadece 1 tanesinde güçlü bir sapma görülürse ne olacağını merak ediyorum . N NμNN
amip diyor Reinstate Monica

1
Bunu Rtest etmek için simülasyonu kolayca değiştirebilirsiniz . Kendinizi bu istatistiksel hesaplama platformuna tanıtmanın iyi bir yolu olabilir. :-)
whuber

2
Simülasyonunu yeniden üretmek için matlab kullandım. Sonuç: Tüm sürekli saptığında, Stouffer Fisher'ı küçük bir farkla kazanır ve "my" metodu (gösterdiğin gibi) umutsuzca kaybeder. yalnızca biri çok saptığında, Fisher "my" yöntemini küçük bir farkla kazanır ve Stouffer umutsuzca kaybeder. z benzizi
amip diyor Reinstate Monica

Büyük tartışma ve KG! Kısa bir soru: peki ya bu problemi Mahalanobis mesafesini hesaplayarak ve bunun gibi bir şeyi takip ederek bir dışlayıcı / anomali tespiti olarak oluşturursa ?
NULL

10

Test istatistiklerine ilişkin bir içgörü kazanmanın genel bir yolu, bu test istatistiğinin en güçlü olmasına yol açacak (genellikle kapalı) temel varsayımların türetilmesidir. Bu özel durum için bir öğrenci ve ben bunu yakın zamanda yaptık: http://arxiv.org/abs/1111.1210v2 (gözden geçirilmiş bir versiyon Uygulamalı İstatistik Annals’ında görünecektir).

Kısaca özetlemek gerekirse (ve başka bir cevabın simülasyon sonuçlarıyla tutarlı) Stouffer'ın yöntemi, "gerçek" temel etkilerin hepsi eşit olduğunda en güçlü olacaktır; Z ^ 2'nin toplamı, altta yatan etkiler normalde 0'a kadar dağıtıldığında en güçlü olacaktır. Bu, ayrıntıları göz ardı eden hafif bir sadeleştirmedir: daha fazla ayrıntı için yukarıda verilen arxiv ön baskısında bölüm 2.5'e bakın.


2
(+1) Her nasılsa, çok uzun zaman önce yazdığımı sanıyordum, fakat öyle görünmüyordu: Soruma cevap vermek için buraya kayıt olduğunuz için çok teşekkürler! Bunu takdir ediyorum. Makalenizde Bölüm 2.5 gerçekten çok alakalı.
amip diyor Reinstate Monica

3

Hafif o / t: Bu yaklaşımların her ikisinde de sorunlardan biri, serbestlik derecelerine bağlı olarak güç kaybıdır (stoueperlar için N; Fisher için 2N). Bunun için geliştirilmiş, örneğin düşünmek isteyebileceğiniz daha iyi meta-analitik yaklaşımlar olmuştur (örneğin, ters varyans ağırlıklı meta-analiz).

Bir grup içindeki bazı alternatif testlerin kanıtlarını arıyorsanız, Donoho ve Jin'in yüksek eleştirisi istatistiklerine bakmak isteyebilirsiniz: https://projecteuclid.org/euclid.aos/1085408492


1

Soruyu cevaplamak ve daha sonraki okuyucular için: hiç kullanıldı mı ?, kuzenler (2008) tarafından arXiv hakkında birkaç alternatif yaklaşım listeleyen ve inceleyen ayrıntılı bir makale var . Önerilen bir görünmüyor gibi görünüyor.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.