Eşleştirilmemiş t-testi yerine Wilcoxon sıralama testi ne zaman kullanılır?


26

Bu, Frank Harrell'ın burada ne yazdığına dair bir takip sorusu :

Tecrübelerime göre t dağılımının doğru olması için gereken örneklem büyüklüğü eldeki örnek büyüklüğünden daha büyüktür. Wilcoxon işaretli sıralama testi dediğiniz gibi son derece verimli ve sağlam, bu yüzden neredeyse her zaman t testi tercih ediyorum

Doğru anladıysam - iki eşleştirilmemiş örneğin konumunu karşılaştırırken, örnek boyutlarımız küçükse, eşleştirilmemiş t-testi üzerinde Wilcoxon sıra toplamı testini kullanmayı tercih ederiz.

İki grubumuzun örneklem büyüklüklerinin göreceli olarak büyük olmasına rağmen, eşleştirilmemiş t-testi yerine Wilcoxon sıra toplamı testini tercih edeceğimiz teorik bir durum var mı?

Bu soru için motivasyonum, tek bir örnek t testi için, çok küçük olmayan bir eğri örnek için kullanılmasının yanlış bir tip I hata vereceği sonucuna varmasıdır:

n1 <- 100
mean1 <- 50
R <- 100000
P_y1 <- numeric(R)
for(i in seq_len(R))
{
    y1 <- rexp(n1, 1/mean1)
    P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}
sum(P_y1<.05) / R # for n1=n2=100 -> 0.0572  # "wrong" type I error

1
Bana göre 0.0572, 0.05'e yeterince yakın görünüyor.
mark999

Hi Mark - 100000 null hipotezin tekrarı altında yapıldığında, bu farkın 0,05'ten elde edilmesini beklemiyoruz. Genel olarak artı eksi iki kez sqrt (0.05 * 0.95 / 100000) gibi bir şey 0,05
Tal Galili 12:11

1
Yanlış olduğuna katılıyorum. Sadece pratik amaçlar için yeterince yakın göründüğünü söyledim.
mark999

1
İlgili bir soru: T-testi veya parametrik olmayan test arasında nasıl seçim yapılır, örneğin küçük numunelerde Wilcoxon , hem eşli hem de eşsiz testleri dikkate alır, ayrıca Brunner-Munzel gibi Wilcoxon alternatifleri. Ayrıca Frank Harrell'in yaklaşımında neden yukarıdaki özden daha ayrıntılı olarak haklı hissettiğini açıklayan mükemmel bir cevap da var (örneğin, monotonik dönüşüm altındaki rütbelerin değişiminin önemi).
Silverfish

@TalGalili: Neden bir t-testi yaptığınızı ve normalliğin varsayımını ihlal ettiğini göz önünde bulundurarak neden bu seviyede bir fark elde etmeyi beklemiyorsunuz? Burada acemi bir bakış açısıyla soruyorum. Sadece ne beklediğimizi anlamaya çalışıyorum, normallik varsayımı ihlal edildiğinde tek bir örnek t testi yapıyorum. Neden ortalama tip I hata% 5'ten küçük veya% 5'ten büyük veya başka bir şey olsun? Gördüğüm gibi, test ve dağılım normal. 'H0:μ=50
Erosennin

Yanıtlar:


23

Evet var. Örneğin, sonsuz varyanslı dağılımlardan gelen herhangi bir örnekleme Wilcoxon'u değil t-testini mahvedecektir. Parametrik Olmayan İstatistiksel Yöntemlere (Hollander ve Wolfe) atıfta bulunarak, t testine göre Wilcoxon'un asimptotik göreceli verimliliğinin (ARE), tektip dağılım için 1.0, Lojistik için 1.097 (yani, Wilcoxon daha iyidir) olduğunu, İkili Üstel (Laplace) ve Üstel için 3.0.

Hodges ve Lehmann, Wilcoxon'un diğer testlere göre minimum ARE değerinin 0.864 olduğunu gösterdi, bu nedenle başka hiçbir şeye göre kullanarak yaklaşık% 14'ten daha fazla verim kaybetmezsiniz. (Elbette bu bir asimptotik sonuçtur.) Sonuç olarak, Frank Harrell'in Wilcoxon'u varsayılan olarak kullanması muhtemelen kendim de dahil olmak üzere neredeyse herkes tarafından benimsenmelidir.

Düzenleme: Yorumlardaki takip sorusuna yanıt olarak, güven aralıklarını tercih edenler için, Hodges-Lehmann tahmincisi Wilcoxon testine "karşılık gelen" tahmin edicidir ve bunun etrafında güven aralıkları oluşturulabilir.


1
Wilcoxon testi kullanılıyorsa, güven aralığını elde etmenin kolay bir yolu var mı? İnsanları p-değerine, parametrik bir yöntemle yapabileceklerinden daha fazla vurgulamaya teşvik ediyor gibi görünüyor.
mark999

Evet, Hodges-Lehmann tahmincisi ilgili tahmin edicidir ve yanıtın gövdesini, gelecekteki okurların yorumları incelemesi gerekmeyecek şekilde düzenledim.
jbowman

Sağol Jbowman. Hodges-Lehmann tahmin edicisine aşina değilim ama bu konuda ne bulabileceğimi göreceğim.
mark999

3
biostat.mc.vanderbilt.edu/WilcoxonSoftware , Hodges-Lehmann tahminini ve güvenirlik aralığını elde etmek için R'nin nasıl kullanılacağını gösterir.
Frank Harrell,

1
(+1) sıkıntılı bir rütbe karşıtı gelenekçiden. Bununla birlikte, sıralama testleri için bir zorluk, hipotezin belirsiz olmasıdır. Genel olarak t-testi ile aynı hipotez değildir. T-testi her zaman ortalama bir farkı test eder, Wilcoxon ağırlıklı bir ortalama sıra farkını test eder. Elbette, sıra-ortalama farkı istatistiksel olarak anlamlı ise, dağılımları, ortalamaları aynı olsa bile, farklı olması gerektiğini biliyoruz. Her iki durumda da , her durumda dağılım farklılıklarını tespit etmek için test yapılmaz. Sadece o kadar söylüyorum çünkü yorumlanabilirliği tercih ediyorum. (1/2)
AdamO

24

Beni yorumlarında geri Tartışmamızı size getirsin bu sorunuza. Wilcoxon toplam sıralama testi Mann Whitney U testine eşdeğerdir (ve ikiden fazla örnek için doğrudan uzantısına Kruskal-Wallis testi denir). Bu metinde olduğu gibi Wikipedia'da da görebileceğiniz gibi Mann-Whitney (veya Kruskal-Wallis) genellikle araçları ya da medyanları karşılaştırmaz. Genel değerlerin prevalansını karşılaştırır: numunelerden hangisinin “stokastik olarak daha büyük” olduğu. Test dağıtım gerektirmez. T-testi araçları karşılaştırır. Normal dağılım gösterir. Dolayısıyla, testler farklı hipotezlere girer.. Çoğu durumda, araçları özellikle karşılaştırmayı planlamıyoruz, bunun yerine hangi numunenin değerlere göre daha büyük olduğunu bilmek istiyoruz ve Mann-Whitney'i bizim için varsayılan test yapıyor. Diğer taraftan, her iki dağılım da simetrik olduğunda, bir numunenin diğer dejenere göre "daha büyük" olup olmadığını test etme görevi, iki aracın karşılaştırılması görevi ile, ve dağılımlar eşit sapmalarla normalse t-testi biraz olur daha güçlü.


Cevabınızı test edilen hipotezlerin anlamına geri bağlamak için +1
Josh Hemann,

"Numunelerden hangisinin" stokastik olarak daha büyük olduğu "" derken, "numunelerden hangisinin diğerine göre daha yüksek değerler aldığı" anlamına mı geliyorsunuz? Olmazsa, ne demek istiyorsun? Bunu biraz daha açıklayabilir misiniz lütfen?
Erdoğan CEVHER

1
@ Erdoğan, evet, dediğiniz gibi söyleyebiliriz. Kesin ifadesi şudur: Rastgele seçilen bir nesne çiftinde, her örnekten birinden, "stokastik olarak daha baskın" bir numuneden gelen nesne,> 0.5 olasılıklı diğer numuneden olan nesneye göre (değere göre) daha yüksek olacaktır.
ttnphns
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.