Wilcokson'un İmzalı-Sıra Testi hangi durumda t-Testi veya İşaret Testi için tercih edilir?


11

Bazı tartışmalardan sonra (aşağıda), şimdi odaklanmış bir soruya dair daha net bir resmim var, bu yüzden burada gözden geçirilmiş bir soru var, ancak bazı yorumlar şimdi orijinal soru ile bağlantısız görünebilir.

O görünüyor t-testi simetrik dağılımlar için hızla yakınsama olduğunu, signed-rank testi simetrisini varsayar ve bu, simetrik dağılımı için, araçlar / pseudomedians / medyan arasında hiçbir fark yoktur. Eğer öyleyse, hangi koşullarda göreceli olarak deneyimsiz bir istatistikçi hem t-testi hem de işaret testi mevcut olduğunda imzalı-sıra testini yararlı bulur? Eğer (örneğin sosyal bilim) öğrencilerimden biri, bir tedavinin diğerinden daha iyi performans gösterip göstermediğini test etmeye çalışıyorsa (nispeten kolay yorumlanabilir bazı ölçülerle, örneğin "ortalama" fark kavramı gibi), imzalı- üniversitemde genel olarak öğretilmiş gibi görünse de işaret testi göz ardı edildi.


1
Justme: tabii ki bunu düşünmedim.
JonB

2
Kimin geleneksel bilgeliğine baktığınıza bağlıdır ; benim deneyimim sizinkinden çok farklı. Kuşkusuz, fark skorlarının simetrisinin sıfırın altında olduğunu (ve önemli olduğunu) açıkça belirten kaynakları bulmak kolaydır. Ancak bunun sıfırın altında olduğunu unutmayın - sonuç olarak, bir örnekte fark puanlarında simetri eksikliğinin bulunması mutlaka ilgili değildir - alternatif altında simetriye sahip olmanız gerekmez. Eğer null doğru olsaydı simetrinin
tutacağından eminseniz

1
ctd ... o zaman sorun yok. Sorun, önceden varsaymaya hazır değilseniz, varsayım başarısızlığından kaynaklanan bir retin neden olup olmadığını bilmiyorsanız; Daha sonra yapılacak bariz şey basitçe değil bunu varsayalım.
Glen_b

2
İlk önce ikinci yorumunuza baktığınızda: (daha önce bahsettiklerinizin üstünde), 1. normal varsayımların parametrik testleri tüketmediğini unutmayın. 2. İmzalı rütbe testi aslında medyanların değil, tek örnekli Hodges-Lehmann istatistiklerinin / yalancıların testidir (alternatife simetri varsayımını eklerseniz, medyanları ve araçların nerede olduğunu da test eder, araçlar için, diğer birçok şey arasında). Benzer şekilde, sıra toplamı testi, medyanların testi değil, medyan ikili farklılıklarının bir testidir. İmzalı rütbe testinin seviyesinin asimetriye oldukça duyarlı olabileceği konusunda haklısınız.
Glen_b

2
Önceki yorumunuzda: 1 Simetri genellikle sıfırın bir parçası olarak değil, permütasyonların sıfırın altında değiş tokuş edilebilmesi için ihtiyaç duyduğunuz varsayımların bir parçası olarak görülür. 2. Daha önce de belirtildiği gibi, bu aslında medyanların değil, psödomedilerin bir testidir ve bu asimetrik bir alternatif altında bile geçerlidir. Bazı kısıtlayıcı varsayımlar yaparsanız yorumlamanın bazen daha kolay olduğu doğrudur, ancak medyanlar için makul bir test yapmak için gereken kısıtlamaların alternatif altında simetri varsaymak kadar katı olması gerekmez.
Glen_b

Yanıtlar:


3

Normalden biraz daha ağır olan, ancak özellikle "peaky" olmayan, çift farklılıkların bir dağılımını düşünün; o zaman genellikle imzalı rütbe testi t-testinden daha güçlü, fakat aynı zamanda işaret testinden daha güçlü olma eğilimindedir.

Örneğin, lojistik dağıtımda, işaretli rütbe testinin t-testine göre asimptotik nispi etkinliği 1.097'dir, bu nedenle işaretli rütbe testi t'den (en azından daha büyük örneklerde) daha güçlü olmalı, ancak asimptotik nispi verim t-testine göre işaret testinin 0.822'sidir, bu nedenle işaret testi t'den daha az güçlü olacaktır (yine en azından daha büyük örneklerde).

Daha ağır kuyruklu dağılımlara geçtiğimizde (aşırı peaky olanlardan kaçınırken), t nispeten daha kötü performans göstermeye eğilimliyken, işaret testi biraz iyileşmelidir ve hem işaret hem de işaretli sıralama, küçük tespitlerde t'den daha iyi performans gösterecektir. önemli marjlara göre etkiler (yani bir efekti tespit etmek için çok daha küçük numune boyutları gerektirir). İmzalı seviye testinin üçün en iyisi olduğu geniş bir dağıtım sınıfı olacaktır.

t3tδ

t için güç eğrilerinin grafiğini çizen Wilcoxon, t3 için n = 100 ve% 5 anlamlılık düzeyinde rütbe ve işaret testleri imzaladı

Grafikte gördüğümüz gibi, imzalı sıralama testi işaret testinden daha fazla güce sahiptir ve bu da t testinden daha fazla güce sahiptir.


Bunun için çok teşekkürler @Glen_b! Halen müfredatımızda nereye oturduğunu, güç kavramının bile çalışmalarının kapsamı dışında olduğu öğrencilerimiz olduğunda ve neden Wilcoxon'a eşleştirilmiş t'ye ana alternatif olarak öğrettiğimizi çözmek için uğraşıyorum. Ancak bu bazı yararlı motivasyonlar sağlar. Teşekkür ederim!
justme

Bu arada, hangi dağılımsal özelliğin medyanın asimptotik varyansını (ve dolayısıyla işaret testinin gücü) etkilediğini düşündükten sonra, t ve işaret testinin göreli konumlarının tersine çevrildiği bir örnek oluştu; Sonuç olarak, imzalı rütbe testinin diğer iki testten herhangi birinden önemli ölçüde daha iyi olabileceği bir vaka oluşturmak için iyi bir olasılık olduğunu düşünüyorum. Yapabileceğim ve üzerine bir şeyler yazabileceğim zaman onunla biraz daha oynayacağım.
Glen_b-Monica

Müfredatınız söz konusu olduğunda, imzalı rütbenin diğer iki testten daha iyi performans gösterdiği durumlar olduğu açıktır (cevaplarımda özetlediğim gibi - normalden biraz daha ağır olan, ancak özellikle zirve yapılmayan dağılımlar); t normalde veya daha hafifte daha iyidir ve dağılım testi güçlü bir zirveye sahip olduğunda (genellikle çok ağır kuyruklarla birlikte gitme eğilimi gösterir, ancak zorunlu değildir) işaret testi daha iyidir. [Bununla birlikte, bu fikirleri göreceli özelliklerini değiştirmeyen sadece yayılmış değişikliklerle karıştırmayın.] ... Eminim ki bu tür birkaç cümleyi
sıkabilirsiniz

Çok teşekkürler @Glen_b! Sorun şu ki, ders programını öğretmiyorum, sadece destekliyorum! Çoğu bölümdeki ders programı şöyledir: (i) normallik hipotez testi kullanmak (şimdi öldür beni) ve buna dayanarak (ii) Wilcoxon veya t-Test kullanmak. Dolayısıyla, dağıtımın omuzlarının daha ince detaylarına asla dokunulmaz, hatta iktidar, sadece varsayımların karşılanıp karşılanmadığı (biraz saçma bir şekilde). Ama düşüncelerin benim için kişisel olarak çok yardımcı oluyor, en azından!
justme

Büyük mesaj @Glen_b! İki test arasından seçim yapmak için, önce her zaman gücü hesaplamamız gerektiği sonucuna varabilir miyim? Fark dağılımı normal değilse, her zaman İşaret Testi kullanan varsayımı takip etmek yerine? Teşekkürler!
Lumos
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.