Kendall Tau veya Spearman's rho?


69

Hangi durumlarda biri diğerini tercih etmeli?

Pedagojik nedenlerden dolayı Kendall için bir avantaj talep eden birini buldum , başka sebepler var mı?


Ayrıca ilgili bir soruya bakınız . Stat.stackexchange.com/q/18112/3277 .
ttnphns

1
Maalesef, sorunuzdaki bağlantı öldü. Sanırım Noether'den bahsediyorsunuz (2007, Öğretim İstatistikleri ) . Düzenlemek ister misiniz?
S. Kolassa - Monica'yı

Yanıtlar:


40

Spearman korelasyonunun, bir ölçüm ölçeğinde tam sayı değerli puanlarla çalışırken, orta dereceli olası puanlara sahip olduğunda veya iki değişkenli ilişkiler hakkındaki varsayımlara güvenmek istemediğimiz zaman, olağan lineer korelasyon yerine çoğunlukla kullanıldığını buldum. . Pearson katsayısı ile karşılaştırıldığında, Kendall'ın tau yorumlaması bana tüm olası çiftli olaylar arasındaki uyumsuz ve uyumsuz çiftlerin yüzdesi arasındaki farkı ölçmesi anlamında, Spearman'ın rho'sundan daha az doğrudan görünüyor. Anladığım kadarıyla Kendall'ın tau, Goodman-Kruskal Gamma'ya daha çok benziyor .

Sadece J. İstatistik Eğitiminde Larry Winner'dan bir makaleye göz attım. Her iki önlemin de kullanımını tartışan (2006), 1975-2003 dönemine ait NASCAR Winston Kupası Yarışı Sonuçları .

Ayrıca Pearson'un veya Spearman'ın bu konuda ilginç olmayan normal olmayan verilerle korelasyonuyla ilgili @onestop cevabını buldum .

Dikkat çekici bir şekilde, Kendall tau ( bir versiyonu) Somers bağlantısı bulunur prediktif modelleme için kullanılan D (ve Harrell'in C) (bakınız örneğin, dört basit modeller altında D Somers yorumlanması RB Newson ve referans ile 6 içinde ve newson'ın eşyalar 2006 Stata Journal'da yayımlandı). Rütbe toplamı testlerine genel bir bakış , JSS'de (2006) yayınlanan, Rütbe İstatistikleri İçin Jackknife Güven Aralıklarının Verimli Hesaplamasında verilmiştir .


Cevabınız için teşekkürler chl, tam kapsamı için kabul ettim. En iyi, Tal
Tal Galili 31:10

İki tamsayı değişkeninde kullanılan Spearman, Kendall'ın tau tarafından daha iyi ele alındığı sanılan bağları düzenli olarak karşılaştırır.
vinnief

29

Kendall ve Gibbons'a (1990) göre şerefli beyefendiye önceki cevabımdan bahsettim : "... Spearman's r S için güven aralıkları daha az güvenilir ve daha az yorumlanabilir"


1
Sanırım, teşekkürler, makalesinden alıntı yaptığım gibi, Roger Newson'a bağlı.
52’de

22

Yine biraz felsefi cevap; temel fark, Spearman’ın Rho’sunun, R 2 'yi (= "varyans açıklandı") fikrini lineer olmayan etkileşimler üzerine genişletme çabasıdır, Kendall’ın Tau ise doğrusal olmayan korelasyon testi için bir test istatistiği olmayı amaçlamaktadır. Bu nedenle, Tau, doğrusal olmayan korelasyonları test etmek için kullanılmalıdır, Rho, R uzantısı olarak (veya R ^ 2'ye aşina olan insanlar için - Tau'yu sınırlı bir zamanda izleyicileri göz ardı etmeden açıklamak).


6
Lütfen "doğrusal olmayan etkileşimleri" açıklar mısınız? Spearman Rho, psikometri açısından bir geçerlilik katsayısı ölçüsünü yansıtmaktadır. Tau'nun doğasını bilmiyorum.
Subhash C. Davar,

Yorumunuzun psikometri meselesini anlamıyorum.
Léo Léopold Hertz 준영

1
"doğrusal olmayan etkileşimler" çünkü önemli olan, doğrusal korelasyon değil sıralamanın olmasıdır. Örneğin, ve Pearson korelasyonu 0 olurken, Kendall tau veya Spearman's rho 1 puan alacak.xx2
Yohan Obadia

1
Bu yalnızca x negatif olmadığında geçerlidir.
saat

17

İşte Kendall savunan Andrew Gilpin (1993) bir alıntı t alınmak Spearman üzerinde p'ye teorik nedenlerle:

“[Kendall's ] , , örneklem büyüklüğü arttıkça daha hızlı normal bir dağılıma yaklaşıyor ve , özellikle bağlar mevcut olduğunda matematiksel olarak da daha izlenebilir.” τρNτ

Referans

Gilpin, AR (1993). Kendall'daki Tau'nun, meta-analiz için etkinin büyüklüğü bağlamında Spearman's Rho'ya dönüştürülmesi için tablo. Eğitim ve Psikolojik Ölçüm, 53 (1), 87-92.


3

FWIW, Myers & Well'den bir alıntı (araştırma tasarımı ve istatistiksel analizler, ikinci baskı, 2003, s. 510). Hala p değerlerini önemsiyorsanız;

Seigel ve Castellan (1988, davranış bilimleri parametrik olmayan istatistikler) rağmen, işaret ve Spearman aynı veri kümesi için hesaplanan zaman için anlamlılık testleri zaman genel olarak farklı değerlere sahip olacaktır ve Spearman dayanmaktadır örnekleme dağılımları aynı p -değerlerini vereceklerdir .τρτρ


Bu iddia için herhangi bir destek sağlayıp sağlamadıklarını biliyor musunuz? Genel olarak bunun nasıl doğru olabileceğini anlamıyorum (oldukça benzer olabilirler, ancak aynı olacağı iddiasının ne kadar dayanabileceğini gerçekten göremiyorum). [Siegel ve Castellan gerçekten tam olarak veya biraz farklı bir şey söyledi mi merak ediyorum.]
Glen_b

Siegel ve Castellan'ı kontrol ettim (2ed p253). Biraz farklı bir şey söylüyorlar ... ama aslında "yaklaşık" eklenmiş olsa bile, yukarıdaki paroladan biraz daha kötü (daha da kötüsü, boş değer altındaki durum için onu kısıtladıklarından, ancak verilerin üzerinde koşullandıkları için Bu, yardım etmeyecek. Yine de, sabit bir sırası için, tüm olası rütbe sıraları H0 altında eşit derecede muhtemeldir.) Verilerin konuyla ilgili şartlandırılmasından sonra sıfırın şartlandırılmasının bir endişe kaynağı olduğu gerçeğidir. Acaba başka bir şey mi söyleyecekler, yoksa gerçekten yanlış xy
anlarlar mı?

Bir örnek olarak, n = 7 ve kesin p değerleri alın. X = 1,2,3,4,5,6,7 ve y = 2,1,4,3,7,6,5 ... mızrakçı p = 0,048 verir, Kendall ise 0,366 verir ... hiç de değil. Farklı bir düzenleme kendall için aynı değeri verir ama mızrakçı p = 0.302 sahiptir. Bu tür birçok örnek ve çeşitli örneklem büyüklükleri var
Glen_b

3
İşte n = 8 durumu için bir komplo. Gördüğünüz gibi iki korelasyon ölçüsü için p-değerleri arasında çok fazla fark var: i.stack.imgur.com/5JMbj.png ... Bu konuda soru-cevap yazabilirim
Glen_b

1
İşte Spearman korelasyon p-değerlerinin aynı olduğu, ancak Kendall korelasyon p-değerlerinin oldukça farklı olduğu iki durumu (n = 9 ile bu sefer) gösteren iki örnek veri seti (sıralamadan sonra): i.stack.imgur. com / 3ILD8.png
Glen_b
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.