Spearman's ile Pearson r. Arasında ne zaman seçileceğini nasıl bilebilirim ? Değişkenim memnuniyet içerir ve puanlar toplamı kullanılarak yorumlanır. Ancak, bu puanlar da sıralanabilir.
Spearman's ile Pearson r. Arasında ne zaman seçileceğini nasıl bilebilirim ? Değişkenim memnuniyet içerir ve puanlar toplamı kullanılarak yorumlanır. Ancak, bu puanlar da sıralanabilir.
Yanıtlar:
Verilerinizi keşfetmek istiyorsanız, her ikisini de hesaplamak en iyisidir, çünkü Spearman (S) ve Pearson (P) korelasyonları arasındaki ilişki biraz bilgi verecektir. Kısaca, S rütbelerde hesaplanır ve dolayısıyla monotonik ilişkileri gösterirken, P gerçek değerlerdedir ve doğrusal ilişkileri gösterir.
Örnek olarak, ayarlarsanız:
x=(1:100);
y=exp(x); % then,
corr(x,y,'type','Spearman'); % will equal 1, and
corr(x,y,'type','Pearson'); % will be about equal to 0.25
Bunun nedeni, x ile monoton olarak artmasıdır , dolayısıyla Spearman korelasyonu mükemmeldir, fakat doğrusal değildir, bu nedenle Pearson korelasyonu kusurludur.
corr(x,log(y),'type','Pearson'); % will equal 1
Her ikisini de yapmak ilginç çünkü S> P'niz varsa, bu monotonik fakat doğrusal olmayan bir korelasyonunuz olduğu anlamına gelir. İstatistiklerde doğrusallığa sahip olmanın iyi olması nedeniyle (daha kolaydır) bir dönüşüm uygulayabilirsiniz (böyle bir günlük).
Umarım bu, korelasyon türleri arasındaki farkları daha kolay anlaşılmasında yardımcı olur.
En kısa ve çoğunlukla doğru cevap:
Pearson kriterleri doğrusal ilişki, Spearman kıyaslamaları monotonik ilişkiyi (birkaç sonsuzluk daha genel bir durumdur, ancak bazı güç kesintileri için) karşılaştırır.
Bu genellikle istatistiklerde olur: sizin durumunuza uygulanabilecek çeşitli yöntemler vardır ve hangisini seçeceğinizi bilmiyorsunuz. Kararınızı, incelenen yöntemlerin artılarını ve eksilerini ve probleminizin özelliklerini temel almalısınız, ancak o zaman bile karar genellikle üzerinde anlaşılan "doğru" bir cevap olmadan özneldir. Genellikle makul göründüğü kadar çok yöntem denemek iyi bir fikirdir ve sabrınız izin verir ve hangilerinin size en iyi sonuçları verdiğini görür.
Pearson korelasyonu ile Spearman korelasyonu arasındaki fark, Pearson'un bir aralık ölçeğinden alınan ölçümler için en uygun olduğu ve Spearman'ın, sıradan alınan ölçümler için daha uygun ölçeklerden . Aralıklı ölçeklerin örnekleri arasında, "Farenheit'teki sıcaklık" ve "inç cinsinden uzunluk" ifadesi yer almaktadır, ki burada ayrı ayrı birimler (1 ° F, 1 inç) anlamlıdır. “Memnuniyet puanları” gibi şeyler sıralı tipe eğilimlidir, çünkü “5 mutluluğun” “3 mutluluktan” daha mutlu olduğu, “1 mutluluğun” anlamlı bir yorumunu yapıp yapamayacağınız açık değildir. Ama ne zaman eklersin Ordinal tipteki birçok ölçüm, sizin durumunuzda ne var, ne gerçekten ne sıra ne de aralıklı olan ve yorumlanması zor olan bir ölçümle bitirdiniz.
Memnuniyet puanlarınızı nicel puanlara dönüştürmenizi ve daha sonra bunların toplamlarıyla çalışmanızı tavsiye ederim , çünkü bu size yorumlamaya biraz daha elverişli veri sağlayacaktır. Ancak bu durumda bile Pearson veya Spearman'ın daha uygun olup olmadığı açık değildir.
Bugün ilginç bir köşe davası açtım.
Çok az sayıda örneğe bakıyorsak, Spearman ve Pearson arasındaki fark çarpıcı olabilir.
Aşağıdaki durumda, iki yöntem tam tersi bir korelasyon bildirmektedir .
Spearman ve Pearson'a karar vermek için bazı hızlı kurallar:
ps Yukarıdaki grafiği yeniden oluşturacak R kodu:
# Script that shows that in some corner cases, the reported correlation for spearman can be
# exactly opposite to that for pearson. In this case, spearman is +0.4 and pearson is -0.4.
y = c(+2.5,-0.5, -0.8, -1)
x = c(+0.2,-3, -2.5,+0.6)
plot(y ~ x,xlim=c(-6,+6),ylim=c(-1,+2.5))
title("Correlation: corner case for Spearman vs. Pearson\nNote that they are exactly opposite each other (-0.4 vs. +0.4)")
abline(v=0)
abline(h=0)
lm1=lm(y ~ x)
abline(lm1,col="red")
spearman = cor(y,x,method="spearman")
pearson = cor(y,x,method="pearson")
legend("topleft",
c("Red line: regression.",
sprintf("Spearman: %.5f",spearman),
sprintf("Pearson: +%.5f",pearson)
))
Charles cevabını kabul ederken, hem katsayıları hesaplamanızı hem de farklılıklara bakmanızı öneririm. Çoğu durumda, tamamen aynı olacaktır, bu yüzden endişelenmenize gerek yoktur.
Ancak, eğer farklılarsa o zaman, Pearsons (sabit varyans ve doğrusallık) varsayımlarına uyup uymadığına bakmanız gerekir ve bunlar karşılanmazsa, muhtemelen Spearman kullanmaktan daha iyi olursunuz.