birkaç örnek çalıştırdığımda, rho için p değerleri ve her zaman eşleşen sıralamaların Pearson korelasyonunun t-testi için, son birkaç basamak için kaydedin
Peki yanlış örnekleri çalıştırıyorsunuz!
a = c(1,2,3,4,5,6,7,8,9)
b = c(1,2,3,4,5,6,7,8,90)
cor.test(a,b,method='pearson')
Pearson's product-moment correlation
data: a and b
t = 2.0528, df = 7, p-value = 0.0792
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.08621009 0.90762506
sample estimates:
cor
0.6130088
cor.test(a,b,method='spearman')
Spearman's rank correlation rho
data: a and b
S = 0, p-value = 5.511e-06
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
1
Vektörler a
ve b
iyi, ama mükemmel lineer (Pearson) korelasyondan uzak. Ancak, mükemmel sıra korelasyonu vardır. Bakınız - Spearman , bu durumda, son basamağı 8.1, 9, 90 veya 9000 ise (deneyin!) Önemli değil, sadece 8'den büyükse önemli . Sıralamaları ilişkilendiren bir fark budur. ρb
Tersine, a
ve b
mükemmel sıra korelasyonuna sahipken , Pearson korelasyon katsayıları 1'den küçüktür. Bu, Pearson korelasyonunun safları yansıtmadığını gösterir.
Pearson korelasyonu doğrusal bir fonksiyonu, sıra korelasyonunu sadece monoton bir fonksiyonu yansıtır. Normal veri durumunda, ikisi birbirine çok benzeyecektir ve bu yüzden verilerinizin Spearman ve Pearson arasında büyük farklılıklar göstermediğinden şüpheleniyorum.
Pratik bir örnek için aşağıdakileri göz önünde bulundurun; daha uzun insanların daha ağır olup olmadığını görmek istersiniz. Evet, bu aptalca bir soru ... ama umursadığın şey bu. Uzun boylu insanlar da küçük insanlardan daha geniş olduğu için, şimdi kütle ağırlıkla doğrusal olarak ölçeklenmez; yani ağırlık, yüksekliğin doğrusal bir fonksiyonu değildir . Senden% 10 daha uzun olan kişi (ortalama olarak)% 10'dan daha ağırdır. Vücut / kütle indeksinin küpü paydada kullanmasının nedeni budur.
Sonuç olarak, boy / kilo ilişkisini yanlış bir şekilde yansıtmak için doğrusal bir korelasyon olduğunu varsayarsınız. Buna karşılık, sıra korelasyonu bu durumda can sıkıcı fizik ve biyoloji yasalarına duyarsızdır; insanların yükseklik kazandıkça lineer olarak daha ağır büyüyüp büyümediklerini yansıtmaz, daha uzun insanların (bir ölçekte daha üst sıralarda) daha ağır (diğer ölçekte daha yüksek) olup olmadığını yansıtır.
Daha tipik bir örnek, "mükemmel / iyi / iyi / vasat / kötü / korkunç" gibi bir şeyi derecelendiren insanlar gibi Likert benzeri anket sıralaması olabilir. "mükemmel", "terbiyeli" ölçekte "kötü" den "terbiyeli" olmaktan uzak , ama gerçekten ikisi arasındaki mesafenin aynı olduğunu söyleyebilir miyiz? Doğrusal bir korelasyon mutlaka uygun değildir. Sıralama korelasyonu daha doğal.
Sorunuzu daha doğrudan ele almak için: hayır, Pearson ve Spearman korelasyonları için p değerleri farklı hesaplanmamalıdır . İkisi hakkında, kavramsal olarak ve sayısal olarak çok farklıdır, ancak test istatistiği eşdeğerse, p değeri eşdeğer olacaktır.
Pearson korelasyon içinde normallik varsayımı konusunda, bkz bu .
Daha genel olarak, diğer insanlar parametrik ve parametrik olmayan korelasyonlar konusuna ( buraya da bakınız ) ve bunun dağıtım varsayımları için ne anlama geldiğine ilişkin elimden çok daha iyi ayrıntılar vermişlerdir.