Ortalama korelasyon katsayısının önemi


11

Feragatname: Bu sorunun başka bir soruya çok benzediğini düşünüyorsanız, birleştirilmesinden memnun olurum. Ancak, başka bir yerde tatmin edici bir cevap bulamadım (ve henüz yorum veya upvote için "itibar" yok), bu yüzden kendim yeni bir soru sormak en iyi olacağını düşündüm.

Sorum şu. 12 insan deneğin her biri için, bağımsız bir X değişkeninin 6 seviyesi ile bağımlı bir değişken Y'nin karşılık gelen gözlemleri arasında bir korelasyon katsayısı (Spearman'ın rho) hesapladım. (Not: X seviyeleri, denekler arasında eşit değildir.) sıfır hipotezi, genel popülasyonda bu korelasyonun sıfıra eşit olmasıdır. Bu hipotezi iki şekilde test ettim:

  1. 12 denekten elde edilen korelasyon katsayıları üzerinde tek örnekli t testi kullanıldı.

  2. X seviyelerimi ve Y gözlemlerini ortalayarak her katılımcı için ortalama (X) = 0 ve ortalama (Y) = 0 olduğunu ve daha sonra toplam veriler üzerinde bir korelasyon hesaplayarak (72 X seviyesi ve Y 72 gözlemi) .

Şimdi, korelasyon katsayılarıyla (burada ve başka yerlerde) çalışma hakkında okumadan ilk yaklaşımın geçerli olup olmadığından şüphe etmeye başladım. Özellikle, birkaç yerde aşağıdaki denklemin ortaya çıktığını gördüm, (görünüşte) ortalama korelasyon katsayıları için bir t testi olarak sundum:

t=rSEr=n21r2

burada ortalama korelasyon katsayısı olacaktır (ve bunu ilk önce Fisher'in konu başına katsayılar üzerindeki dönüşümünü kullanarak elde ettiğimizi varsayalım) ve n gözlem sayısı. Sezgisel olarak, özne arasında değişkenliğin herhangi bir ölçüsünü içermediğinden bu benim için yanlış görünüyor. Diğer bir deyişle, 3 korelasyon katsayısına sahip olsaydım, [0.1, 0.5, 0.9] veya [0.45 0.5 0.55] ya da aynı ortalamaya sahip herhangi bir değer aralığı (ve n = 3 ) olsun, aynı t istatistiğine sahip olurdum.rnn=3

Dolayısıyla, yukarıdaki denklemin aslında ortalama bir korelasyon katsayısının önemini test ederken değil , 2 değişkenin gözlemine dayanan tek bir korelasyon katsayısının önemini test ederken geçerli olmadığından şüpheleniyorum .n

Buradaki herhangi biri lütfen bu sezgiyi onaylayabilir veya neden yanlış olduğunu açıklayabilir mi? Ayrıca, bu formül benim durumum için geçerli değilse, doğru bir yaklaşım bilen var mı? Ya da kendi test numaram 2 zaten geçerli mi? Herhangi bir yardım büyük takdir (kaçırmış veya yanlış yorum olabilir önceki cevaplar için işaretçiler dahil).


2
Pearson , merkezleme ve ölçekleme dönüşümlerine duyarsızdır, bu yüzden merkezlemenin sorunuzla alakasız olduğunu düşünüyorum. Örneğin, kor ( X , Y ) = kor ( X , Y - ˉ Y ) = kor ( X , Y + 1000 ) = kor ( X , Y × 1000 ). rX,YX,YY¯X,Y+1000X,Y×1000
Alexis

Size katılıyorum. Bu yüzden merkezlemeyi "her değişkeni bir araya getirmeden önce ayrı ayrı merkezleme" olarak yorumladım.
Federico Tedeschi

1
@FedericoTedeschi anlamı "değişkenleri bir araya getirmeden önce ayrı ayrı ortalamak" değildir ? YY¯
Alexis

@Alexis Cevabımın alt kısmında size cevap verdim (bir yorumda yazmak çok uzun olurdu ve ayrıca WYSINWYG sorunu nedeniyle birkaç kez düzeltmek zorunda kaldım).
Federico Tedeschi

Yanıtlar:


2

Bu verileri analiz etmek için daha iyi bir yaklaşım , rastgele bir etki (rastgele kesişme veya rastgele kesişme + eğim) olarak karışık bir (karışık efektler modeli, hiyerarşik model subject) kullanmaktır. Farklı bir cevabımı özetlemek gerekirse :

Bu aslında tek bir genel ilişkiyi modelleyen ve bu ilişkinin gruplar arasında (insan denekler) farklı olmasına izin veren bir gerilemedir. Bu yaklaşım kısmi havuzlamadan yararlanır ve verilerinizi daha verimli kullanır.


-1

değişkenin ( 6 X ve 6 Y ) tüm bireyler için aynı olduğunu varsayıyorum (aslında seviyelerin konular arasında eşit olmadığını söyleyerek ne demek istediğinizi anladığımdan emin değilim: Umarım her bir birey için hangi değişkenlerin ölçüldüğü hakkında değil, değişkenlerin aralıkları arasındaki bağımsızlığa atıfta bulunarak). Evet, gösterdiğiniz formül iki değişken arasındaki korelasyon katsayısı için geçerlidir.126 X6 Y

62

6t10

XiYi

12XY

X1,,X6Y1,,Y6X1=X1X1¯,,X6=X6X6¯,Y1=Y1Y1¯,,Y6=Y6Y6¯SEXYXi,1i6Yi0X,YXi,1i6YiXY

DÜZENLEME 01/01/18

ij1j12

X1j=Y1j=10,j

X2j=Y2j=8,j

X3j=Y3j=6,j

X4j=Y4j=4,j

X5j=Y5j=2,j

X6j=Y6j=j,j

0.5428

1i5XiYiXij=Yij=0i=6X6j=j6.5,Yj6=(13j)6.5=6.5jX5.5,4.5,3.5,2.5,1.5,0.5,0.5,1.5,2.5,3.5,4.5,5.5Y0=0j6.5=(6.5j)Xij=Yiji,jX=Y1


cor(Xi,Yi)=cor(Xi,Yi),icor(X,Y)=cor(X,Y)genellikle doğru değildir. Bir karşı örnek göstermek için yayınımı düzenliyorum.
Federico Tedeschi

0.5428X=10,10,10,10,10,10,10,10,10,10,10,10,8,8,8,8,8,8,8,8,8,8,8,8,6,6,6,6,6,6,6,6,6,6,6,6,4,4,4,4,4,4,4,4,4,4,4,4,2,2,2,2,2,2,2,2,2,2,2,2,1,2,3,4,5,6,7,8,9,10,11,12Y=10,10,10,10,10,10,10,10,10,10,10,8,8,8,8,8,8,8,8,8,8,8,8,6,6,6,6,6,6,6,6,6,6,6,6,4,4,4,4,4,4,4,4,4,4,4,4,2,2,2,2,2,2,2,2,2,2,2,2,12,11,10,9,8,7,6,5,4,3,2,10.54281

X=0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,5.5,4.5,3.5,2.5,1.5,0.5,0.5,1.5,2.5,3.5,4.5,5.5X=0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,5.5,4.5,3.5,2.5,1.5,0.5,0.5,1.5,2.5,3.5,4.5,5.51X=1,,12Y=12,,1cor(X,Y)=cor(X,Y)=1cor(Xi,Yi)=cor(Xi,Yi)

cor(X;Y)=cor(XX¯;YY¯)

XX¯X1X¯,X2X¯,,XnX¯
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.