Korelasyon katsayısı formülü nasıl anlaşılır?


15

Pearson korelasyon formülünü anlamama yardımcı olabilecek biri var mı? örnek = ve değişkenlerinin standart puanlarının ürünlerinin ortalaması .rXY

Neden ve standartlaştırmaları gerektiğini anlıyorum , ama her iki z skorunun ürünlerini nasıl anlayabilirim? YXY

Bu formüle "ürün-moment korelasyon katsayısı" da denir, ancak ürün eyleminin mantığı nedir? Sorumu açıklığa kavuşturabildiğimden emin değilim, ancak formülü sezgisel olarak hatırlamak istiyorum.


11
"Korelasyon Katsayısına Bakmanın On Üç Yolu" başlıklı makaleyi okumak isteyebilirsiniz (Rodgers ve Nicewander 1988). Başlıktan da anlaşılacağı gibi, korelasyon katsayısının on üç farklı sezgisel görüşü tartışılmaktadır. Yani umarım en az bir :) tıklama
yarı-pass


4
Korelasyonu anlamanın 14. yolu (z skorlarının ürünleri açısından) , stats.stackexchange.com/questions/18058/… ' da gösterildiği gibi standart değişkenlerin kovaryansını anlamaktır .
whuber

4
... Ve 15. yol, stats.stackexchange.com/a/46508/919 adresinde gösterilen çevreleri kullanır : en küçük kareler sığması, dairelerin toplam alanını en aza indirir (noktalar yapıldığında bunu yapmanın en az iki yolu vardır) tam olarak sıralanmayan) ve korelasyon katsayısı ortalama alanıdır (her iki değişken de standartlaştırıldığında).
whuber

Yanıtlar:


14

Yorumlarda, korelasyon katsayısını anlamanın 15 yolu önerilmiştir:


Rodgers ve Nicewander makalesinde tartışılan 13 yol (Amerikan İstatistikçisi, Şubat 1988)

  1. Ham Skor ve Araçların Bir Fonksiyonu,

    r=Σ(Xben-X¯)(Yben-Y¯)Σ(Xben-X¯)2(Yben-Y¯)2.
  2. Standart Kovaryans,

    r=sXY/(sXsY)

    burada örnek kovaryans ve s X ve s -Y numune standart sapmaları göstermektedir.sXYsXsY

  3. Regresyon Hattının Standartlaştırılmış Eğimi,

    r=bYXsXsY=bXYsYsX,

    burada ve b X Y regresyon çizgilerinin eğimleridir.bYXbXY

  4. İki Regresyon Eğiminin Geometrik Ortalaması,

    r=±bYXbXY.
  5. İki Varyans Oranının Karekökü (Hesaplanan Değişkenlik Oranı),

    r=(YiYi^)2(YiY¯)2=SSREGSSTOT=sY^sY.
  6. Standart Değişkenlerin Ortalama Çapraz Ürünü,

    r=zXzY/N.
  7. İki Standart Regresyon Çizgisi Arasındaki Açının Bir Fonksiyonu. İki regresyon çizgisi ( karşı X ve X'e karşı Y ) diyagonal etrafında simetriktir. İki çizgi arasındaki açının β olmasına izin verin . SonraYXXYβ

    r=sec(β)±tan(β).
  8. İki Değişken Vektör Arasındaki Açının Bir Fonksiyonu,

    r=cos(α).
  9. Standartlaştırılmış Puanlar Arasındaki Farkın Yeniden Ölçeklendirilmiş Bir Varyansı. İzin vermek standart arasındaki fark X ve Y, her bir gözlem için değişkenler,zYzXXY

    r=1s(zYzX)2/2=s(zY+zX)2/21.
  10. "Balon" Kuralından tahmin edilen,

    r1(h/H)2

    burada , X - Y dağılım grafiğinin tamamının dikey aralığıdır ve h , " X ekseni üzerindeki dağılımın merkezi " (yani, vasıta noktasından) aralığıdır .HXYhX

  11. İzokonsantrasyonun İki Değişkenli Elipsleri ile İlgili Olarak,

    r=D2d2D2+d2

    Ddr

  12. Tasarlanmış Deneylerden Test İstatistiklerinin Bir Fonksiyonu,

    r=tt2+n2

    ttX=0,1n

  13. XcX

    r=E(Y|X>Xc)E(X|X>Xc).

(Bunların çoğu kelimelemedir, bazı gösterimlerde çok küçük değişiklikler vardır.)

Diğer bazı yöntemler (belki de bu sitenin orijinali)

  • r

  • r


2
@Avraham, bu yanıtsız iş parçacığını buraya bir cevap göndererek kapatmaya çalıştığınız için teşekkür ederiz.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.