Korelasyon olan standart yani kovaryans kovaryans, ve standart sapması bölünmesiyle ve . Bunu açıklayayım.xyxy
Özetle, istatistikler verilere modelleri uydurma ve modelin bu veri noktalarını ne kadar iyi tanımladığını değerlendirme olarak özetlenebilir ( Sonuç = Model + Hata ). Bunu yapmanın bir yolu, modeldeki sapmaların veya kalıntıların (res) toplamını hesaplamaktır:
r e s = ∑ ( xben- x¯)
Birçok istatistiksel hesaplama buna dayanmaktadır. korelasyon katsayısı (aşağıya bakınız).
Burada yapılan bir örnek veri kümesi R
(artıklar kırmızı çizgilerle ve değerleri yanlarına eklenmiştir):
X <- c(8,9,10,13,15)
Y <- c(5,4,4,6,8)
Her veri noktasına ayrı ayrı bakarak ve değerini modelden çıkararak (örneğin ortalama; bu durumda X=11
ve Y=5.4
), bir modelin doğruluğunu değerlendirebilir. Modelin gerçek değeri abarttığını / hafife aldığını söyleyebiliriz. Ancak, modeldeki tüm sapmaları toplarken , toplam hata sıfır olma eğilimindedir , pozitif değerler (model belirli bir veri noktasını hafife alır) ve negatif değerler (model belirli bir veriyi fazla tahmin eder) değerler birbirini iptal eder nokta). Bu sorunu çözmek için sapmaların toplamı karedir ve şimdi karelerin toplamı ( ) olarak adlandırılmaktadır:SS
SS= ∑ ( xben- x¯) ( xben- x¯) = ∑ ( xben- x¯)2
Karelerin toplamı, modelden sapmanın bir ölçüsüdür (yani, ortalama veya herhangi bir uygun çizginin belirli bir veri kümesine). Gözlem sayısına bağlı olduğu için modelden sapmayı yorumlamak (ve diğer modellerle karşılaştırmak) için çok yararlı değildir. Daha fazla gözlem, karelerin toplamı artar. Bu, karenin toplamlarını bölerek halledilebilir . Ortaya çıkan örnek varyansı ( ), ortalama ve gözlemler arasındaki "ortalama hata" olur ve bu nedenle modelin verilere ne kadar iyi uyduğunun (yani temsil ettiği) bir ölçüsüdür:n - 1s2
s2= SSn - 1= ∑ ( xben- x¯) ( xben- x¯)n - 1= ∑ ( xben- x¯)2n - 1
Kolaylık için, örnek standart sapması olarak bilinen örnek varyansının kare kökü alınabilir:
s=s2−−√=SSn−1−−−√=∑(xi−x¯)2n−1−−−−−−−√
Şimdi, kovaryans iki değişkenin birbiriyle ilişkili olup olmadığını değerlendirmektedir. Pozitif bir değer, bir değişken ortalamadan saptıkça diğer değişkenin aynı yönde saptığını gösterir.
covx,y=∑(xi−x¯)(yi−y¯)n−1
Standartlaştırarak, Pearson korelasyon katsayısı olan birim standart sapma başına kovaryans ifade ederiz . Bu, değişkenlerin farklı birimlerle ölçülen birbirleriyle karşılaştırılmasını sağlar. Korelasyon katsayısı -1 (mükemmel bir negatif korelasyon) ile 0 (korelasyon yok) ve +1 (mükemmel bir pozitif korelasyon) arasında değişen bir ilişkinin gücünün bir ölçüsüdür.r
r=covx,ysxsy=∑(x1−x¯)(yi−y¯)(n−1)sxsy
Bu durumda, Pearson korelasyon katsayısı, güçlü bir korelasyon olarak kabul edilebilecek (bu, çalışma alanına bağlı olarak da göreceli olmasına rağmen). Bunu kontrol etmek için, burada x ekseninde ve y ekseninde başka bir çizim :r=0.87X
Y
Uzun hikaye kısa, evet duygu doğru ama umarım cevabım bir bağlam sağlayabilir.