Korelasyon katsayısı genellikle büyük harfi ile yazılır ancak bazen yazılmaz . Acaba r arasında gerçekten bir fark var mı ve R 2? R , korelasyon katsayısından başka bir şey ifadeedebilirmi?
Korelasyon katsayısı genellikle büyük harfi ile yazılır ancak bazen yazılmaz . Acaba r arasında gerçekten bir fark var mı ve R 2? R , korelasyon katsayısından başka bir şey ifadeedebilirmi?
Yanıtlar:
Bu konudaki notasyon biraz değişiyor gibi görünüyor.
çoklu korelasyon bağlamında kullanılır ve "çoklu korelasyon katsayısı" olarak adlandırılır. Bu yüzden, gözlenen yanıtları arasında bir ilişki vardır , Y ve Y, modele göre monte edilmiştir. Y, genellikle birkaç belirleyici değişkenlerin tahmin edilir x ı , örneğin, Y = β 0 + β 1 x 1 + β 2 x 2 kesişme ve eğim katsayıları p i verilerden tahmin edilmiştir. Unutmayın 0 .
sembolü , iki değişkenli durumda kullanılan "örnek korelasyon katsayısı" dır - yani X ve Y olmak üzere iki değişken vardır - ve genellikle numunenizde X ve Y arasındaki korelasyon anlamına gelir . Sen korelasyon ilişkin bir tahmin olarak bu tedavi edebilir p'ye geniş popülasyonda iki değişken arasındaki. İki değişkeni ilişkilendirmek için hangisinin yordayıcı ve hangisinin yanıt olduğunu tanımlamak gerekli değildir. Gerçekten de, Y ve X arasındaki korelasyonu bulursanız, X ve arasındaki korelasyon ile aynı olurdu . Dikkat - 1 ≤ r, çünkü korelasyonsimetriktirr sembolübu şekilde kullanıldığında, r < iki değişken (bir yukarı giderse, diğer inmek eğilimindedir) bir doğrusal azalan bir ilişki varsa (negatif korelasyon).
Gösterimin tutarsız hale geldiği yerde ve Y olmak üzere iki değişken olduğunda ve basit bir doğrusal regresyon gerçekleştirilir. Bir değişken, tanımlama Bu demektir ki , Y , yanıt değişkeni olarak, ve diğer X tahmin değişkeni olarak, ve modelin yerleştirilmesi Y = β 0 + β 1 x . Bazı insanlar da sembol kullanmak r arasındaki korelasyonu gösteren Y ve Y başkalarının yazma (çoklu regresyon ile tutarlılık için) R. Gözlemlenen ve yerleştirilen yanıtlar arasındaki korelasyonun mutlaka sıfırdan büyük veya ona eşit olduğuna dikkat edin. Bu benim sembol kullanımı sevmiyorum bir nedeni bu durumda: arasındaki korelasyon X ve Y arasındaki korelasyon ise negatif olabilir Y ve Y pozitiftir (aslında basitçe modülü olacak X ve Y arasındaki korelasyon ) yine de her ikisi de r sembolüyle yazılabilir . Bazı ders kitapları ve Wikipedia makaleleri gördüm, r'nin iki anlamı arasında neredeyse birbirinin yerine geçiyor ve gereksiz yere kafa karıştırıcı buldum. R sembolünü kullanmayı tercih ederimarasındaki korelasyon için ve Y tekli ve çoklu regresyon.
Basit ve çoklu regresyon her ikisinde de, daha sonra çok uzun modelde yerleştirilmiş bir kesişme terimi olmadığı için, arasındaki Y ve Y belirlenmesi katsayısının kare kökü basitçe R 2 (genellikle "varyans oranı açıklandığı" ya da benzer). Basit doğrusal regresyonu durumunda özel olarak ise, daha sonra yazıyorum burada arasındaki korelasyon , X ve Y , ve R ' 2 regresyon belirlenmesi katsayısı veya korelasyon kare arasında ya da temsil edebilir ve Y, . Yana - 1 ≤ r ≤ 1 ve 0 ≤ R ≤ 1 , bu araçlarının R = | r | . Bu nedenle, örneğin, arasında bir korelasyon elde eğer X ve Y ve r = - 0.7 tekrarlar arasında korelasyonu Y ve takılmış Y regresyon doğrusal basit gelen Y = β 0 + β 1 Xolacaktır ve kararlılık katsayısı olacaktır R 2 = 0.49 neredeyse yarısı yanıt olarak varyasyon modeline göre, yani izah edilebilir.
Bir kesişme terimi modele dahil edilmiş ise, o sembolü belirsizdir. Genellikle belirleme katsayısı olarak düşünülür, ancak bu genellikle normalden farklı bir şekilde hesaplanır , bu nedenle istatistiksel yazılımınızdan çıktıları okurken dikkatli olun. O zaman artık çoklu korelasyon R'nin karesi ile aynı değildir veya iki değişkenli durumda r 2'ye eşit olmaz !