Arasında herhangi bir fark var

Korelasyon katsayısı genellikle büyük harfi ile yazılır ancak bazen yazılmaz . Acaba arasında gerçekten bir fark var mı $R$ ve? , korelasyon katsayısından başka bir şey ifadeedebilirmi? $r^2$ $R^2$ $r$

correlation terminology r-squared

— DJack
kaynak

Bu sorunun önemsenmediğine şaşırdım - açık ve iyi tanımlanmış ve terminolojinin tutarsız şekillerde kullanıldığı bir konuyu kapsıyor. Daha da kötüsü, büyük / küçük harfe duyarlı olduğu için açıklığa kavuşturulması zor bir konu! Kenara olmasından

biz, engellememeli terimler olmadan modelleri göz önüne aldığımızda iki oldukça farklı şeyler için kullanılabilir, durum daha da kötü hale gelir

, kararlılık katsayısı, hatta karesi aynı değildir

. İnsanların notasyonu kafa karıştırıcı bulabileceği sürpriz bir şapka değil.

r

$r$

R^{2}

$R^2$

R

$R$

— Silverfish

Bu konudaki notasyon biraz değişiyor gibi görünüyor.

çoklu korelasyon bağlamında kullanılır ve "çoklu korelasyon katsayısı" olarak adlandırılır. Bu yüzden, gözlenen yanıtları arasında bir ilişki vardır ve modele göre monte edilmiştir. genellikle birkaç belirleyici değişkenlerin tahmin edilir , örneğin, kesişme ve eğim katsayıları verilerden tahmin edilmiştir. Unutmayın $R$ $Y$ $\hat Y$ $\hat Y$ $X_i$ $\hat Y = \hat \beta_0 + \hat \beta_1 X_1 + \hat \beta_2 X_2$ $\hat \beta_i$ . $0 \leq R \leq 1$

sembolü , iki değişkenli durumda kullanılan "örnek korelasyon katsayısı" dır - yani ve olmak üzere iki değişken vardır - ve genellikle numunenizde ve arasındaki korelasyon anlamına gelir . Sen korelasyon ilişkin bir tahmin olarak bu tedavi edebilir geniş popülasyonda iki değişken arasındaki. İki değişkeni ilişkilendirmek için hangisinin yordayıcı ve hangisinin yanıt olduğunu tanımlamak gerekli değildir. Gerçekten de, ve arasındaki korelasyonu bulursanız, ve arasındaki korelasyon ile aynı olurdu . Dikkat $r$ $X$ $Y$ $X$ $Y$ $\rho$ $Y$ $X$ $X$ , çünkü korelasyonsimetriktir $Y$ sembolübu şekilde kullanıldığında, $-1 \leq r \leq 1$ $r$ iki değişken (bir yukarı giderse, diğer inmek eğilimindedir) bir doğrusal azalan bir ilişki varsa (negatif korelasyon). $r < 0$

Gösterimin tutarsız hale geldiği yerde ve olmak üzere iki değişken olduğunda ve basit bir doğrusal regresyon gerçekleştirilir. Bir değişken, tanımlama Bu demektir ki , yanıt değişkeni olarak, ve diğer tahmin değişkeni olarak, ve modelin yerleştirilmesi . Bazı insanlar da sembol kullanmak arasındaki korelasyonu gösteren ve başkalarının yazma (çoklu regresyon ile tutarlılık için) $X$ $Y$ $Y$ $X$ $\hat Y = \hat \beta_0 + \hat \beta_1 X$ $r$ $Y$ $\hat Y$ $R$ . Gözlemlenen ve yerleştirilen yanıtlar arasındaki korelasyonun mutlaka sıfırdan büyük veya ona eşit olduğuna dikkat edin. Bu benim sembol kullanımı sevmiyorum bir nedeni bu durumda: arasındaki korelasyon ve arasındaki korelasyon ise negatif olabilir ve pozitiftir (aslında basitçe modülü olacak ve arasındaki korelasyon ) yine de her ikisi de sembolüyle yazılabilir . Bazı ders kitapları ve Wikipedia makaleleri gördüm, iki anlamı arasında neredeyse birbirinin yerine ve gereksiz yere kafa karıştırıcı buldum. sembolünü kullanmayı tercih ederim $r$ $X$ $Y$ $Y$ $\hat Y$ $X$ $Y$ $r$ $r$ $R$ arasındaki korelasyon için ve $Y$ $\hat Y$ tekli ve çoklu regresyon.

Basit ve çoklu regresyon her ikisinde de, daha sonra çok uzun modelde yerleştirilmiş bir kesişme terimi olmadığı için, arasındaki ve belirlenmesi katsayısının kare kökü basitçe $R$ $Y$ $\hat Y$ $R^2$ (genellikle "varyans oranı açıklandığı" ya da benzer). Basit doğrusal regresyonu durumunda özel olarak ise, daha sonra $R^2 = r^2$ yazıyorum burada arasındaki korelasyon ve , ve $r$ $X$ $Y$ $R^2$ regresyon belirlenmesi katsayısı veya korelasyon kare arasında ya da temsil edebilir ve . Yana ve , bu araçlarının. Bu nedenle, örneğin, arasında bir korelasyon elde eğer ve ve tekrarlar arasında korelasyonu ve takılmış regresyon doğrusal basit gelen $Y$ $\hat Y$ $-1 \leq r \leq 1$ $0 \leq R \leq 1$ $R = |r|$ $X$ $Y$ $r=-0.7$ $Y$ $\hat Y$ $Y = \hat \beta_0 + \hat \beta_1 X$ olacaktır ve kararlılık katsayısı olacaktır neredeyse yarısı yanıt olarak varyasyon modeline göre, yani izah edilebilir. $R = 0.7$ $R^2 = 0.49$

Bir kesişme terimi modele dahil edilmiş ise, o sembolü belirsizdir. Genellikle belirleme katsayısı olarak düşünülür, ancak bu genellikle normalden farklı bir şekilde hesaplanır , bu nedenle istatistiksel yazılımınızdan çıktıları okurken dikkatli olun. O zaman artık çoklu korelasyon karesi ile aynı değildir veya iki değişkenli durumda eşit olmaz ! $R^2$ $R$ $r^2$

— Gümüş Balık
kaynak