Arasında herhangi bir fark var


22

Korelasyon katsayısı genellikle büyük harfi ile yazılır ancak bazen yazılmaz . Acaba r arasında gerçekten bir fark var mıR ve R 2? R , korelasyon katsayısından başka bir şey ifadeedebilirmi?r2R2r


8
Bu sorunun önemsenmediğine şaşırdım - açık ve iyi tanımlanmış ve terminolojinin tutarsız şekillerde kullanıldığı bir konuyu kapsıyor. Daha da kötüsü, büyük / küçük harfe duyarlı olduğu için açıklığa kavuşturulması zor bir konu! Kenara olmasından biz, engellememeli terimler olmadan modelleri göz önüne aldığımızda iki oldukça farklı şeyler için kullanılabilir, durum daha da kötü hale gelir R 2 , kararlılık katsayısı, hatta karesi aynı değildir Ar . İnsanların notasyonu kafa karıştırıcı bulabileceği sürpriz bir şapka değil. rR2R
Silverfish

Yanıtlar:


18

Bu konudaki notasyon biraz değişiyor gibi görünüyor.

çoklu korelasyon bağlamında kullanılır ve "çoklu korelasyon katsayısı" olarak adlandırılır. Bu yüzden, gözlenen yanıtları arasında bir ilişki vardır , Y ve Y, modele göre monte edilmiştir. Y, genellikle birkaç belirleyici değişkenlerin tahmin edilir x ı , örneğin, Y = β 0 + β 1 x 1 + β 2 x 2 kesişme ve eğim katsayıları p i verilerden tahmin edilmiştir. Unutmayın 0RYY^Y^XiY^=β^0+β^1X1+β^2X2β^i .0R1

sembolü , iki değişkenli durumda kullanılan "örnek korelasyon katsayısı" dır - yani X ve Y olmak üzere iki değişken vardır - ve genellikle numunenizde X ve Y arasındaki korelasyon anlamına gelir . Sen korelasyon ilişkin bir tahmin olarak bu tedavi edebilir p'ye geniş popülasyonda iki değişken arasındaki. İki değişkeni ilişkilendirmek için hangisinin yordayıcı ve hangisinin yanıt olduğunu tanımlamak gerekli değildir. Gerçekten de, Y ve X arasındaki korelasyonu bulursanız, X ve arasındaki korelasyon ile aynı olurdu . Dikkat - 1 rrXYXYρYXX, çünkü korelasyonsimetriktirYr sembolübu şekilde kullanıldığında, r <1r1r iki değişken (bir yukarı giderse, diğer inmek eğilimindedir) bir doğrusal azalan bir ilişki varsa (negatif korelasyon).r<0

Gösterimin tutarsız hale geldiği yerde ve Y olmak üzere iki değişken olduğunda ve basit bir doğrusal regresyon gerçekleştirilir. Bir değişken, tanımlama Bu demektir ki , Y , yanıt değişkeni olarak, ve diğer X tahmin değişkeni olarak, ve modelin yerleştirilmesi Y = β 0 + β 1 x . Bazı insanlar da sembol kullanmak r arasındaki korelasyonu gösteren Y ve Y başkalarının yazma (çoklu regresyon ile tutarlılık için) RXYYXY^=β^0+β^1XrYY^R. Gözlemlenen ve yerleştirilen yanıtlar arasındaki korelasyonun mutlaka sıfırdan büyük veya ona eşit olduğuna dikkat edin. Bu benim sembol kullanımı sevmiyorum bir nedeni bu durumda: arasındaki korelasyon X ve Y arasındaki korelasyon ise negatif olabilir Y ve Y pozitiftir (aslında basitçe modülü olacak X ve Y arasındaki korelasyon ) yine de her ikisi de r sembolüyle yazılabilir . Bazı ders kitapları ve Wikipedia makaleleri gördüm, r'nin iki anlamı arasında neredeyse birbirinin yerine geçiyor ve gereksiz yere kafa karıştırıcı buldum. R sembolünü kullanmayı tercih ederimrXYYY^XYrrRarasındaki korelasyon için ve YYY^ tekli ve çoklu regresyon.

Basit ve çoklu regresyon her ikisinde de, daha sonra çok uzun modelde yerleştirilmiş bir kesişme terimi olmadığı için, arasındaki Y ve Y belirlenmesi katsayısının kare kökü basitçe R 2RYY^R2 (genellikle "varyans oranı açıklandığı" ya da benzer). Basit doğrusal regresyonu durumunda özel olarak ise, daha sonra R2=r2 yazıyorum burada arasındaki korelasyon , X ve Y , ve R ' 2rXYR2 regresyon belirlenmesi katsayısı veya korelasyon kare arasında ya da temsil edebilir ve Y, . Yana - 1 r 1 ve 0 R 1 , bu araçlarının R = | r | . Bu nedenle, örneğin, arasında bir korelasyon elde eğer X ve Y ve r = - 0.7 tekrarlar arasında korelasyonu Y ve takılmış Y regresyon doğrusal basit gelen Y = β 0 + β 1 XYY^1r10R1R=|r|XYr=0.7YY^Y=β^0+β^1Xolacaktır ve kararlılık katsayısı olacaktır R 2 = 0.49 neredeyse yarısı yanıt olarak varyasyon modeline göre, yani izah edilebilir.R=0.7R2=0.49

Bir kesişme terimi modele dahil edilmiş ise, o sembolü belirsizdir. Genellikle belirleme katsayısı olarak düşünülür, ancak bu genellikle normalden farklı bir şekilde hesaplanır , bu nedenle istatistiksel yazılımınızdan çıktıları okurken dikkatli olun. O zaman artık çoklu korelasyon R'nin karesi ile aynı değildir veya iki değişkenli durumda r 2'ye eşit olmaz !R2Rr2

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.