Arasındaki ilişki


39

Diyelim İki 1 boyutlu diziler var ki ve . Her biri 100 veri noktası içerir. gerçek veri ve modeli tahminidir. Bu durumda, değeri şöyle olacaktır: Bu arada, bu korelasyon katsayısının kare değerine eşit olacaktır, : Şimdi iki takas eğer gerçek veri ve modeli tahmindir. Denklemden , korelasyon katsayısının hangisinin önce geldiği umrunda olmadığı için,a1a2a1a2R2

R2=1SSresSStot  (1).
R2=(Correlation Coefficient)2(2).
a2a1(2) ( 1 ) S S T O T = Σ i ( y ı - ˉ y ) 2 R, 2 S S T O T y bir 1 , bir 2 S S r E s = Σ i ( f i - ˉ y ) 2R2 değeri aynı olurdu. Ancak, denklem , , değeri, çünkü değişecektir biz geçmek durumunda değişti ile ilgili için ; bu arada, değişmez.(1)SStot=i(yiy¯)2R2SStotya1a2SSres=i(fiy¯)2

Sorum şu: Bunlar birbirleriyle nasıl çelişebilir?

Düzenle :

  1. Merak ediyorum, Eq. (2) basit bir doğrusal regresyon değilse, yani IV ve DV arasındaki ilişki lineer değilse, hala geçerli mi (üstel / log olabilir)?

  2. Tahmin hataları toplamı sıfıra eşit değilse, bu ilişki hala geçerli olacak mı?


Bu sunumu çok faydalı ve teknik olmayan buldum: google.com/…
ihadanny

Yanıtlar:


19

Bu, değişeceği doğrudur ... ama karelerin regresyon toplamının da değişeceği gerçeğini unuttun. Şimdi, basit regresyon modelini ele alalım gibi korelasyon katsayısı ile ifade , ben alt endeks kullanıldığı yerlerde için bağımsız değişken ve de bağımlı değişken olduğunu vurgulayın . Açıkça, eğer ile değiştirirseniz , değişmez . Kolayca ; burada , karelerin ve regresyonunun toplamıdır. r 2 x y = S 2 x ySStot xyxyr2 x y xySSRxy=Syy(R,2 x y )SSRxySyyxyR '2 x y =SSRxyrxy2=Sxy2SxxSyyxyxyrxy2xySSRxy=Syy(Rxy2)SSRxySyy bağımsız ve bağımlı değişken olduğu toplam karelerdir . Bu yüzden: olduğu karşılık gelen karelerin toplamı, burada , bağımsızdır ve , bağımlı değişkendir. Bu durumda, ile (Bkz. Örneğin Denk. (34) - ( 41) burada .) Bu nedenle:Açıkça yukarıda denklem göre simetrikxySSE

Rxy2=SSRxySyy=SyySSExySyy,
xySS D x y = b 2 x y S x x b= S x ySSExyxySSExy=bxy2Sxx R22 x y =Syy- S 2 x yb=SxySxxxyR2 x y
Rxy2=SyySxy2Sxx2.SxxSyy=SyySxxSxy2Sxx.Syy.
xve . Başka bir deyişle:Eğer değiştirmek özetlemek için ile , basit regresyon modelinde her iki pay ve payda şekilde değişeceğiniyx y R 2 x y = S S R x y
Rxy2=Ryx2.
xy R2 x y =R2 y x .Rxy2=SSRxySyyRxy2=Ryx2.

Çok teşekkür ederim! Bunun yanlış olduğum yerde olabileceğini fark ettim: sadece 1) model öngörüsü düz bir çizgi ise ve 2) model öngörüsünün ortalaması örnek puanların ortalamasına eşittir. DV ve IV arasındaki ilişki düz bir çizgi değilse veya tahmin hatalarının toplamı sıfır değilse, ilişki geçerli olmayacaktır. Lütfen bunun doğru olup olmadığını bildirir misiniz? R2=r2
Shawn Wang

1
Bunu düşündüm çünkü kullanıyordum, ben de OP'de yayınladığım denklemi kullanırken. Bu iki denklem, yalnızca tahmin hatalarının toplamı sıfır olduğunda birbirine eşdeğerdir. Dolayısıyla , değişirken değişmez ve dolayısıyla değişmiştir. R2=SSreg/SStotSSres=i(fiy¯)2SStotR2
Shawn Wang

P-değişkenli Gaussian'ların genel durumu için bunun nasıl çözüleceğine dair bir referansınız var mı?
jmb

26

belirleme katsayısını yorumlamanın bir yolu , ona gözlenen değerleri ile takılı değerler arasındaki Pearson Korelasyon Katsayısı olarak .R2yiy^i

R2 belirleme katsayısının, Squared Pearson Korelasyon Katsayısından, gözlenen değerler yi ve uygun değerler y ^ i arasında nasıl elde edildiğinin tam kanıtı aşağıdaki linkte bulunabilir:

http://economictheoryblog.wordpress.com/2014/11/05/proof/

Gözlerimde anlaşılması oldukça kolay olmalı, sadece tek adımları izleyin. İki anahtar figür arasındaki gerçekliğin gerçekte nasıl çalıştığını anlamak için bakmanın şart olduğunu düşünüyorum.


6

Basit bir doğrusal regresyon olması durumunda, yalnızca bir tahminciyle . Ancak, birden fazla öngörücü içeren çoklu doğrusal regresyonda, yordayıcılar ve yanıt arasındaki korelasyon kavramı otomatik olarak kapsamaz. Formül alır: R2=r2=Corr(x,y)2

R2=Corr(yestimated,yobserved)2

Tepki ve yerleştirilmiş doğrusal model arasındaki korelasyonun karesi.


5

@Stat ayrıntılı bir cevap verdi. Kısa cevabımda, ve arasındaki benzerlik ve farkın ne olduğunu biraz farklı bir şekilde göstereceğim .rr2

r standardize edilmiş regresyon katsayısı P arasında ile ya da ile ve bu şekilde, bu (karşılıklı) bir ölçüsüdür etki boyutu . Değişkenler ikilik olduğunda en belirgin şekilde görülür. Öyleyse, , örneğin, , vakaların% 30'unun, diğer değişken değerini zıt olarak değiştirdiğinde, bir değişkende değerini tersine değiştireceği anlamına gelir.YXXYr.30

r2 , diğer taraftan, bir ifadesidir eş değişkenlik oranı : toplam değişkenlik . Bunun iki oranlı bir ürün olduğunu veya daha kesin olarak iki oranlı bir ürün olduğunu unutmayın (oran> 1 olabilir). Gevşek bir olasılık veya eğilimi ifade eden herhangi bir oran veya orana işaret ediyorsa, "eklem olasılığını (eğilim)" ifade eder. İki oranın (veya oranın) birleşik ürünü için bir başka ve geçerli ifade olarak, geometrik ortalamaları, , ki bu çok .r2=(covσxσy)2=|cov|σx2|cov|σy2r2proppropr

(İki oranları, işbirliği fikrini vurgulamak, katkı maddesi, çarpımsal değildir ve bunların takım içinde, birbirini telafi edilemez. Büyüklüğü çünkü çarpımsal olmak zorunda bağlıdır hem büyüklüklerinin ve ve üzerine uyumlu, . uygun bir "ortak varyans orantılı" Ama kendini dönüştürmek için - bir kez iki kez bölünecek olan , "çapraz varyans", hem hisseleri aynı ölçü birimlerini ve , "kendi varyansları" ve ile değilcovσx2σy2covcovσx2σy2σxσy"hibrit varyans"; Bu nedenle , değil , "paylaşılan varyansın oranı" kadar daha yeterlidir.)r2r

Yani, görüyoruz yani bir ve dernek miktarının bir ölçüsü olarak farklı (geçerli hem anlamları), ama yine de hiçbir şekilde çelişiyor birbirlerine bu katsayılar olduğunu. Ve her ikisi de, veya tahmin edip etmediğiniz aynıdır .rr2Y~XX~Y


Çok teşekkür ederim! Yanlış tanımını kullanıyorum olmadığını iki tanımları olduğunu, merak başlıyorum arada var ve birbirlerine eşdeğer değildir. Lütfen bana modelin basit bir doğrusal regresyon olmadığı (üstel olabilir) daha genel durumları düşünürsem - OP'deki denklemimin hesaplamak için hala doğru olduğu sorusunda bana yardımcı olabilir misiniz? Bu, da adlandırılan , ancak “belirleme katsayısı” ndan farklı bir miktar mı? R2R2R2
Shawn Wang

Belirleme katsayısı veya R-karesi, sadece basit doğrusal regresyonla ilgili olan r ^ 2'den daha geniş bir kavramdır. Lütfen wikipedia en.wikipedia.org/wiki/Coefficient_of_determination adresini okuyun .
ttnphns

Tekrar teşekkürler! Bunu anlıyorum. Sorum şu: Daha karmaşık regresyonlar için, belirleme katsayısını elde etmek için r değerini hala karıştırabilir miyim?
Shawn Wang

1
"Karmaşık bir regresyon" için, R kare elde edersiniz, fakat r elde edemezsiniz.
ttnphns

1

Sanırım hatalı olabilirsin. Eğer , iki değişkenli bir modeliniz olduğunu varsayıyorum: bir DV, bir IV. Bunları değiştirirseniz ya da IV'ü, IV'ü temel alan DV tahminleriyle değiştirirseniz, değişeceğini sanmıyorum . İşte R'de bir tanıtım kodu:R2=r2R2

x=rnorm(1000); y=rnorm(1000)              # store random data
summary(lm(y~x))                          # fit a linear regression model (a)
summary(lm(x~y))                          # swap variables and fit the opposite model (b)
z=lm(y~x)$fitted.values; summary(lm(y~z)) # substitute predictions for IV in model (a)

değişkenli bir modelle çalışmazsanız, DV seçiminiz etkileyecektir ... eğer değişkenleriniz birbiriyle korele değilse, sanırım, ama bu pek bir istisna değil. Tüm değişkenler aynı korelasyon kuvvetine sahipse ve aynı zamanda DV varyansının aynı bölümlerini paylaşıyorsa (örneğin [veya belki "yani"], değişkenlerin bazıları tamamen aynıysa), bunu kaybetmeden iki değişkenli bir modele indirgeyebilirsiniz herhangi bir bilgi. Yapsanız veya yapmasanız da, hala değişmez.R2R2

Diğer tüm durumlarda, ikiden fazla değişkenle düşünebilirim, burada , belirleme katsayısıdır ve , herhangi bir iki değişkenli korelasyon katsayısıdır (zorunlu olarak Pearson'un değil; örneğin; Bir Spearman's ).R, 2 R ρR2r2R2rρ


1
Geçenlerde Theil linear regresyon yaptım, sonra ve . Excel'in değerlerini de ürettiğini gördüm ve ilk başta ona güldüm, sonra yavaşça anladım ve komik olmaktan çıktı. Öyleyse genel tanımı doğru mu? Ne oluyor. S S R > S S , T - R, 2 R, 2R2=0.1468SSR>SSTR2R2
Carl
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.