Nasıl değerini kullanabilirsiniz


13

Aşağıdaki grafikler, "normallik", "homossedastisite" ve "bağımsızlık" varsayımlarının kesin olarak karşılandığı regresyon testinin artık saçılma grafiğidir! "Doğrusallık" varsayımını test etmek için , grafiklere bakarak, ilişkinin eğrisel olduğu tahmin edilebilir, ancak soru şudur: "R2 Doğrusal" değeri doğrusallık varsayımını test etmek için nasıl kullanılabilir? İlişkinin doğrusal olup olmadığına karar vermek için "R2 Linear" değerinin kabul edilebilir aralığı nedir ? Doğrusallık varsayımı karşılanmadığında ve IV'leri dönüştürmek de yardımcı olmazsa ne yapmalı? !!

İşte testin tam sonuçlarının bağlantısı.

Dağılım grafikleri:

resim açıklamasını buraya girin

resim açıklamasını buraya girin

resim açıklamasını buraya girin


3
SPSS kullandığınız grafiklerin görünüşüne göre görüyorum. Düzenlemek ve "Uygun çizgi ekle düğmesi" bulmak için grafiği açın, orada bazı doğrusal olmayan çizgi çizme seçenekleri bulabilirsiniz, örneğin Loess. Bu seçeneğin size oldukça düz bir çizgi verip vermediğini kontrol edin.
ttnphns

@ ttnphns: Soruyu Loess satır 2 ile ekledim.
Cyrus

Oldukça eğrisel görünüyor, değil mi? Ne olduğunu görmek için Loess parametreleriyle daha fazla oynayabilirsiniz. Çizgi eğriyse, ilişkinin doğrusal olmadığını görsel olarak sonuçlandırabilirsiniz.
ttnphns

@Cyrus, bu soruya genel bir cevap gönderdim, ancak arazilerinize biraz yorum ekleyecektim ve planınızdaki ve eksenlerinin ne olduğundan tam olarak emin olmadığımı fark ettim - netleştirebilir misiniz? yxy
Makro

@ ttnphns: evet, eğrisel. Bu modeli nasıl tedavi edeceğimi bilmiyorum! Bu testte (# 2) DV'yi (PIT) doğrudan etkileyen 2 IV'üm var. Regresyon sonucu IV'lerin sadece 1'inin DV'yi önemli ölçüde etkilediğini gösterdi. R2 çok düşüktür (0.172) ve doğrusallık da düşüktür (en azından grafiğe göre IV düşük seviyedeyken). Bu testin kabul edilebilir olup olmadığını bilmiyorum! Hatta her iki IV'ü de dönüştürdüm (LN'lerini hesaplayarak) ve gerilemeyi yeniden çalıştırdım, ancak sonuç daha da kötüleşti!
Cyrus

Yanıtlar:


15

doğrusallık varsayımının yalnızca verilen koşullu ortalamasının doğrusal bir işlev olduğunuX iYiXi . Bu varsayımı test etmek için değerini kullanamazsınız .R2

Bunun nedeni, sadece gözlenen ve tahmin edilen değerler arasındaki kare korelasyon olması ve korelasyon katsayısının değerinin ve (doğrusal veya başka türlü) arasındaki ilişkiyi benzersiz bir şekilde belirlememesi ve aşağıdaki iki senaryonun her ikisinin de mümkün olmasıdır: X YR2XY

  • Yüksek ancak doğrusallık varsayımı hala önemli bir şekilde yanlıştırR2

  • Düşük ancak doğrusallık varsayımı hala tatminR2

Her birini sırasıyla tartışacağım:

(1) Yüksek ancak doğrusallık varsayımı hala önemli bir şekilde yanlıştır:R2 Buradaki hile, korelasyonun aykırı değerlere çok duyarlı olduğu gerçeğini manipüle etmektir . Eğer prediktörleri olduğunu varsayalım standart normal olan bir karışım, dağılım elde edilir zaman ve bir nokta kütle diğer ve bir yanıt değişkeni x 1 ,. . . , X n %99M%1X1,...,Xn99%M1%

Yi={Ziif XiMMif Xi=M

ZiN(μ,1)Mμμ=0,M=105XiYi

u = runif(1e4)>.99
x = rnorm(1e4)
x[which(u==1)] = 1e5
y = rnorm(1e4)
y[which(x==1e5)] = 1e5
cor(x,y)
[1] 1

YiXiYiXiXi=M

R2XiYi

Yi=β0+β1Xi+εi

YiXiXivar(εi)=σ2β1R2

x = rnorm(200)
y = 1 + 2*x + rnorm(200,sd=5)
cor(x,y)^2
[1] 0.1125698

R2

Re: Doğrusallık varsayımı karşılanmadığında ve IV'leri dönüştürmek de yardımcı olmazsa ne yapmalı? !!

Doğrusallık sorunu söz konusu olduğunda, her bir öngörücüye karşı artıkların çizimlerine bakmak yararlı olabilir - eğer göze çarpan bir model varsa, bu öngörücüde doğrusallığı göstermeyebilir. Örneğin, bu grafik, artıklar ile öngörücü arasında "kase şeklinde" bir ilişki ortaya çıkarırsa, bu öngörücüde eksik bir ikinci dereceden terim olabilir. Diğer paternler farklı bir fonksiyonel formu gösterebilir. Bazı durumlarda, doğru dönüşümü denememiş olabilirsiniz veya değişkenlerin dönüştürülmüş herhangi bir sürümünde gerçek model doğrusal olmayabilir (makul bir yaklaşım bulmak mümkün olabilir).

R2


4

R2=11R2R221<x<2R2R2


Teşekkürler Michael. Örneklemimin boyutu 302'dir. Burada testin sonuçlarına bir göz atabilir ve raporun akla yatkın ve makul olup olmadığını görmek isterim . TQ
Cyrus

@Cyrus Bu zor bir soru. Artıklar normale gerçekten iyi uyuyorlar ve doğrusal regresyonda yanlış olacağını görebildiğim hiçbir şey yok. Yeterli miktarda veriniz var. R karesi düşük çünkü rastgele gürültü bileşeni büyük. LOESS grafiği bağımsız değişkenin düşük değerlerinde bir miktar eğrilik gösterir. Ama ikna edici bulmuyorum. Bence doğrusal olabilir ve bu durumda R karesinin neden iyi bir gösterge olmadığını gösterir.
Michael R. Chernick

Tq Michael :) Evet, gerçekten şaşırtıcı! Tüm varsayımlar mükemmel bir şekilde karşılanıyor ama doğrusallık! Yukarıdaki 1. grafikte görebileceğiniz gibi, ikinci dereceden R2 (0.199) doğrusal R2'den (0.172) daha büyüktür, bu da modeli daha iyi tahmin edebileceği anlamına gelir. Aslında (SC2 ekleyerek) kuadratik regresyon yaptığımda sonuçtaki dağılım grafiği çok heterossedatik! Kafam çok karıştı! Bu modelle ne yapacağınızı bilmiyorum! Tek problem düşük doğrusallığı. Raporumda dağılım grafiğini koyarsam doğrusallığı nasıl doğrulayacağımı bilmiyorum. İkinci dereceden regresyon, homojenlik varsayımını da yerine getirmemektedir. Yardım
Cyrus

1
Şaşırtıcı olduğunu düşünmüyorum. Oldukça doğrusal görünüyor. Çok fazla değişkenlik var, bu yüzden R karesi düşük. Bence değişkenliği azaltmanın tek yolu açıklayıcı bir değişken bulmak olacaktır.
Michael R. Chernick
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.