doğrusallık varsayımının yalnızca verilen koşullu ortalamasının doğrusal bir işlev olduğunuX iYiXi . Bu varsayımı test etmek için değerini kullanamazsınız .R2
Bunun nedeni, sadece gözlenen ve tahmin edilen değerler arasındaki kare korelasyon olması ve korelasyon katsayısının değerinin ve (doğrusal veya başka türlü) arasındaki ilişkiyi benzersiz bir şekilde belirlememesi ve aşağıdaki iki senaryonun her ikisinin de mümkün olmasıdır: X YR2XY
Her birini sırasıyla tartışacağım:
(1) Yüksek ancak doğrusallık varsayımı hala önemli bir şekilde yanlıştır:R2 Buradaki hile, korelasyonun aykırı değerlere çok duyarlı olduğu gerçeğini manipüle etmektir . Eğer prediktörleri olduğunu varsayalım standart normal olan bir karışım, dağılım elde edilir zaman ve bir nokta kütle diğer ve bir yanıt değişkeni x 1 ,. . . , X n %99M%1X1,...,Xn99%M1%
Yi={ZiMif Xi≠Mif Xi=M
Zi∼N(μ,1)Mμμ=0,M=105XiYi
u = runif(1e4)>.99
x = rnorm(1e4)
x[which(u==1)] = 1e5
y = rnorm(1e4)
y[which(x==1e5)] = 1e5
cor(x,y)
[1] 1
YiXiYiXiXi=M
R2XiYi
Yi=β0+β1Xi+εi
YiXiXivar(εi)=σ2β1R2
x = rnorm(200)
y = 1 + 2*x + rnorm(200,sd=5)
cor(x,y)^2
[1] 0.1125698
R2
Re: Doğrusallık varsayımı karşılanmadığında ve IV'leri dönüştürmek de yardımcı olmazsa ne yapmalı? !!
Doğrusallık sorunu söz konusu olduğunda, her bir öngörücüye karşı artıkların çizimlerine bakmak yararlı olabilir - eğer göze çarpan bir model varsa, bu öngörücüde doğrusallığı göstermeyebilir. Örneğin, bu grafik, artıklar ile öngörücü arasında "kase şeklinde" bir ilişki ortaya çıkarırsa, bu öngörücüde eksik bir ikinci dereceden terim olabilir. Diğer paternler farklı bir fonksiyonel formu gösterebilir. Bazı durumlarda, doğru dönüşümü denememiş olabilirsiniz veya değişkenlerin dönüştürülmüş herhangi bir sürümünde gerçek model doğrusal olmayabilir (makul bir yaklaşım bulmak mümkün olabilir).
R2