Yanıtlar:
Olası açıklamalardan biri, sonucunuz ile yordayıcı arasındaki ilişkideki doğrusal olmayanlıklardır.
> set.seed(1)
> nn <- 1e3
> xx <- runif(nn,-1,1)
> yy <- runif(nn)<1/(1+exp(-xx^2))
>
> library(lmtest)
>
> model_0 <- glm(yy~1,family="binomial")
> model_1 <- glm(yy~xx,family="binomial")
> lrtest(model_1,model_0)
Likelihood ratio test
Model 1: yy ~ xx
Model 2: yy ~ 1
#Df LogLik Df Chisq Pr(>Chisq)
1 2 -676.72
2 1 -677.22 -1 0.9914 0.3194
>
> xx_cut <- cut(xx,c(-1,-0.3,0.3,1))
> model_2 <- glm(yy~xx_cut,family="binomial")
> lrtest(model_2,model_0)
Likelihood ratio test
Model 1: yy ~ xx_cut
Model 2: yy ~ 1
#Df LogLik Df Chisq Pr(>Chisq)
1 3 -673.65
2 1 -677.22 -2 7.1362 0.02821 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Ancak bu, öngörücünün ayrıklaştırılmasının en iyi yaklaşım olduğu anlamına gelmez. (Neredeyse hiç yoktur.) Doğrusal olmayanlığı spline veya benzeri kullanarak modellemek çok daha iyidir .
Olası bir yol, ilişkinin belirgin bir şekilde doğrusal olmamasıdır. Bunun ne olduğunu gerçekten açıklayıp açıklamadığını (ayrıntı eksikliği göz önüne alındığında) söylemek mümkün değildir.
Kendiniz kontrol edebilirsiniz. İlk olarak, değişkenin kendisi için eklenmiş bir değişken grafiği yapabilir ve ayrıca efektleri modelin faktör sürümünde de çizebilirsiniz. Açıklama doğruysa, her ikisi de açıkça doğrusal olmayan bir model görmelidir.