bir değişkeni kategorize etmek, onu önemsizden anlamlıya çevirir


17

Çok değişkenli bir lojistik regresyon modelinde anlamlı olmayan sayısal bir değişkenim var. Ancak, gruplara ayırdığımda aniden anlam kazanıyor. Bu benim için çok sezgisel: bir değişkeni kategorize ederken bazı bilgiler veriyoruz.

Bu nasıl olabilir?

Yanıtlar:


25

Olası açıklamalardan biri, sonucunuz ile yordayıcı arasındaki ilişkideki doğrusal olmayanlıklardır.

[1,1]x-1x1x0

> set.seed(1)
> nn <- 1e3
> xx <- runif(nn,-1,1)
> yy <- runif(nn)<1/(1+exp(-xx^2))
> 
> library(lmtest)
> 
> model_0 <- glm(yy~1,family="binomial")
> model_1 <- glm(yy~xx,family="binomial")
> lrtest(model_1,model_0)
Likelihood ratio test

Model 1: yy ~ xx
Model 2: yy ~ 1
  #Df  LogLik Df  Chisq Pr(>Chisq)
1   2 -676.72                     
2   1 -677.22 -1 0.9914     0.3194
> 
> xx_cut <- cut(xx,c(-1,-0.3,0.3,1))
> model_2 <- glm(yy~xx_cut,family="binomial")
> lrtest(model_2,model_0)
Likelihood ratio test

Model 1: yy ~ xx_cut
Model 2: yy ~ 1
  #Df  LogLik Df  Chisq Pr(>Chisq)  
1   3 -673.65                       
2   1 -677.22 -2 7.1362    0.02821 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Ancak bu, öngörücünün ayrıklaştırılmasının en iyi yaklaşım olduğu anlamına gelmez. (Neredeyse hiç yoktur.) Doğrusal olmayanlığı veya benzeri kullanarak modellemek çok daha iyidir .


Ayrıklaştırmanın mantıklı olabileceği bazı örnekler var mı? Örneğin, sonuçlarda ikili bir anahtarın meydana geldiği belirli bir eşik (örneğin 18 yaş) varsa. 18 yaş aralığındaki sayısal yaş anlamlı olmayabilir, ancak ikili yaş> 18 anlamlı olabilir mi?
ajrwhite

3
@ajrwhite: alana bağlı. Eşik değerlerin yasa ayrıklığında kodlandığı her yerde mantıklı olabilir. Örneğin, oylama davranışını modelliyorsanız, birisinin 18 yaşında oy kullanmaya uygun olup olmadığını kontrol etmek mantıklıdır. Benzer şekilde, Almanya'da araç verginiz motor deplasmanınıza ve 1700, 1800, 1900, ... ccm'deki sıçramalara bağlıdır. , hemen hemen tüm arabaların 1699, 1799, ... ccm (kendinden ayrık hale getirme) yer değiştirmeleri var. Biyoloji, tıp, psikoloji vb. Doğa bilimlerinde, ayrıklaştırmanın mantıklı olduğu bir örnek bulmakta zorlanıyorum.
S.Kolassa - Monica'yı

7

Olası bir yol, ilişkinin belirgin bir şekilde doğrusal olmamasıdır. Bunun ne olduğunu gerçekten açıklayıp açıklamadığını (ayrıntı eksikliği göz önüne alındığında) söylemek mümkün değildir.

Kendiniz kontrol edebilirsiniz. İlk olarak, değişkenin kendisi için eklenmiş bir değişken grafiği yapabilir ve ayrıca efektleri modelin faktör sürümünde de çizebilirsiniz. Açıklama doğruysa, her ikisi de açıkça doğrusal olmayan bir model görmelidir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.