Lojistik regresyonun değerlendirilmesi ve Hosmer-Lemeshow Uyum İyiliği'nin yorumlanması


24

Hepimizin bildiği gibi, lojistik regresyon modelini değerlendirmek için 2 yöntem var ve çok farklı şeyler test ediyorlar.

  1. Öngörü gücü:

    Bağımsız değişkenleri temel alarak bağımlı değişkeni ne kadar iyi tahmin edebileceğinizi ölçen bir istatistik edinin. Tanınmış Sahte R ^ 2, McFadden (1974) ve Cox ve Snell'dir (1989).

  2. Uygunluk istatistikleri

    Test, modeli daha karmaşık hale getirerek daha da iyi yapıp yapamayacağınızı söylüyor, bu aslında doğrusallık veya etkileşimlerin olup olmadığını test ediyor.

    Modelimde her iki testi de yaptım, ki
    zaten ikinci dereceden ve etkileşim ekledi :

    >summary(spec_q2)
    
    Call:
    glm(formula = result ~ Top + Right + Left + Bottom + I(Top^2) + 
     I(Left^2) + I(Bottom^2) + Top:Right + Top:Bottom + Right:Left, 
     family = binomial())
    
     Coefficients:
                 Estimate Std. Error z value Pr(>|z|)    
    (Intercept)  0.955431   8.838584   0.108   0.9139    
    Top          0.311891   0.189793   1.643   0.1003    
    Right       -1.015460   0.502736  -2.020   0.0434 *  
    Left        -0.962143   0.431534  -2.230   0.0258 *  
    Bottom       0.198631   0.157242   1.263   0.2065    
    I(Top^2)    -0.003213   0.002114  -1.520   0.1285    
    I(Left^2)   -0.054258   0.008768  -6.188 6.09e-10 ***
    I(Bottom^2)  0.003725   0.001782   2.091   0.0366 *  
    Top:Right    0.012290   0.007540   1.630   0.1031    
    Top:Bottom   0.004536   0.002880   1.575   0.1153    
    Right:Left  -0.044283   0.015983  -2.771   0.0056 ** 
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1
    (Dispersion parameter for binomial family taken to be 1)
    Null deviance: 3350.3  on 2799  degrees of freedom
    Residual deviance: 1984.6  on 2789  degrees of freedom
    AIC: 2006.6
    

ve öngörülen güç aşağıdaki gibidir, MaFadden 0.4004'tür ve 0.2 ~ 0.4 arasındaki değer, modele çok iyi uyması için alınmalıdır (Louviere et al (2000), Domenich ve McFadden (1975)):

 > PseudoR2(spec_q2)
    McFadden     Adj.McFadden        Cox.Snell       Nagelkerke McKelvey.Zavoina           Effron            Count        Adj.Count 
   0.4076315        0.4004680        0.3859918        0.5531859        0.6144487        0.4616466        0.8489286        0.4712500 
         AIC    Corrected.AIC 
2006.6179010     2006.7125925 

ve uygunluk istatistikleri:

 > hoslem.test(result,phat,g=8)

     Hosmer and Lemeshow goodness of fit (GOF) test

  data:  result, phat
  X-squared = 2800, df = 6, p-value < 2.2e-16

Anladığım kadarıyla, GOF aslında şu boş ve alternatif hipotezi test ediyor:

  H0: The models does not need interaction and non-linearity
  H1: The models needs interaction and non-linearity

Modellerim etkileşim eklediğinden, doğrusallık olmadığı ve p-değerinin H0'ın reddedilmesi gerektiğini gösterdiği için, modelimin etkileşime ihtiyacı olduğu sonucuna vardım, gerçekten doğrusallık. Umarım yorumum doğrudur ve herhangi bir tavsiye için şimdiden teşekkür ederim, teşekkürler.



2
HL testi için alttaki tabloya bakmak p-değerinden daha iyidir. Ve ayrıca modelinizden kalanların arazilerinde. Bu sorunun nerede olduğunu gösterecektir.
olasılık

Yanıtlar:


26

Ele alınması gereken birkaç konu var.

  • R,2R,2R,2
  • Hosmer-Lemeshow testi kuadratik etkiler gibi belirli bir uyumsuzluk için değil, genel kalibrasyon hatası içindir. Düzgün bir şekilde dikkate almazsa, kutu seçimine ve bilişim hesaplamaları yöntemine keyfi gelir ve çoğu zaman çok düşük bir güce sahiptir.
  • Bu nedenlerden dolayı Hosmer-Lemeshow testi artık önerilmez. Hosmer ve diğerleri, R rmspaketi residuals.lrmişlevinde uygulanan daha iyi bir df omnibus uyum testine sahiptir .
  • Davanıza uygunluk iyiliği ortak bir testle ("yığın" testinde) tüm kare ve etkileşim terimlerinin katkısı ile değerlendirilebilir.
  • Ancak, modeli ön plana koymanın daha muhtemel olmasını sağlayacak (özellikle de regresyon yaylarını kullanarak doğrusallık varsayımları ile ilgili olarak) ve önyükleme ayarının aşırı uyumu tahmin etmek ve mutlak kontrolü kontrol etmek için fazladan düzeltilmiş bir yüksek çözünürlüklü yumuşak kalibrasyon eğrisi elde etmek için kullanılmasını öneririm. doğruluk. Bunlar R rmspaketi kullanılarak yapılır .

Son noktada, modellerin esnek olması (örneklem büyüklüğüyle sınırlı olduğu şekilde) ve “uyumsuzluk” dan ziyade “zinde” ye odaklandığımız felsefesini tercih ederim.


2
R,2

1-R,2

4

Gönderen Vikipedi :

Test, gözlemlenen olay oranlarının model popülasyonun alt gruplarındaki beklenen olay oranlarıyla uyuşup uyuşmadığını değerlendirir. Hosmer-Lemeshow testi alt grupları özel olarak belirlenmiş risk değerlerinin bir damgası olarak tanımlar. Alt gruplarda beklenen ve gözlenen olay oranlarının benzer olduğu modellere iyi kalibre edilmiş denir.

Bunun anlamı: Modelinizi y aldıktan sonra model oluşturduktan sonra, gerçek olay oranlarına benzer şekilde 10 dekar arasında dağıtılıp dağıtılmadığını kontrol etmek istiyorsunuz.

Yani hipotezler olacak

  • 'H0
  • 'H1

Dolayısıyla eğer p- değeri 0,05'ten küçükse, iyi dağıtılmamışlardır ve modelinizi iyileştirmeniz gerekir.

Umarım bu, bazı sorgunuza cevap verir.


3

O Bu oldukça tartışmalı FrankHarrell cevabı @ takip ediyor, ancak H-L testinin bir yelpaze o sonucundan anlaması olur rağmen kuadratik terimlerin & bazılarının da dahil 2 dereceden etkileşimleri, model hala uyum önemli bir eksikliği gösterdi ve belki de bu daha da karmaşık bir model uygun olacaktır. Daha basit, birinci dereceden bir modele değil, tam olarak belirttiğiniz modelin uygunluğunu test ediyorsunuz.

† Tam bir 2. mertebeden bir model değil, gitmek için üç etkileşim var.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.