Lojistik regresyon modellerinin değerlendirilmesi


13

Bu soru, bir lojistik modelin yeterince iyi olup olmadığına nasıl karar verileceğime dair gerçek karışıklığımdan kaynaklanıyor. Bağımlı bir değişken olarak oluşturulduktan iki yıl sonra bireysel projenin durumunu kullanan modellerim var. Sonuç başarılı (1) ya da değil (0). Çiftlerin oluşumu sırasında ölçülen bağımsız değişkenlerim var. Amacım, varsaydığım bir değişkenin çiftlerin başarısını etkileyip etkilemeyeceğini test etmek ve diğer potansiyel etkileri kontrol ederek bu başarıyı etkileyip etkilemediğini test etmektir. Modellerde, ilgi değişkeni önemlidir.

Modeller, 'deki glm()fonksiyon kullanılarak hesaplandı R. Modellerin kalitesini değerlendirmek için, bir kaç şey yaptık: glm()size verir residual deviance, AICve BICvarsayılan olarak. Ayrıca, modelin hata oranını hesapladım ve binned kalıntıları çizdim.

  • Komple model, tahmin ettiğim (ve tam modele yerleştirilmiş) diğer modellerden daha küçük bir kalıntı sapmaya, AIC ve BIC'ye sahip, bu da bu modelin diğerlerinden "daha iyi" olduğunu düşünmemi sağlıyor.
  • Modelin hata oranı oldukça düşük, IMHO ( Gelman ve Hill'de olduğu gibi, 2007, s.99 ):
    error.rate <- mean((predicted>0.5 & y==0) | (predicted<0.5 & y==1)yaklaşık% 20.

Çok uzak çok iyi. Ancak, (artık Gelman ve Hill'in tavsiyesini takiben) binned kalıntıyı çizdiğimde, kutuların büyük bir kısmı% 95 CI'nın dışında kalıyor: Binned Residuals grafiği

Bu konu beni model hakkında tamamen yanlış bir şey olduğunu düşündürüyor. Bu beni modeli atmaya itmeli mi? Modelin kusurlu olduğunu kabul etmeli miyim, ama onu koruyup ilgilenilen değişkenin etkisini yorumlamalı mıyım? Binned rezidüler arsa gerçekten iyileştirmeden, değişkenleri sırayla ve bazı dönüşümler ile oynadım.

Düzenle:

  • Şu anda, modelin bir düzine tahmincisi ve 5 etkileşim etkisi vardır.
  • Çiftler, hepsinin kısa bir süre içinde oluşması (ancak sıkıca konuşmama, hepsi aynı anda) anlamında "nispeten" birbirlerinden bağımsızdır ve çok sayıda proje (13k) ve çok sayıda birey (19k) vardır. ), bu nedenle projelerin adil bir kısmına sadece bir kişi katılır (yaklaşık 20000 çift vardır).

2
Yaptığınız işi yapmak için gereken minimum örneklem büyüklüğünün kabaca bir tahmini, 17 aday teriminiz olduğunu varsayarsak, etkinlik sayısının veya etkinlik dışı sayısının en az 15 kez (12 + 5) geçmesi gerektiğidir . model. kullanarak herhangi bir öngörücü taraması yaptıysanız , tüm bahisler kapalıdır. Y
Frank Harrell

1
Söylediklerinize göre, örneklem büyüklüğü bir sorun gibi görünmüyor, çünkü yaklaşık 20000 bin çiftim var (yaklaşık% 20'si başarılı).
Antoine Vernet

Yanıtlar:


11

Sınıflandırma doğruluğu (hata oranı), keyfi, süreksiz ve kullanımı kolay bir yanlış skorlama kuralıdır (sahte bir modelle optimize edilmiştir). Bu bağlamda gerekli değildir.

Kaç tane yordayıcı olduğunu söylemedin. Model uyumunu değerlendirmek yerine, modeli uyumlaştırmak cazip olurdu. Bir uzlaşma yaklaşımı, etkileşimlerin önemli olmadığını varsaymak ve regresyon spline'ları kullanarak sürekli öngörücülerin doğrusal olmamasına izin vermektir. Tahmini ilişkileri çizin. rmsR paket nispeten kolay tüm bu hale getirir. Daha fazla bilgi için http://biostat.mc.vanderbilt.edu/rms adresine bakın .

"Çiftler" ve gözlemlerinizin bağımsız olup olmadığı üzerinde durulabilirsiniz.


Doğru anlarsam, tavsiyeniz kalıntıların planına odaklanmak ve başka bir şey yapmadan önce bunu düzeltmek, sonunda regresyon spline'larını kullanmak, doğru muyum? Soruyu, kaç öngörücünün olduğunu ve çiftlerin "nispeten" bağımsız olduğunu belirtmek için düzenledim.
Antoine Vernet

Merhaba @Frank. Sınıflandırma doğruluğunun neden kötü bir yöntem olduğunu söylüyorsunuz? Bu, modelin türetildiği aynı veriler üzerinde değerlendirildiği için mi?
Peter Flom - Monica'yı eski durumuna döndürün

2
Benim yorumum artık arsalar üzerinde yoğunlaşmak değil, modelin ön plana oturmasını sağlamaktı. Peter "doğru" olarak sınıflandırılan oranın, tahmini performansın en düşük hassasiyet tahmincisi olması, keyfi olması ve yanlış modelin seçilmesine yol açması da dahil olmak üzere birçok sorunu vardır. Çok güçlü bir yordayıcı eklemenin (olabilirlik oranı veya -index (ROC alanı) temelinde oranın doğru sınıflandırılmasını önemli ölçüde azalttığı bir cχ2c
örneğim var

2
Hayır, yani sürekli kestiricilerin kısıtlı kübik kamalar (doğal kamalar) kullanarak birden fazla terime genişleterek log olasılık ölçeğinde doğrusal olmayan şekilde çalışmasına izin vermek. Ardından, her bir öngörücünün kısmi etkileri hakkında bilgi edinmek için tahmini dönüşümleri çizin.
Frank Harrell

1
Giriş için teşekkürler, bu gerçekten yardımcı oldu. Verilerle daha derinlemesine ilerlerken, eşzamanlılık sorunları yaşadığımı fark ettim (çift yönlü yüksek korelasyonum olmasa bile).
Antoine Vernet

4

Durum biraz garip görünüyor, ama bence arsanız bir ipucu verebilir. Eğrisel bir ilişki olabilir gibi görünüyor. OLS regresyonunda olduğu gibi lojistik regresyonda polinom terimlerinin ve öngörücü değişkenlerin diğer dönüşümlerinin (örneğin, ) kullanılmasına izin verilir . Bu denemeye değer olabilir. x2

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.