Bu soru ve ilk cevabı lojistik regresyon modeli kalibrasyonunun teorik konularına odaklanmış gibi görünse de,
Lojistik regresyonun kalibrasyonunu nasıl mahvedebilir?
bu sayfanın gelecekteki okuyucuları için gerçek dünyadaki uygulamalara dikkat edilmeyi hak ediyor. Lojistik regresyon modelinin iyi tanımlanması gerektiğini ve bu sorunun lojistik regresyon için özellikle sorun yaratabileceğini unutmamalıyız.
İlk olarak, sınıf üyeliğinin log-olasılıkları modele dahil edilen öngörücülerle doğrusal olarak ilişkili değilse, iyi kalibre edilmeyecektir. Harrell'in İkili Lojistik Regresyon hakkındaki 10. bölümü "Model Uyumun Değerlendirilmesi" ne yaklaşık 20 sayfa ayırır, böylece uygulamada @whuber'ın belirttiği gibi "maksimum olabilirlik tahmincisinin asimptotik tarafsızlığından" faydalanabilir.
İkincisi, model spesifikasyonu lojistik regresyonda özel bir konudur, çünkü sıradan lineer regresyonda arka plana sahip olanlar için şaşırtıcı olabilecek doğal bir atlanmış değişken önyargıya sahiptir. Bu sayfa koyduğu gibi:
Atlanan değişkenler, dahil edilen değişkenlerle katsayıları saptırır; atlanan değişkenler, dahil edilen değişkenlerle ilişkilendirilmemiş olsa bile.
Bu sayfa ayrıca, ilgili, analitik olarak izlenebilir probit modelleri için teorik bir açıklama ile, bu davranışın neden bekleneceğine dair yararlı bir açıklamaya sahiptir . Bu nedenle, sınıf üyeliği ile ilgili tüm tahminleri dahil ettiğinizi bilmiyorsanız, uygulamada yanlış tanımlama ve düşük kalibrasyon tehlikeleriyle karşılaşabilirsiniz.
Model spesifikasyonu ile ilgili olarak, bir dizi öngörücü değer aralığında doğrusallık kabul etmeyen ve doğal olarak tahmin ediciler arasında etkileşimler bulma ve dahil etme imkanı sağlayan rastgele orman gibi ağaç tabanlı yöntemlerin daha iyi bir sonuç vermesi oldukça olasıdır. Uygulamada kalibrasyon modeli, etkileşim terimlerini veya doğrusallığı yeterince dikkate almayan bir lojistik regresyon modelinden daha fazladır. Atlanan değişken önyargı ile ilgili olarak, sınıf-üyelik olasılıklarını değerlendirmek için herhangi bir yöntemin bu konuyla yeterince ilgilenip ilgilenemeyeceği açık değildir.