Soruya ve cevaplarına atıfta bulunuyorum: Lojistik regresyondan geliştirilen modellerin tahmin yeteneği nasıl karşılaştırılır? @Clark Chong ve @Frank Harrell tarafından cevaplar / yorumlar. ve Hosmer-Lemeshow testinde serbestlik dereceleri ve yorumlar.
Ben kağıt okuma var Medicine, Vol DW Hosmer, T. Hosmer, S. Le Cessie, S. Lemeshow, "lojistik regresyon modeli için iyilik-of-fit testlerin bir karşılaştırma", İstatistik. 16, 965-980 (1997) 'de tarif edilmiştir .
Ben anılacaktır soru için açıkça sorar çünkü karıştı Bence olduğunu "(olasılık) öngörü yeteneği", okuduktan sonra aynı değildir gazetede iyilik-of-fit-testler nişan Supra neyi gibidir:
Çoğumuzun bildiği gibi, lojistik regresyon açıklayıcı değişkenler ve başarı olasılığı arasında S-şekilli bir bağlantı olduğunu varsayar, S-şekli için fonksiyonel form
Hosmer-Lemeshow testinde herhangi bir eksiklik olduğunu iddia etmeden, (a) '(olasılık) öngörme yeteneği ' ve (b) ' uyum iyiliği ' testleri arasında ayrım yapmak zorunda olduğumuzu düşünüyorum .
Birincisinin amacı olasılıkların iyi tahmin edilip edilmediğini test etmek, uyum iyiliği testleri ise yukarıdaki S şekilli fonksiyonun 'doğru' fonksiyon olup olmadığını test etmektir. Daha resmi:
- 'olasılık tahmin yeteneği testleri' için testler , başarı olasılıklarının model tarafından iyi tahmin edildiğini belirten bir sahiptir ;
- uyum iyiliği testleri için (bakınız Hosmer ve ark.), S-şekilli fonksiyonel form doğru olmasıdır. Hosmer ve diğ. Bağlantı işlevinin yanlış olduğu veya paydadaki üssünün doğrusal olmadığı için null değerinden iki tür sapmayı saptama gücünü buldukları simülasyonlar gerçekleştirin.
Açıkçası, yukarıdaki fonksiyon 'doğru' fonksiyonel forma sahipse (eğer testler uygunluk testi için kabul sonucuna ), tahmin edilen olasılıklar iyi olacaktır, ...
İlk açıklama
... ancak kabul etmek , sıfır hipotezini reddedemezsek ne olur? bölümünde açıklandığı gibi zayıf bir sonuçtur. .
İlk soru
Sahip olduğum en önemli soru / uygunluk, eğer uygunluk reddedilirse, testin sonucu fonksiyonel formun 'doğru' olmadığıdır, ancak bu olasılıkların iyi tahmin edilmiyor mu?
İkinci soru
Ayrıca, Hosmer ve ark. al; (Soyuttan alıntı yapıyorum):
'' Doğru modelin kuadratik bir terimi olduğunda ancak sadece doğrusal terimi içeren bir modelin uygun olduğu testlerin performansının incelenmesi, Pearson ki-kare, ağırlıksız kareler toplamı, Hosmer-Lemeshow decile olduğunu gösterir. risk, düzeltilmiş artık kareler toplamı ve Stukel'in puan testi, örnek boyutu 100 olduğunda doğrusallıktan orta dereceli kalkışları tespit etmek için yüzde 50'yi aşan güce sahiptir ve 500 büyüklüğündeki numuneler için aynı alternatifler için yüzde 90'ın üzerinde güce sahiptir. Doğru modelin, dikotom ve sürekli eş değişken arasında bir etkileşimi olduğunda tüm testlerde güç yoktu, ancak yalnızca sürekli eş değişken model uyguntu. Yanlış belirtilen bir bağlantıyı algılama gücü 100 boyutlu örnekler için zayıftı. 500 Stukel 'boyutlu örnekler için s skor testi en iyi güce sahipti, ancak asimetrik bir bağlantı fonksiyonunu tespit etmek sadece yüzde 50'yi aştı. Ağırlıksız toplam kare testinin yanlış belirlenmiş bağlantı işlevini algılama gücü Stukel'in puan testinden biraz daha azdı ''
Hangi testin daha fazla güce sahip olduğu veya Hosmer-Lemeshow'un daha az güce sahip olduğu sonucuna varabilir miyim (bu spesifik anomalileri tespit etmek için)?
İkinci açıklama
Hosmer ve ark. ark. yukarıda bahsettiğim, belirli anomalileri tespit etmek için gücü hesaplayın (simüle edin) (güç sadece bir belirtildiğinde hesaplanabilir ). Bu bence bu sonuçların 'tüm olası alternatiflerine' genelleştirilebileceği anlamına gelmiyor mu?H 1