Daha iyi sorumu sormak için, bir 16 değişken modeli (hem çıktıların bazı sağladı fit
) ve 17 değişken modeli ( fit2
aşağıda) (bu modellerde tüm belirleyici değişkenler bu modeller arasındaki tek fark nerede olduğunu, sürekli olan fit
yapmaz değişken 17 (var17)) içerir:
fit Model Likelihood Discrimination Rank Discrim.
Ratio Test Indexes Indexes
Obs 102849 LR chi2 13602.84 R2 0.173 C 0.703
0 69833 d.f. 17 g 1.150 Dxy 0.407
1 33016 Pr(> chi2) <0.0001 gr 3.160 gamma 0.416
max |deriv| 3e-05 gp 0.180 tau-a 0.177
Brier 0.190
fit2 Model Likelihood Discrimination Rank Discrim.
Ratio Test Indexes Indexes
Obs 102849 LR chi2 13639.70 R2 0.174 C 0.703
0 69833 d.f. 18 g 1.154 Dxy 0.407
1 33016 Pr(> chi2) <0.0001 gr 3.170 gamma 0.412
max |deriv| 3e-05 gp 0.180 tau-a 0.177
Brier 0.190
rms
Bu lrm
modelleri oluşturmak için Frank Harrell'in paketini kullandım . Gördüğünüz gibi, bu modeller, Ayrımcılık Endeksleri ve Sıra Ayrımcılığı arasında çok fazla değişiklik göstermiyor gibi görünüyor . Endeksler ; ancak, kullanarak lrtest(fit,fit2)
, aşağıdaki sonuçlar elde edildi:
L.R. Chisq d.f. P
3.685374e+01 1.000000e+00 1.273315e-09
Bu nedenle, bu olabilirlik oranı testinin sıfır hipotezini reddederiz; Ancak, bu modellerin benzer bir şekilde performans gösterdiği için bunun büyük örneklem büyüklüğünden ( n = 102849) kaynaklandığını varsayacağım . Ayrıca, n büyük olduğunda iç içe ikili lojistik regresyon modellerini resmi olarak karşılaştırmanın daha iyi bir yolunu bulmakla ilgileniyorum .
Bu tür iç içe modellerin karşılaştırılması açısından beni doğru yönde yönlendirebilecek geri bildirimleri, R komut dosyalarını veya belgeleri çok takdir ediyorum! Teşekkürler!
fit2
bir 17 değişken modeldir, ama aynı zamanda ihmal etmesi modelidir V17
. Bunu düzeltmek isteyebilirsiniz.
fit2
için fit
senin düzeltme gereği yukarıdaki örnekte. Teşekkürler!