Bu soru / konu bir meslektaşı ile bir tartışma geldi ve ben bu konuda bazı fikirler arıyordum:
Bazı verileri rastgele etkiler lojistik regresyonu, daha kesin olarak rastgele bir kesme lojistik regresyonu kullanarak modelleniyorum. Sabit etkiler için ilgi çekici ve dikkate alınan 9 değişkenim var. Önemli değişkenleri bulmak ve “en iyi” modeli vermek için bir çeşit model seçimi yapmak istiyorum (sadece ana efektler).
İlk fikrim AIC'yi farklı modelleri karşılaştırmak için kullanmaktı, ancak 9 değişkenle 2 ^ 9 = 512 farklı modeli (anahtar kelime: veri tarama) karşılaştırmak için çok heyecan verici değildim.
Bunu bir meslektaşımla tartıştım ve bana GLMM'lerle aşamalı (veya ileri) model seçimini okumayı hatırladığını söyledi. Ancak bir p değeri kullanmak yerine (örn. GLMM'ler için bir olasılık oranı testine dayanarak), giriş / çıkış kriteri olarak AIC kullanılmalıdır.
Bu fikri çok ilginç buldum, ancak bunu daha fazla tartışan herhangi bir referans bulamadım ve meslektaşım onu nerede okuduğunu hatırlamadı. Birçok kitap modelleri karşılaştırmak için AIC'nin kullanılmasını önerir, ancak bunu adım adım veya ileri model seçim prosedürüyle birlikte kullanma hakkında herhangi bir tartışma bulamadım.
Temelde iki sorum var:
AIC'yi giriş / çıkış kriteri olarak aşamalı bir model seçim prosedüründe kullanmanın bir yanlışlığı var mı? Evetse, alternatif ne olurdu?
Yukarıdaki prosedürü tartışan bazı referanslarınız var mı (nihai rapor için referans olarak da?)
En iyi,
Emilia