Galit Shmueli'nin "Açıklamak ya da Tahmin Etmek" (2010) bölümünü okuduktan sonra bariz bir çelişkiyle şaşkınım . Üç bina var,
- AIC - BIC tabanlı model seçimine karşı (s. 300 sonu - s. 301 başlangıcı): basitçe söylemek gerekirse, tahmin için amaçlanan bir model seçmek için AIC, açıklama için bir model seçmek için BIC kullanılmalıdır . Ek olarak (yukarıdaki makalede değil), bazı koşullar altında BIC'nin aday model seti arasında gerçek modeli seçtiğini biliyoruz ; gerçek model açıklayıcı modellemede aradığımız şeydir (s. 293'ün sonu).
- Basit aritmetikler: AIC, 8 veya daha büyük boyutlu numuneler için BIC'den daha büyük bir model seçecektir ( BIC'ye karşı farklı karmaşıklık cezaları nedeniyle ln ( n ) > 2'yi tatmin eden).
- "True" modeli (doğru regresörler ve doğru fonksiyonel formda ama eksik tahmin katsayılarla yani modeli) tahmin için en iyi model olmayabilir (s 307).: Eksik öngörücü bir regresyon modeli, daha iyi bir tahmin modeli olabilir - eksik öngörücüye bağlı önyargıların ortaya çıkması, tahmin tutarsızlığı nedeniyle varyansın azalmasıyla daha ağır basabilir.
Nokta 1 ve 2, daha büyük modellerin tahmin için daha fazla modellerden daha iyi olabileceğini düşündürmektedir. Bu arada, 3. nokta, daha cimri bir modelin tahmin için daha büyük bir modelden daha iyi olduğu durumun tersi bir örnek verir . Bu şaşırtıcı buluyorum.
Sorular:
- Noktalar arasındaki görünür çelişki {1. ve 2.} ve 3. açıklanacak / çözülecek mi?
- 3. nokta ışığında, AIC tarafından seçilen daha büyük bir modelin tahmin için neden BIC tarafından seçilen daha cimri bir modele göre daha iyi olduğu konusunda sezgisel bir açıklama verebilir misiniz?