En azından doğrusal modelleri tartışırken (AR modelleri gibi), R2 ve AIC o kadar farklı değil.
Olup olmadığını sorun. X2 dahil edilmelidir
y=X1(n×K1)β1+X2(n×K2)β2+ϵ
Bu, modelleri karşılaştırmaya eşdeğerdir
M1M2::y=X1β1+uy=X1β1+X2β2+u,
nerede
E(u|X1,X2)=0. Diyoruz ki
M2ise
gerçek bir model ise
β2≠0. Dikkat edin
M1⊂M2. Bu nedenle modeller
yuvalanmıştır . Bir model seçim prosedürü
Mˆ birkaç modelden en mantıklısı seçen verilere bağlı bir kuraldır.
Diyoruz
Mˆise tutarlı ise
limn→∞P(Mˆ=M1|M1)limn→∞P(Mˆ=M2|M2)==11
Düzeltilmiş düşünün . Yani, ise . Şöyle monoton bir şekilde azalmaktadır , bu prosedür, en aza indirmek için eşdeğerdir . Buna karşılık, bu değerini en aza indirmeye eşdeğerdir . Yeterince büyük , ikincisi
neredeR2M1R¯21>R¯22R¯2s2s2log(s2)n
log(s2)==≈≈log(σˆ2nn−K)log(σˆ2)+log(1+Kn−K)log(σˆ2)+Kn−Klog(σˆ2)+Kn,
σˆ2hata varyansının ML tahmincisidir. temelli model seçimi asimptotik olarak en küçük olan modeli seçmeye eşdeğerdir
. Bu prosedür tutarsız.
R¯2log(σˆ2)+K/n
Önerme :
limn→∞P(R¯21>R¯22|M1)<1
İspat :
; buradaki istatistik, bir asimptotik izleyen doğrusal regresyon durumunda LR istatistiği olduğu için 2.-son satırın ardından gelir. boş dağıtım. QED
P(R¯21>R¯22|M1)≈=≈=→<P(log(s21)<log(s22)|M1)P(nlog(s21)<nlog(s22)|M1)P(nlog(σˆ21)+K1<nlog(σˆ22)+K1+K2|M1)P(n[log(σˆ21)−log(σˆ22)]<K2|M1)P(χ2K2<K2)1,
χ2K2
Şimdi Akaike kriterlerini, düşünün.
Böylece, AIC ayrıca ek gerileyenlerin uyguladığı SSR'nin "ceza süresi" , "ki bu zıt yönü gösterir. Böylece, seçim eğer
, başka seçmek .
AIC=log(σˆ2)+2Kn
M1AIC1<AIC2M2
yukarıdaki 3. ile devam ederek de tutarsız olduğu görülebilir. . Ayarlanan ve , gerçek model olsa bile, pozitif olasılıkla "büyük" model seçer .AICP(nlog(σˆ21)+2K1<nlog(σˆ22)+2(K1+K2)|M1)R2AICM2M1
AIC'deki karmaşıklık cezası, düzeltilmiş biraz daha büyük olduğundan , aşırı seçime daha az eğilimli olabilir. Ve yazımda ele alınmayan diğer güzel özelliklere (bu, dikkate alınan modeller kümesinde değilse gerçek modele KL sapmasını en aza indirmek) sahiptir.R2