AIC'yi en aza indirerek modelleri seçmek ne zaman uygundur?


12

En azından bazı yüksek kalibreli istatistikçiler arasında, minimum değerin belirli bir eşiği içinde AIC istatistiği değerlerine sahip modellerin AIC istatistiğini en aza indiren model olarak uygun olarak kabul edilmesi gerektiği iyi bilinmektedir. Örneğin, [1, s.221]

Daha sonra küçük GCV veya AIC'li modeller en iyi olarak kabul edilir. Tabii ki GCV veya AIC'yi körü körüne minimize etmemeli. Daha ziyade, makul derecede küçük GCV veya AIC değerlerine sahip tüm modeller potansiyel olarak uygun olarak düşünülmeli ve basitliklerine ve bilimsel uygunluklarına göre değerlendirilmelidir.

Benzer şekilde, [2, s.144] 'de

Minimum değerin c'sinde AIC değerleri olan modellerin rekabetçi (tipik bir değer olarak c = 2 ile) olarak değerlendirilmesi gerektiği önerilmiştir (Duong, 1984). Rekabetçi modeller arasından seçim yapılması, artıkların beyazlığı (Bölüm 5.3) ve model basitliği gibi faktörlere dayandırılabilir.

Referanslar:

  1. Ruppert, D .; Wand, MP & Carrol, RJ Yarı Parametrik Regresyon , Cambridge Üniversitesi Yayınları, 2003
  2. Brockwell, PJ & Davis, RA Zaman serilerine giriş ve tahmin , John Wiley & Sons, 1996

Yukarıda verilenler göz önüne alındığında, aşağıdaki iki modelden hangisi tercih edilmelidir?

print( lh300 <- arima(lh, order=c(3,0,0)) )
# ... sigma^2 estimated as 0.1787:  log likelihood = -27.09,  aic = 64.18
print( lh100 <- arima(lh, order=c(1,0,0)) )
# ... sigma^2 estimated as 0.1975:  log likelihood = -29.38,  aic = 64.76

Daha genel olarak, AIC'yi veya ilgili istatistiği körü körüne minimize ederek modelleri seçmek ne zaman uygundur?


Her iki model için de AIC vermediniz.
Peter Flom

R ile nasıl elde edeceğimizi gösterdim
Hibernating

1
ARIMA modellerinde +1 sorunları aşağıda belirtilmiştir. Ancak aksi halde: "Prognostik bir modeli basitleştirme: klinik verilere dayanan bir simülasyon çalışması." Ambler 2002 bu konuda en çok alıntı yapılan referanstır.
charles

Yanıtlar:


4

Üzerinde Cosma Shalizi en ders notlarından alıntı yapan Doğrusal Regresyon hakkında gerçeği , sen o AIC gibi bir istatistik minimize oldu sırf bir model seçmek asla için,

Every time someone solely uses an AIC statistic for model selection, an angel loses its
wings. Every time someone thoughtlessly minimises it, an angel not only loses its wings,
but is cast out of Heaven and falls in most extreme agony into the everlasting fire.

1
Ünlü bir Yahudi'nin dediği gibi: "Hayal gücü bilgiden daha iyidir" :)
hazırda bekletme

Ve ünlü bir Yahudi olmayanın dediği gibi "Bakarak çok şey görebilirsiniz" (Yogi Berra).
Peter Flom

Ve gördüğümüz, elbette, esas olarak aradığımız şeye bağlıdır. John Lubbock
Hazırda Bekletme

12

Model seçiminde AIC'yi kullanmanın genellikle uygun olduğunu söyleyebilirim, ancak model seçiminde tek temel olarak kullanmak nadiren doğrudur. Ayrıca temel bilgileri de kullanmalıyız.

Özel durumunuzda, bir modeli 3. derece AR ile karşılaştırırken, bir 1. derece AR ile bir modeli karşılaştırıyorsunuz. AIC'ye (ya da benzer bir şeye) ek olarak, otokorelasyon ve kısmi otokorelasyon çizimlerine bakacağım. Ayrıca 3. dereceden bir modelin ne anlama geleceğini de düşünürdüm . Mantıklı geliyor? Maddi bilgiye katkıda bulunur mu? (Veya yalnızca tahminle ilgileniyorsanız, tahmin etmeye yardımcı olur mu?)

Daha genel olarak, bazen çok küçük bir etki büyüklüğü bulmak ilginçtir.


Sadece bir arima modeli seçmek için iyi bir algoritmanın sadece AIC (veya benzeri) kriterine dayanmaması gerektiğini söylediniz mi?
Kış uykusuna yatan

Evet öyle dedim.
Peter Flom

Ve sonunda bunu elveda auto.arima olarak duydum. Benim tercihim Bisgaard, S. & Kulahci, M. bölüm 6'da ana hatları çizilen bir yaklaşımı takip etmek olacaktır. Zaman dizisi analizi ve örnek John Wiley & Sons, Inc., 2011 ile tahmin, daha da ayrıntılı olarak 6.5. MODELLERDEKİ FARKLAR
Hazırda Bekletme

1
@Hibernating: yazarları auto.arima, Hyndman'a & Khandakar (2008) , de ki: - ". Tek değişkenli zaman serisi çok sayıda otomatik tahminler genellikle işinde ihtiyaç vardır ihtiyaç tahmin olduğunu en azından ayda bin ürün serilerini üzerinde olması yaygındır. Daha az sayıda tahmin gerekli olsa bile, bunları üretmek için zaman serisi modellerinin kullanımı konusunda uygun şekilde eğitilmiş kimse olmayabilir. Bu durumlarda otomatik bir tahmin algoritması önemli bir araçtır. " Not Bu koşullar .
Scortchi - Monica'yı eski durumuna döndürün

2
Teşekkürler ama daha önce okumuştum. Şimdilik "otomatik" kısım ile ilgili bariz sorunları görmezden gelsek bile, "arima" kısmı ile ilgili sorunlar var, özellikle de sezonluk modelleri içerecek şekilde genişletildiğinde. Mevsimsel ARIMA modelleri, PJ Harrison, C Chatfield ve öğrenmekten zevk aldığım diğer bazı kişiler tarafından şiddetle eleştirildi. İ) kesinlikle gerekli olduğunda otomatik tahminlere karşı hiçbir şeyim yok ve ii) ses bulabileceğim algoritmalara dayanır - aksi takdirde birkaç yıl önce Leo Breiman'ın "iki kültür" makalesi hakkındaki yorumunda DR Cox tavsiyelerini takip ederim.
Kış uykusuna yatan

8

AIC'yi daha makul (yani daha büyük) bir sağlama olarak düşünebilirsiniz.PP


2
Son cümleniz ilginç. Nihai amaç tahmin ise, önemsiz öngörücülerin bile regresyona eklenmesinin haklı olabileceğini okuduğumu hatırlıyorum. O zaman ona çok dikkat etmedim ama şimdi bu referansı bulmaya çalışacağım.
Kış uykusuna yatan

3
Yerine ekleyerek söyleyebilirim önlemek çıkarmadan . Ve bu sadece bir tahmin değil, aynı zamanda değişken seçimine rehberlik etmek için istatistiksel ilişkilendirme değerlendirmelerinin kullanılması önyargılara ve geçersiz standart hatalara ve güven sınırlarına neden olur.
Frank Harrell
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.