AIC model karşılaştırması için ön koşullar


26

AIC modelinin işe yaraması için yerine getirilmesi gereken ön koşullar nelerdir?

Böyle bir karşılaştırma yaptığımda bu soruyu daha yeni çözdüm:

> uu0 = lm(log(usili) ~ rok)
> uu1 = lm(usili ~ rok)
> AIC(uu0)
[1] 3192.14
> AIC(uu1)
[1] 14277.29

Bu sayede logdeğişken dönüşümünü haklı çıkardım usili. Fakat örneğin bağımlı değişken farklı olduğunda AIC modellerini karşılaştırabilir miyim, bilmiyorum?

İdeal cevap, önkoşulların (matematiksel varsayımların) listesini içerir.

Yanıtlar:


29

İki modeli, aynı değişkeni modellemedikleri için karşılaştıramazsınız (kendinizi doğru tanıdığınızdan). Bununla birlikte, AIC hem iç içe hem de sorgulanmamış modelleri karşılaştırırken çalışmalıdır.

Devam etmeden önce sadece bir hatırlatma: Gauss günlükleri olabilir.

log(L(θ))=|D|2log(2π)12log(|K|)12(xμ)TK1(xμ),

K|D|μx

2k2log(L)kL2k2log(L)12(xμ)TK1(xμ)12log(|K|)

|D|log(RSS|D|)+2k

Akaike'nin orijinal makalesi [4] aslında kavraması oldukça zor (sanırım). KL farklılığına (kabaca konuşulan iki dağıtım arasındaki fark) dayanır ve verilerinizin bilinmeyen gerçek dağılımını nasıl tahmin edebileceğinizi kanıtlamak için çalışır ve bunu modelinizin varsaydığı verilerin dağılımı ile karşılaştırırsınız. Bu nedenle “daha ​​küçük AIC puanı daha iyidir” ; Verilerinizin yaklaşık gerçek dağılımına daha yakınsınız.

Bu yüzden hepsini bir araya getirmek için AIC kullanırken hatırlanması gereken açık şeyler üç [2,5]:

  1. Farklı veri setlerinin modellerini karşılaştırmak için kullanamazsınız.

  2. Tüm aday modeller için aynı yanıt değişkenlerini kullanmalısınız.

  3. |D|>>k

Kötü haberi sana kırdığım için üzgünüm ama AIC kullanarak bir bağımlı değişkenden diğerini seçtiğini göstermek için yapmak istatistiksel olarak sağlam bir şey değil. Her iki modelde de kalıntılarınızın dağılımını kontrol edin, eğer kayıtlı veri durumu normalde artıkları dağıttıysa ve ham veri durumu yoksa, ihtiyacınız olabilecek tüm gerekçelere sahip olursunuz. Ham verilerinizin bir lognormal ile uyuşup uyuşmadığını kontrol etmek de isteyebilirsiniz, bu da gerekçelendirme için yeterli olabilir.

Kesin matematiksel varsayımlar için oyun KL ayrımı ve bilgi teorisidir.

Ah ve bazı referanslar:

  1. http://en.wikipedia.org/wiki/Akaike_information_criterion
  2. Akaike Bilgi Kriteri, Shuhua Hu, (Sunum s.17-18)
  3. Uygulamalı Çok Değişkenli İstatistiksel Analiz, Johnson & Wichern, 6. Ed. (s. 386-387)
  4. İstatistiksel model tanımlamasına yeni bir bakış, H. Akaike, IEEE Otomatik Kontrol İşlemleri 19 (6): 716–723 (1974)
  5. Model Seçimi Eğitimi No.1: Akaike'nin Bilgi Kriteri, D. Schmidt ve E. Makalic, (Sunum s.39)

Teşekkürler! Matematiği anlamadım ama mesajın çekirdeğini aldım. Ancak, AIC model karşılaştırması için gereken tüm ön koşulları listeleyebilir misiniz? Bir dahaki sefere başka bir hata yapmayacağımdan emin olmak için. Onları birer birer kontrol edeceğim.
Meraklı

1
|D|pL(θ)θp(x|θ)
usεr11852, Reinstate Monic’in

1
Cevabınıza bu 3 varsayımın listesini eklediğiniz için teşekkür ederiz! İhtiyacım olan buydu.
Meraklı

1
Cevabınıza tekrar bakmak: Puanınız 1. "Farklı veri setlerinin modellerini karşılaştırmak için kullanamazsınız" . Veri seti derken ne demek istiyorsun? Bağımlı değişken kümesini değiştirirsem ne olur? Sanırım bu durumda AIC hala karşılaştırılabilir olmalı? Bunu netleştirmek için lütfen cevabınızı güncelleyebilir misiniz?
Meraklı

1
RSSμx

11

uu0iyi12ilog(yi)uu0AIC (uu0)+2*sum (log (usili))AIC (uu1)


AIC'yi bir şekilde "düzeltme" girişimi ile ne takip ettiğinizi ve gerçekte ne elde ettiğinizi anlamıyorum (sonucunuzu nasıl yorumlayabilirsiniz). Her neyse, bununla ilgilenmeyin, sorun değil çünkü sorum tamamen farklı bir şeydi: AIC'nin (gerçek, düzeltilmemiş) mantıklı bir şekilde karşılaştırılabilir olmasının genel önkoşulları nelerdir . Bu özel örneğe odaklanmayın, bu yalnızca genel bir örnek.
Meraklı

1
2log(p(y|θ))x=g(y)x=log(y)AIC()
Olasılık

@probabilityislogic: Önerinizle ilgili akademik referanslarınız var mı (AIC (uu0) + 2 * sum (log (usili))); Teşekkürler.
KuJ

3

Akaike 1978'den alındı

Akaike 1978'den bu alıntı, @ probabilityislogic tarafından çözüme destek veren bir alıntı sunar.

Akaike, H. 1978. Bir Zaman Serisi Modelinin Olasılığı Üzerine. Kraliyet İstatistik Derneği Dergisi. Seri D (İstatistikçi) 27: 217-235.


1
üzgünüm anlamıyorum, "bir değişkenin dönüşümü" nedir ve bunun sorumla ne alakası var? Lütfen açıklayın, teşekkürler
Meraklı
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.