Modelleri AIC temelinde nasıl karşılaştırırım?


15

Günlük olasılığını hesaplamak için aynı yöntemi kullanan iki modelimiz var ve biri için AIC diğerinden daha düşük. Bununla birlikte, düşük AIC'ye sahip olanı yorumlamak çok daha zordur.

Zorluğu ortaya koymaya değip değmeyeceğine karar vermede sorun yaşıyoruz ve bunu AIC'deki yüzde farkını kullanarak değerlendirdik. İki AIC arasındaki farkın sadece% 0.7 olduğunu ve daha karmaşık modelin% ​​0.7 daha düşük AIC'ye sahip olduğunu bulduk.

  1. İkisi arasındaki düşük yüzde farkı, modeli daha düşük AIC ile kullanmaktan kaçınmak için iyi bir neden midir?

  2. Fark yüzdesi, daha az karmaşık olan modelde% 0,7 daha fazla bilginin kaybolduğunu açıklıyor mu?

  3. İki modelin sonuçları çok farklı olabilir mi?



2
@ArunJose, bir kopya gibi görünmüyor. Buradaki sorular oldukça farklı.
Richard Hardy

1
Hayır. Bu soru modellerin karşılaştırılabilirliği ile ilgili değildir. Modellerin karşılaştırılabilir olduğunu zaten biliyoruz. Bu soru, AIC ve karmaşıklık ile model uyum arasındaki denge arasındaki farkın ne olduğu ile ilgilidir.
Ali Turab Lotia

Yanıtlar:


27

Bir karşılaştırma etmez mutlak değerlere (gibi iki AICS değil, aynı zamanda ), ancak dikkate bunların farkı : arasında AIC olan modeli ve incelenen model seti (yani tercih edilen model) arasında elde edilen en düşük AIC'dir. Örneğin Burnham ve Anderson 2004'te ana hatları verilen temel kural :1000000 Δ i = A I C i - A I C m i n , A I C i i A I C m i n1001000000

Δi=AICiAICmin,
AICiiAICmin
  1. eğer , daha sonra da önemli destek var -inci modeline (veya buna değer sadece çıplak söz olduğunu aleyhine delil) ve doğru tanımlama olduğunu önerme kuvvetle muhtemeldir;iΔi<2i
  2. Eğer , daha sonra güçlü bir destek olduğu -inci modeli;i2<Δi<4i
  3. Eğer , daha sonra önemli ölçüde daha az destek vardır -inci modeli;i4<Δi<7i
  4. olan modellerin aslında desteği yoktur.Δi>10

Şimdi, soruda belirtilen% 0,7 ile ilgili olarak, iki durumu düşünün:

  1. AIC1=AICmin=100 ve % 0,7 daha büyük: . Sonra yani modeller arasında önemli bir fark yoktur.AIC2AIC2=100.7Δ2=0.7<2
  2. AIC1=AICmin=100000 ve % 0,7 daha büyük: . Sonra yani 2. model için destek yoktur.AIC2AIC2=100700Δ2=70010

Bu nedenle, AIC'ler arasındaki farkın% 0,7 olduğunu söylemek herhangi bir bilgi sağlamaz .

AIC değeri, log-likelihood gelen ölçeklendirme sabitlerini içerir ve bu nedenle bu tür sabitlerden bağımsızdır. Bir düşünebilirsiniz kuvvetleri en iyi model olması bir rescaling dönüşümü .LΔiΔi=AICiAICminAICmin:=0

AIC'nin formülasyonu aşırı sayıda parametrenin kullanılmasını cezalandırır, bu nedenle aşırı takılmayı engeller. Diğerleri önemli ölçüde daha iyi uymadığı sürece daha az parametreli modelleri tercih eder. AIC, gerçekliği (incelenen veriler şeklinde) en uygun şekilde tanımlayan bir modeli (incelenen modeller arasında) seçmeye çalışır. Bu, aslında verilerin gerçek bir tanımı olan modelin asla dikkate alınmadığı anlamına gelir. AIC'nin hangi modelin verileri daha iyi tanımladığını , herhangi bir yorumlama yapmadığını size verdiğini unutmayın .

Şahsen , basit bir modeliniz ve çok daha düşük bir AIC'ye sahip karmaşık bir modeliniz varsa, basit modelin yeterince iyi olmadığını söyleyebilirim. Daha karmaşık model gerçekten çok daha karmaşıksa ancak çok büyük değilse (belki , belki - belirli duruma bağlıdır) Eğer çalışmak daha daha basit bir modele bağlı kalacağım .ΔiΔi<2Δi<5

Ayrıca, modele bir olasılıki

pi=exp(Δi2),

ki bu, modellerinin AIC'yi en aza indirdiği göreceli ( ) olasılığı sağlar . Örneğin, , karşılık gelirAICminiΔi=1.5pi=0.47Δi=15pi=0.0005iAICmin

Son olarak, AIC formülü ile ilgili olarak:

AIC=2k2L,

LΔi2kΔi2Δk<1

TL; DR

  1. Kötü bir sebep; AIC'lerin mutlak değerleri arasındaki farkı kullanır.
  2. Yüzde hiçbir şey söylemiyor.
  3. Modeller, veriler ve farklı sonuçların ne anlama geldiği hakkında bilgi olmaması nedeniyle bu soruya cevap vermek mümkün değildir .

2
Bu, bu gizemli meseleyle ilgili şimdiye kadar gördüğüm en açık açıklama. Başvurduğunuz makaleye baktım (s. 270-272) ve buradaki açıklamanız, makalenin açıkladığı şeyin basit ve açık ama çok doğru bir temsilidir.
Tripartio

Bu takip sorusuna belki yardımcı olabilir misiniz? stats.stackexchange.com/questions/349883/…
Tripartio
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.