İç içe yerleştirilmemiş iki modelin AIC'deki farkını test etme


12

AIC'nin veya diğer herhangi bir bilgi kriterinin asıl amacı, daha azının daha iyi olmasıdır. İki M1 modelim varsa: y = a0 + XA + e ve M2: y = b0 + ZB + u ve eğer ilk (A1) AIC'si ikinci (A2) modelinden daha azsa, M1 bilgi teorisi açısından daha uygun. Ancak A1-A2 farkı için herhangi bir kesinti ölçütü var mı? Aslında ne kadar az, daha az? Başka bir deyişle, (A1-A2) için sadece göz küresi yapmaktan başka bir test var mı?

Edit: Peter / Dmitrij ... Yanıt verdiğiniz için teşekkürler. Aslında bu, temel uzmanlığımın istatistiksel uzmanlığımla çeliştiği bir durumdur. Esasen, sorun iki model arasında seçim yapmak DEĞİLDİR, ancak büyük ölçüde eşdeğer olduğunu bildiğim iki değişkenin eşdeğer miktarda bilgi ekleyip eklemediğini kontrol etmektir (Aslında, ilk modelde bir değişken ve ikincisinde bir vektör. değişkenlerin bir indeksine karşı bir grup.). Dmitrij'in belirttiği gibi, en iyi bahis Cox Testi gibi görünüyor. Ancak iki modelin bilgi içeriği arasındaki farkı gerçekten test etmenin bir yolu var mı?


Ayrıca Wagonmakers et al. (2004). Parametrik önyükleme kullanarak model taklidini değerlendirme. Matematiksel Psikoloji Dergisi, 48 , 28-50. ( pdf ).
gung - Monica'yı eski durumuna getirin

Yanıtlar:


13

Merak konusu, yani buradaki cevabımdan memnun değil misiniz ? Değilse ...

AIC|AIC1AIC2|<2AIC

AICAICAIC

AIC12AIC47AIC>10

Daha genel bir yaklaşım şöyledir ...

Ifade tarafından aday modellerinin değerlerini , . Bırakalım bu değerlerin belirtir. Daha sonra , modelinin (beklenen tahmini) bilgi kaybını en aza indirgeme olasılığı olarak yorumlanabilir .AICAIC1AIC2,AIC3,,AICRAICmine(AICminAICi)/2i

Örnek olarak, aday setinde değerleri , ve olan üç model olduğunu varsayalım . Daha sonra, ikinci model bilgi kaybını en aza indirmek için ilk modelden kat daha olasıdır ve üçüncü model kez bilgi kaybını en aza indirecek ilk model kadar olası. Bu durumda, üçüncü modeli daha fazla dikkate almaktan çıkarabilir ve ilk iki modelin ağırlıklarını sırasıyla ve ağırlıklarıyla alabiliriz . İstatistiksel çıkarım, daha sonra ağırlıklı multimodele dayanacaktır.AIC100102110e(100102)/2=0.368e(100110)/2=0.00710.368

Bence güzel bir açıklama ve faydalı öneriler. Tıklanabilir olanı okumaktan korkmayın!

In ek , not kez daha, büyük ölçekli veri kümeleri için daha az tercih edilir. Ek olarak Eğer yanlılık düzeltilmiş versiyonunu uygulamak yararlı olabilir kriter (bu kullanabilir kodu ya da formül , tahmini parametre sayısıdır). Genel kural aynı olacaktır. AICBICAICAICcR AICc=AIC+2p(p+1)np1p


Merhaba Dmitrij ... Bunu fark edeceğini biliyordum. Aslında, asıl soruya verdiğiniz yanıt bu treni yuvarladı. Bunun ilginç bir bağımsız soru olacağını düşündüm. Yakaladığım sorun, istatistiksel testlerin (Cox's Test dahil) sık sık olması ve böylece iki model arasındaki farkları önceden belirlenmiş bir önem düzeyinde test edebilmeniz. Ancak AIC / BIC olasılık temelli ve bana göre, işaret ettiğiniz gibi, başparmak kuralıyla doğrudan karşılaştırılamaz. IC ölçümleri ölçeğe bağlı olduğundan, mutlak bir değer (2) sorunlu olabilir, değil mi?
user3671 21:11

@user, mutlak değeri problemli değildir. Göreceli olasılık önerisi için gidebilirsiniz, bu yüzden muhtemelen güzel bir değerinden daha emin olacaksınız . By ölçek etkisi kriter daha az küçük numunelerde önyargılı ve büyük tutarlı durumdayken demek? Tutarlı deneyin yerine ve küçük örnekleri de iyi bir alternatif olacaktır için. Başparmak kuralı hala kullanılabilir. 22BICAICc
Dmitrij Celov

1
@DmitrijCelov (bir süre önce +1) hoş cevap - Metni yapıştırdığınız için teşekkürler, çünkü Wikipedia artık ilk iki paragrafta ele alınan puanlara sahip değil. Kaldırılan paragrafa p. 446: Burnham, K. P., and Anderson, D.R. (2002). Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach, 2nd ed. Springer-Verlag. ISBN 0-387-95364-7. ve revizyon öncesi Wiki sayfası burada
James Stanley

Burnham kitabını okumadığımı ve eski Wiki referansının alıntılanan metni bir açıklama olduğunu önerdiğini belirtmeliyim. Bilginize, Wiki sayfası 15 Nisan 2011 saat 16: 52'de düzenlendi.
James Stanley

Bu takip sorusuna belki yardımcı olabilir misiniz? stats.stackexchange.com/questions/349883/…
Tripartio

8

Bence bu gerçekten istemediğinizi elde etmek için bir girişim olabilir.

Model seçimi bir bilim değildir. Nadir durumlar dışında, mükemmel bir model, hatta bir "gerçek" model yoktur; nadiren bir "en iyi" model bile vardır. AIC vs AICc vs BIC vs. SBC vs. Bence fikir bazı İYİ modeller elde etmek. Daha sonra, aralarında temel uzmanlık ve istatistiksel fikirlerin bir kombinasyonuna dayanarak seçim yaparsınız. Önemli bir uzmanlığınız yoksa (nadiren durum; çoğu insanın sandığından çok daha nadiren) en düşük AIC'yi (veya AICc veya her neyse) seçin. Ama genellikle bazı uzmanlıklarınız var - yoksa neden bu değişkenleri araştırıyorsunuz?


2
Hem istatistiksel hem de maddi uzmanlık ihtiyacını vurgulamak için +1.
chl
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.