Neden AIC kullanarak model seçimi uygulamak, değişkenler için bana anlamlı olmayan p değerleri veriyor?


14

AIC ile ilgili bazı sorularım var ve umarım bana yardımcı olabilirsiniz. Verilerimdeki AIC'ye dayalı olarak model seçimi (geri veya ileri) uyguladım. Seçilen değişkenlerin bazıları p değeri> 0,05 ile sonuçlandı. İnsanların p-değeri yerine AIC'ye dayalı modeller seçmemiz gerektiğini söylediklerini biliyorum, bu yüzden AIC ve p-değeri iki fark kavramıdır. Birisi bana farkın ne olduğunu söyleyebilir mi? Şimdiye kadar anladığım şey şudur:

  1. AIC'yi kullanarak geriye doğru seçim için, 3 değişkenimiz (var1, var2, var3) olduğunu ve bu modelin AIC'sinin AIC * olduğunu varsayalım. Bu üç değişkenten herhangi birini hariç tutmak, AIC * 'den önemli ölçüde düşük bir AIC ile sonuçlanmazsa (df = 1 ile ki-kare dağılımı açısından), bu üç değişkenin nihai sonuç olduğunu söyleyebiliriz.

  2. Üç değişkenli bir modelde bir değişken (örn. Var1) için anlamlı bir p değeri, bu değişkenin standartlaştırılmış etki büyüklüğünün 0'dan önemli ölçüde farklı olduğu anlamına gelir (Wald veya t-testine göre).

Bu iki yöntem arasındaki temel fark nedir? En iyi modelimde (AIC aracılığıyla elde edilen) anlamlı olmayan p değerlerine sahip bazı değişkenler varsa nasıl yorumlayabilirim?

Yanıtlar:


13

AIC ve varyantları üzerindeki varyasyonlara, sonra her regresörün p-değerlerine daha yakındır . Daha kesin olarak, günlük olasılığının cezalandırılmış versiyonlarıdır.R2

Ki kare kullanarak AIC farklılıklarını test etmek istemezsiniz. Ki-kare (model iç içe yerleştirilmişse) kullanarak günlük olasılığı farklarını test edebilirsiniz. AIC için düşük daha iyidir ( yine de çoğu uygulamada). Başka ayar gerekmez.

Mümkünse, otomatik model seçim yöntemlerinden gerçekten kaçınmak istersiniz. Birini kullanmanız gerekiyorsa, LASSO veya LAR'ı deneyin.


2
Cevap için teşekkür ederim. Evet haklısın. AIC herhangi bir test uygulamıyor, bunun yerine 2 * number_of_parameters ile -2 * loglikelihood ekleyerek modelin örneğe ne kadar iyi uyduğuna ve modelin de basit tutulabileceğine dair basit bir ölçü veriyor. Belki de bu, anlamlı olmayan p değerleri olan değişkenlerin neden seçilen modelde tutulduğunu açıklıyor?
tiantianchen

Neredeyse aynı AIC'ye sahip iki modelimiz varsa, ancak bir modelde diğerinden daha önemli terimlerimiz varsa, hangi modeli seçmeliyiz?
Agus Camacho


11

Aslında tek seferde tek değişkenli kademeli seçim için AIC'nin kullanılması (en azından asimptotik olarak), yaklaşık% 15.7'lik p değerleri için bir kesme kullanılarak kademeli seçime eşdeğerdir. (Bunu göstermek oldukça basittir - daha büyük model için AIC, log olasılığını 2 ekstra parametresi için cezadan daha fazla azaltırsa daha küçük olacaktır; bu, bir Wald ki-karesi, 2'den fazla bir kuyruk alanından daha küçük ...% 15.7)χ12

Bu nedenle, bazen p-değerlerinden daha yüksek p-değerlerine sahip değişkenler içerdiği p-değerleri için daha küçük bir kesme kullanarak karşılaştırmanız şaşırtıcı değildir.


beni Wal chi-square üzerinden AIC ve p-değerleri arasındaki bağlantı için bir url'ye veya referansa yönlendirebilir misiniz? Teşekkürler.
meh

Bu, 2 değeri kritik değer olarak kullanarak,% 15.73'lük bir p-değeri eşiğine karşılık gelen (testin serbestlik derecesi 1 olduğunda, doğrusal regresyon kullanılarak kademeli seçimde olduğu gibi) gösterilmesi nispeten kolaydır. modeller ve sürekli değişkenler). Bu, 1-chi2cdf (2,1) olarak hesaplanabilir.
George

@aginensky Bağlantı basit olsa da, gerçek bir referans görmedim. Sanırım bir tanesini google yapabilirim, bekle.
Glen_b

@aginensky Lindsey, JK & Jones, B. (1998) Tıbbi verilere uygulanan genelleştirilmiş doğrusal modeller arasından seçim yapmak. Tıpta İstatistikler , 17, 59-68. ... sayfa 62'nin ortasına bakın. Daha fazlası da olurdu.
Glen_b

@ Glen_b- teşekkürler, daha önce hiç böyle bir şey görmemiştim.
meh

9

P-değerlerinin veya AIC'nin aşamalı model seçimi için tasarlanmadığını, aslında her ikisinin altında yatan varsayımların (ancak farklı varsayımların) aşamalı bir regresyondaki ilk adımdan sonra ihlal edildiğini unutmayın. @PeterFlom'un belirttiği gibi, otomatik model seçimine ihtiyacınız olduğunu düşünüyorsanız LASSO ve / veya LAR daha iyi alternatiflerdir. Bu yöntemler şans eseri büyük olan tahminleri (kademeli olarak şans için ödüllendirir) 0'a doğru çeker ve bu nedenle adım adımdan daha az önyargılı olma eğilimindedir (ve kalan sapma daha muhafazakar olma eğilimindedir).

AIC ile genellikle gözden kaçan büyük bir sorun, AIC değerlerindeki farkın boyutudur, "düşük daha iyidir" i görmek ve orada durmak yaygındır (ve otomatik işlemler bunu vurgulamaktadır). 2 modeli karşılaştırıyorsanız ve çok farklı AIC değerlerine sahipseniz, daha düşük AIC'ye sahip model için açık bir tercih vardır, ancak çoğu zaman birbirine yakın AIC değerlerine sahip 2 (veya daha fazla) modelimiz olacaktır. yalnızca en düşük AIC değerine sahip modeli kullanan bu durum değerli bilgileri kaçırır (ve bu modelde olan veya olmayan, ancak diğer benzer modellerde farklılık gösteren terimler hakkında bir şeyler çıkarmak anlamsız veya daha kötü olacaktır). Verilerin dışından gelen bilgiler (yordayıcı değişkenler kümesinin toplanması ne kadar zor / pahalı olduğu gibi), biraz daha yüksek AIC'ye sahip bir modeli, kalite kaybı olmadan kullanmayı daha cazip hale getirebilir. Başka bir yaklaşım, benzer modellerin ağırlıklı bir ortalamasını kullanmaktır (bu muhtemelen sırt regresyonu veya kement gibi cezalandırılmış yöntemlere benzer nihai tahminlerle sonuçlanacaktır, ancak modele giden düşünce süreci anlamaya yardımcı olabilir).


Cevabınız için @GregSnow teşekkür ederiz. P-değeri ve AIC tabanlı model seçimi için (farklı) varsayımların neler olduğunu sorabilir miyim? İki yönlü (ileri / geri) uygulamak veya tam bir alt kümeyi az çok denemek, ileri veya geri adım adım seçim kullanarak yerel optimal basitleştirme modelini bulma sorununu çözer mi? (her ne kadar aşırı takma sorunu her zaman AIC / p-değer yönteminde mevcut ve LASSO ve / veya LAR daha iyi bir seçenektir)
tiantianchen

Model seçimi için ne p değerleri ne de AIC tasarlanmadığından, model seçimi için varsayımları yoktur. Her ikisi de tek bir karşılaştırma yapmak için tasarlandı, aşamalı bir regresyonda kaç karşılaştırma olduğunu düşünün, gerçekten her seferinde "en iyi" adımın atıldığını düşünüyor musunuz?
Greg Snow

@GregSnow. AIC'yi öğrenmek için referansım şuydu - model seçim işine AIC'yi koyan stat.cmu.edu/~larry/=stat705/Lecture16.pdf . Buna ek olarak, zaman serisi arima modellerinde kullanılan AIC'yi gördüğümde, her zaman model seçimi için kullanılıyordu.
meh

@aginensky, Evet, AIC (ve diğerleri) model seçimi için kullanılır. Bu, AIC'nin model seçimi için tasarlandığı veya model seçimi için bile uygun olduğu veya otomatik model seçiminin anlamlı bir soruya cevap vermediği anlamına gelmez. Daha önce çekiç olarak bir tornavida kullandım, bu genel olarak iyi bir fikir olduğu anlamına gelmez.
Greg Snow

"Bu makale, istatistiksel model seçimi sorununun yazar tarafından 1971'de" Akaike, "İstatistiksel model tanımlamasına yeni bir bakış" tarafından sunulan bir bilgi ölçütleri (AIC) kullanılarak sistematik olarak nasıl ele alınabileceğini anlatmaktadır. Bu nedenle, AIC en iyi bir tornavida tarafından çözülen bir problemde kullanılan bir çekiç olsa bile, bu çekiçin tasarımcısının görüşüydü, bir çekiç bu sorunu çözmenin doğru yoluydu. Doğru veya yanlış, AIC model seçimi için tasarlanmıştır. AIC'nin farklı bir görüşünü görmek beni çok mutlu eder. Bunu cevaplamaktan çekinmeyin, ama bitirdim.
meh

1

AIC ile yaşadığım deneyim, değişkenler anlamlı değilse, ancak yine de en küçük AIC'ye sahip modelde görünüyorsa, bunların olası çelişkiler olduğu ortaya çıkıyor.

Karıştırmayı kontrol etmenizi öneririm. Bu tür önemli olmayan değişkenleri kaldırmak, kalan tahmini katsayıların büyüklüğünü% 25'ten fazla değiştirmelidir.


Lütfen OP'nin "karıştırıcılığı nasıl kontrol edebileceğini" açıklayın.
Jim

0

En iyi model seçiminin MuMIn paketini kullanmak olduğunu düşünüyorum. Bu bir sonraki sonuç olacaktır ve en düşük AIC değerlerini aramanıza gerek yoktur. Misal:

d<-read.csv("datasource")
library(MuMIn)
fit<-glm(y~x1+x2+x3+x4,family=poisson,data=d)
get.models(dredge(fit,rank="AIC"))[1]

2
Hangi kodu kullanabileceğinizi söylemek, sorunun istatistiksel olarak nasıl ele alındığını açıklayamazsanız soruyu gerçekten yanıtlamamaktadır. Her durumda, sorudaki hiçbir şey belirli bir yazılıma özgü değildir.
Nick Cox
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.