Anladığım kadarıyla, p-değerlerine (en azından regresyon bağlamında) dayalı değişken seçim çok kusurlu. AIC'ye (veya benzeri) dayalı değişken seçimin de benzer nedenlerle bazıları tarafından kusurlu olduğu düşünülmektedir, ancak bu biraz belirsiz görünmektedir (örneğin soruma ve bu konudaki bazı bağlantılara bakın: "Kademeli model seçimi" tam olarak nedir? ).
Ancak, modelinizdeki en iyi öngörücüler kümesini seçmek için bu iki yöntemden birini tercih ettiğinizi varsayalım.
Burnham ve Anderson 2002 (Model Seçimi ve Çok Modlu Çıkarım: Pratik Bir Bilgi-Teorik Yaklaşım, sayfa 83), kişinin hipotez testine dayanan AIC'ye dayalı değişken seçimi karıştırmamaları gerektiğini belirtmektedir : "Sıfır hipotez ve bilgi-teorik yaklaşım testleri birlikte kullanılmazlar; çok farklı analiz paradigmalarıdır. "
Öte yandan Zuur ve ark. 2009 (R ile Ekolojide Eklentilere Sahip Karışık Etkili Modeller, sayfa 541) , önce en uygun modeli bulmak için AIC kullanımını savunuyor ve sonra hipotez testini kullanarak "ince ayar" gerçekleştiriyor gibi görünüyor : "Dezavantajı AIC'nin muhafazakar olabilmesidir. ve AIC en uygun modeli seçtikten sonra bazı ince ayarları uygulamanız gerekebilir (birinci yaklaşımdan hipotez test prosedürleri kullanarak). "
Bunun, her iki kitabın okuyucusunu hangi yaklaşımı izleyeceği konusunda nasıl karışık bıraktığını görebilirsiniz.
1) Bunlar sadece istatistiksel düşüncenin farklı "kampları" mı ve istatistikçiler arasında bir anlaşmazlık konusu mu? Bu yaklaşımlardan biri şu an "modası geçmiş" midir, ancak yazma sırasında uygun görülmüştür? Yoksa en başından beri yanlış mı?
2) Bu yaklaşımın uygun olacağı bir senaryo var mı? Örneğin, biyolojik bir arka plandan geliyorum, burada hangi değişkenlerin cevabımı etkilediğini veya etkilediğini belirlemeye çalışıyorum. Sık sık aday açıklayıcı değişkenlerim var ve hangisinin "önemli" (göreceli olarak) olduğunu bulmaya çalışıyorum. Ayrıca, aday prediktör değişkenleri kümesinin zaten bazı biyolojik ilgileri olduğu düşünülenlere indirgenmiş olduğuna dikkat edin, ancak yine de 5-20 aday prediktör içerebilir.