Bu sitede, p-değerlerine dayalı, AIC, BIC vb.
Bu prosedürlerin neden değişkenlerin seçimi için genel olarak oldukça zayıf olduğunu anlıyorum. gung'un buradaki muhtemelen ünlü gönderisi nedenini açıkça göstermektedir; sonuçta, sadece veri taraması olan hipotezi ortaya koyduğumuz aynı veri kümesinde bir hipotezi doğrularız. Ayrıca, p-değerleri, çarpıklık ve uç değerler gibi büyük ölçüde çarpıklık gösteren miktarlardan etkilenir.
Bununla birlikte, son zamanlarda biraz zaman tahminlerini inceliyorum ve Hyndman'ın saygın ders kitabına rastladım, burada özellikle ARIMA modellerinin en uygun sırasını bulmak için kademeli seçimin kullanılmasından bahsediyor . Aslında, forecast
R'deki pakette auto.arima
varsayılan olarak bilinen iyi bilinen algoritma aşamalı seçim kullanır (p-değerleri değil AIC ile). Ayrıca, bu web sitesindeki birden çok gönderiyle iyi uyum sağlayan p değerine dayalı özellik seçimini de eleştiriyor.
Sonuç olarak, eğer hedef öngörme / tahmin için iyi modeller geliştirmekse, sonunda her zaman bir şekilde geçerliliği doğrulamalıyız. Ancak, p değerleri dışındaki değerlendirme metrikleri için prosedürün kendisi söz konusu olduğunda, bu kesinlikle bir anlaşmazlıktır.
Bu bağlamda, ama aynı zamanda genel olarak bu bağlamda kademeli AIC kullanımı hakkında herhangi bir fikri olan var mı? Herhangi bir kademeli seçimin kötü olduğuna inanmam öğretildi, ama dürüst olmak gerekirse, auto.arima(stepwise = TRUE)
bana örnek sonuçlardan daha iyi verdim auto.arima(stepwise = FALSE)
ama belki de bu sadece tesadüf.