R'de aşamalı regresyon - Kritik p değeri


12

step()R'deki fonksiyon tarafından kademeli regresyon için kullanılan kritik p-değeri nedir? Sanırım 0.15, ama varsayım doğru mu? Kritik p değerini nasıl değiştirebilirim?


7
R'nin 'adım' işlevi AIC tabanlıdır.
Michael M

7
Kademeli model seçim rutinlerini hiç kullanmamak en iyisidir. Nedenini anlamak için cevabımı burada okumanıza yardımcı olabilir: Otomatik model seçimi için algoritmalar .
gung - Monica'yı eski

3
@ MichaelMayer'ın yorumuna ek olarak: Descriptionyardım sayfasının ?stepbütünüyle söyleyeceği kısım : AIC tarafından formül tabanlı bir model seçin.
Stephan Kolassa

Yanıtlar:


27

Diğer sorunuz hakkındaki stepyorumumda açıkladığım gibi, p değerleri yerine AIC kullanır.

Ancak, için tek bir seferde değişken AIC yapar 0.15'lik bir p-değeri kullanılarak karşılık gelir (ya da daha kesin olmak gerekirse, 0,1573):

Tek bir değişkenle farklılık gösteren iki modeli karşılaştırmayı düşünün. (daha küçük model) ve (daha büyük model) modellerini çağırın ve sırasıyla ve olmasını sağlayın .M 1 AIC 0 AIC 1M0M1AIC0AIC1

AIC ölçütünü kullanarak, ise daha büyük modeli kullanırsınız . Bu, . - 2 günlük L 0 - ( - 2 günlük L 1 ) > 2AIC1<AIC02logL0(2logL1)>2

Ancak bu, bir olasılık oranı testindeki istatistiktir. Wilks teoreminden, eğer istatistik bir üst miktarını aşarsa null değerini reddedeceğiz . Bu nedenle, daha küçük model ve daha büyük model arasında seçim yapmak için bir hipotez testi kullanırsak, olduğunda daha büyük modeli .ki-kare 2 1 - 2 günlük L 0 - ( - 2 günlük L 1 ) > ααχ122logL0(2logL1)>Cα

Şimdi , 2_1'nin 84.27 yüzdelik diliminde yatmaktadır . Bu nedenle, daha küçük AIC'ye sahip olduğunda daha büyük modeli seçersek, bu, veya p değerine sahip ek terim testi için sıfır hipotezinin reddedilmesine karşılık gelir.χ 2 1 1 - 0.843 = 0.157 % 15.72χ1210.843=0.15715.7%


Peki nasıl değiştirirsiniz?

Kolay. Değişim kparametreyi stepbaşka bir şeye 2'den. Bunun yerine% 10 mu istiyorsun? 2.7 yap:

qchisq(0.10,1,lower.tail=FALSE)
[1] 2.705543

% 2.5 ister misin? Set k=5:

qchisq(0.025,1,lower.tail=FALSE)
[1] 5.023886

ve bunun gibi.


Bununla birlikte, bu sorunuzu çözse de, Frank Harrell'in diğer sorunuzun cevabına çok dikkat etmenizi ve burada adım adım gerileme ile ilgili diğer sorulara çok sayıda istatistikçinin yanıtlarını aramanızı öneririz. genel olarak aşamalı prosedürlerden kaçınmak için sürekli olarak.


Güzel açıklama. Bunun normal regresyon t-testlerinin p-değerleri için yaklaşık olarak doğru olup olmayacağını biliyor musunuz?
Ben Ogorek

Üzgünüm Ben, "bu" nun ne demek istediğinden% 100 emin değilim. "% 5 ve% 2,5 ile testlerin nasıl yapılacağını gösterdiğiniz yukarıdaki yaklaşımı kullanabilir miyim?" Eğer cevap yüzden "Açıkçası, evet" ... ancak son cümle - sen halde işaret bakmak bazı Nominal seviyede testler yapıyoruz gibi, gerçek tip I hata oranları nominal değerleriyle gibi değiliz . Başka bir deyişle, kullanılacak bir değeri hesaplayabilirsiniz ve bu adım ... olarak ayarlanmış bir değerle eşdeğer olmalıdır, ancak gerçek önem düzeyi hala% 5 olmayacaktır. Bu sadece bir tanesi ... ( α=0.05
ctd

(ctd) ... adım adım ciddi sorunlar. Diğerleri arasında önyargılı tahminler ve çok küçük standart hatalar bulunur.
Glen_b -Manica Monica

1
Adım adım model seçimi ile ilgili sorunları geçici olarak bir kenara koyarak, daha küçük AIC => .1573 p değeri kuralını genelleştirmekle ilgileniyorum. Tanımladığınız Olabilirlik Oranı p değeri iyidir, ancak R'nin lm'si gibi rutinlerde, tahmin / std.err bir t dağılımıyla karşılaştırılmaktadır. Bu farklı bir test ve .1573 sonucunuzun yaklaşık olarak geçerli olup olmadığını merak ediyordum.
Ben Ogorek

2
Ben: evet, .1573 asimptotiktir (normale göre; sadece yaklaşık olarak doğru olacaktır). Sana için stepAIC karşılık gelen p değeri hesaplamak düşünüyorum o (Ben 200 df 0,1579 düşünüyorum mesela) Sorununu serbestlik dereceleri sadece bağlı olacaktır, çünkü; sonuç olarak istenen geri alabilmelisiniz . @Nick Bu çok ilginç. İlk bakışta, hesaplamalar arasında doğrudan bir bağlantı olduğunu düşünmüyorum - aynı miktarı hesaplıyorlar, ancak farklı nedenlerle. ktk
Glen_b -Manica Monica

4

Yukarıda belirtildiği gibi, stepR'deki fonksiyon AIC kriterlerine dayanmaktadır. Ama sanırım p-değeri ile girmek için alfa ve bırakmak için alfa demek istediniz. Yapabileceğiniz, stepwisePaul Rubin tarafından yazılmış ve burada mevcut olan işlevi kullanmaktır . Gördüğünüz gibi değiştirebileceğiniz alpha.to.enter ve alpha.to.leave argümanlarına sahipsiniz. Bu fonksiyonun modelleri seçmek için F-testi veya eşdeğer bir şekilde t-testi kullandığını unutmayın. Dahası, argümanları doğru bir şekilde tanımlarsanız, sadece aşamalı regresyonu değil, ileri seçimi ve geri elemeyi de ele alabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.