“Kademeli regresyon” nasıl çalışır?


11

Bir probit modeline uyması için aşağıdaki R kodunu kullandım:

p1 <- glm(natijeh ~ ., family=binomial(probit), data=data1)
stepwise(p1, direction='backward/forward', criterion='BIC')

Ben yok ne olduğunu bilmek istiyorum stepwiseve backward/forwardtam olarak ne yapacağını ve nasıl değişkenleri seçmek?


7
Frank Harrell ( stats.stackexchange.com/users/4253/frank-harrell ) tarafından kademeli olarak gerilemenin neden kötü olduğuna

4
BabakP en bağlantılara ek olarak, aynı zamanda bir göz bu yazı siteden.
COOLSerdash


@PeterFlom, bu makaleye atıfta bulunmak için, uygun alıntıyı anlamada bazı sorunlar yaşıyorum. Burada listeleyebilir misiniz? Teşekkürler.
doug.numbers

2
@ doug.numbers Çeşitli yerlerde sunuldu ve konferans bildirileri kapsamında yayınlandı. Google "Flom, Cassell, Stepwise" olarak sunulduğu yerleri alırsınız ve bunu biçimlendirebilirsiniz, ancak alıntıları yayınlanan sunulara biçimlendirebilirsiniz.
Peter Flom

Yanıtlar:


10

Kademeli seçim prensibi

  1. İstediğiniz tüm değişkenleri içeren bir modele uyuyorsunuz. Bu şu anki en iyi modeliniz.
  2. Bir değişkeni kaldırırsınız (veya geçerli en iyi modelde kullanılmayan değişkenler arasına bir değişken eklersiniz) ve her biri için yeni modele uyarsınız ve bunları BIC'ye (veya herhangi birine göre) AIC gibi diğer kriterler ). Başka bir "şimdiki en iyi model" elde edersiniz.

BIC azaltılıncaya kadar tekrarlayın. Yalnızca yerel minimum BIC'niz vardır, yani değişken alt kümelerinin tüm olası seçenekleri arasında en iyi modeli alamayabilirsiniz. Her neyse, genellikle çok fazla var, bu yüzden çok fazla iş yapmadan biraz optimize etmenin bir yolu.

Ayrıca bkz . Wikipedia'da Kademeli regresyon ve Model seçimi .


5

Aşamalı regresyon temel olarak, belirtilen bir kritere dayanarak birer birer ortak değişkenler ekleyerek / bırakarak regresyon modeline uyar (yukarıdaki örnekte kriter BIC'ye dayalı olacaktır).

İleriyi belirterek R, en basit modelle (yani, bir ortak değişken) başlamak istediğinizi ve daha sonra yalnızca BIC modellerinde bir iyileşme ile sonuçlananları koruyarak birer birer ortak değişken ekleyin.

Geriye doğru belirterek R, tam modelle (yani tüm ortak değişkenlere sahip modelle) başlamak ve daha sonra BIC'de bir iyileşme ile sonuçlanan ortak değişkenleri bir kez atamak istediğinizi söylersiniz.

Aşamalı regresyon çok tehlikeli bir istatistiksel prosedür olabilir çünkü optimal bir model seçim prosedürü değildir. Yöntem, çok zayıf model seçimine yol açabilir ve sizi birden fazla karşılaştırma gibi sorunlara karşı korumaz.


Teşekkürler. Peki 'geri / ileri' ne olacak?
Mahmud

Geriye / ileriye ne demek istiyorsun?

R'deki stpewise () yöntemlerinden biri 'geri / ileri'dir! İkisinin bir kombinasyonu mu?
Mahmud

2
Üzgünüm, şimdi ne istediğini anlıyorum. Evet, her ikisini de belirtirseniz, hem ileri hem de geri uygulanır ve en iyi ölçüt olanı seçer.
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.