Sıralı lojistik regresyonda negatif katsayı


17

Biz sıralı tepki olduğunu varsayalım y:{Bad, Neutral, Good}{1,2,3} ve değişkenler kümesi X:=[x1,x2,x3] düşündüğümüz olduğunu açıklayacağız y . Daha sonra , y (yanıt) üzerinde X (tasarım matrisi) düzenli bir lojistik regresyonunu yaparız .y

Tahmini katsayısı varsayalım x1 , bu çağrı p 1 lojistik regresyon olduğu sıralı olarak, - 0.5 . oran oranını (OR) nasıl yorumlayabilirim ?β^10.5e0.5=0.607

Ben bir 1 adet artış için" demek Do , paribus, gözlemleyerek ihtimali ceteris olan kez gözlemleyerek ihtimali Kötü Nötr ve aynı değişim için x 1 , gözlemleyerek ihtimali Nötr İyi olan 0,607 gözlemleme kez oran Bad "?x1Good0.607BadNeutralx1NeutralGood0.607Bad

Ders kitabımda veya Google'da negatif katsayı yorumuna ilişkin hiçbir örnek bulamıyorum.


2
Evet doğru. Pozitif katsayıları nasıl yorumladığınızla neredeyse aynı.
Peter Flom - Monica'yı eski durumuna döndürün

2
Not: genellikle " X üzerinde regress" diyoruz, tersi değil. yX
gung - Monica'yı eski

Yanıtlar:


25

Doğru yoldasınız, ancak hangi modelin gerçekten uygun olduğunu görmek için kullandığınız yazılımın belgelerine her zaman bir göz atın. Kategorik bağımlı değişken ile sıralı kategoriler 1 , , g , , k ve X 1 , , X j , , X p yordayıcıları olan bir durum varsayalım .Y1,,g,,kX1,,Xj,,Xp

"Doğada", farklı zımni parametre anlamları olan teorik orantılı olasılık modelini yazmak için üç eşdeğer seçimle karşılaşabilirsiniz:

  1. logit(p(Yg))=lnp(Yg)p(Y>g)=β0g+β1X1++βpXp(g=1,,k1)
  2. logit(p(Yg))=lnp(Yg)p(Y>g)=β0g(β1X1++βpXp)(g=1,,k1)
  3. logit(p(Yg))=lnp(Yg)p(Y<g)=β0g+β1X1++βpXp(g=2,,k)

(Model 1 ve 2, ayrı ikili lojistik regresyonlarında, β j'nin g ile değişmemesi ve β 0 1 < < β 0 g < < β 0 k - 1 , model 3'ün β j ile aynı kısıtlama ve β 0 2 > > β 0 g > > β 0 k ) gerektirirk1βjgβ01<<β0g<<β0k1βjβ02>>β0g>>β0k

  • Model 1, pozitif olarak belirleyici bir artış olduğunu vasıtasıyla x , j bir artan olasılığı ile ilişkili olduğu alt kategoriye Y .βjXjY
  • Model 1 biraz mantıksızdır, bu nedenle model 2 veya 3 yazılımda tercih edilen modeldir. Burada, pozitif bir , X j tahmincisinde bir artışın Y'de daha yüksek bir kategori için artan oranlarla ilişkili olduğu anlamına gelir .βjXjY
  • Model 1 ve 2, için aynı tahminlere yol açar , ancak β j için tahminlerinin zıt işaretleri vardır.β0gβj
  • Model 2 ve 3, için aynı tahminlere yol açar , ancak β 0 g için tahminlerinin zıt işaretleri vardır.βjβ0g

Bir 1 birim artış ile yazılım kullanımları varsayarsak modeli 2 veya 3, sen" diyebilirsiniz , paribus, ceteris tahmin 'gözlemleyerek ihtimali Y = İyi gözlemleyerek vs' ' Y = nötr ya da kötü ' kat değişiklik e β 1 = 0,607 . "ve aynı şekilde" bir 1 adet artışla X 1 , paribus, ceteris tahmin 'gözlemleyerek ihtimali Y = İyi YA Nötr 'gözlemleyerek vs' Y = Bad adlı kat' değişim e βX1Y=GoodY=Neutral OR Badeβ^1=0.607X1Y=Good OR NeutralY=Bad. "Ampirik durumda, gerçek tahminlere değil, sadece tahmini oranlara sahibiz.eβ^1=0.607

İşte kategorili model 1 için bazı ek çizimler . İlk olarak, orantılı olasılıklara sahip kümülatif loglar için doğrusal bir model varsayımı. İkincisi, en fazla g kategorisinde gözlemlenen zımni olasılıklar g . Olasılıklar aynı şekle sahip lojistik fonksiyonları takip eder. k=4gresim açıklamasını buraya girin

Kategori olasılıkları için, tasvir edilen model aşağıdaki sıralı işlevleri ima eder: resim açıklamasını buraya girin

PS Bildiğim kadarıyla model 2 SPSS'nin yanı sıra R fonksiyonlarında MASS::polr()ve ordinal::clm(). Model 3, R fonksiyonlarında rms::lrm()ve VGAM::vglm(). Ne yazık ki SAS ve Stata'yı bilmiyorum.


@Harokitty İkili lojistik regresyon modelinin doğrusal regresyon modeli gibi bir hata terimi yoktur. Bağımlı değişkenin kendisini değil, bir olasılığı modellediğimizi unutmayın. için bir hata dağılımı hakkındaki varsayım ayrı olarak belirtilmelidir, örneğin R ile . Yglm(..., family=binomial)
caracal

3 alternatif listenizdeki # 2 spesifikasyonunu ifade etme yöntemini ele alan bir referansınız var mı?

1
@Harokitty Agresti'nin "Sıralı Kategorik Verilerin Analizi", bölüm 3.2.2, s49, denklem 3.8'de kısaca açıklanmıştır . Alternatif olarak Agresti'nin "Kategorik Veri Analizi", bölüm 9.4, p323, denklem 9.12'de.
caracal

Merhaba, rahatsız ettiğim için özür dilerim, üçüncü olan için referansın var mı? Agresti bunun hakkında konuşmuyor gibi görünüyor.

2
@Jase Eh, Agresti sadece yukarıda bağlantılı bölümde kullanır . İçin logit ( Y g ) , Harrell'in "regresyon modelinde stratejileri", bölüm 13.3.1, P333, denklem 13.4. logit(Y>g)logit(Yg)
caracal
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.