Dinamik-tek-dinlenmeye karşı çoklu-lojistik lojik regresyon


36

Diyelim ki, birkaç kategori ve bağımsız değişkenler içeren bağımlı bir değişkenimiz var. Y

Multinomial lojistik regresyonun, ikili lojistik regresyon setine (örn. Bir-dinlenme düzeni ) göre avantajları nelerdir ? Grubu tarafından lojistik regresyon I ortalama her bir kategori için Hedefe = 1 ayrı lojistik regresyon modeli oluşturmak Y = y ı ve 0 olacaktır.yiYY=yi


3
Matematiksel olarak, bir multinom logit modeli, hepsi temel bir alternatife kıyasla, bir ikili logit model setidir. Ancak, genel parametreleri daralttığınız ve belki bazılarını birleştirdiğiniz için, MNL her zaman en az verimli (ve muhtemelen daha fazla) olacaktır. Bir seri binom model kullanmak için hiçbir neden görmüyorum.
gregmacfarlane

2
@gmacfarlane: MNL'nin ikili logistik regresyon serisinden daha iyi olacağı verileri simüle etmeye çalıştım, ancak ortalama olarak her zaman kalite aynıydı. Kaldırma çizelgelerini karşılaştırıyordum ve birkaç simülasyondan elde edilen sonuçların ortalaması alındığında neredeyse aynı görünüyordu. Belki de nasıl veri üretileceği hakkında bir fikriniz vardır, böylece MNL ikili lojistik regresyonları yener? MNL'nin büyük bir avantajı olmasına rağmen puanları olasılık olarak yorumlanabilir.
Tomek Tarczynski 14:13

Multinomial Logistic regression, ikili logit regresyonunun uzantısıdır. Çalışmanın bağımlı değişkenleri üç ve üzeri olduğunda, çalışmanın bağımlı değişkenleri iki olduğunda ikili logit kullanılmıştır.

Okuyucuya: @ julieth'in cevabından başlamanızı ve ttnphns okuyarak izlemenizi öneririm '. Sanırım eski, orijinal soruyu daha doğrudan cevaplıyor, ancak ikincisi ilginç bir bağlam ekliyor. ttnphns, her ikisi için de popüler olan bir yazılım rutini için mevcut olan farklı özellikleri gösterir, ki bu birbirinin üzerinde kullanmak için bir neden olabilir (gregmacfarlane'nin açıklamasına bakınız).
Ben Ogorek

Yanıtlar:


21

Y

logP(i)P(not i)=logiti=linear combinationi

logP(i)P(r)=logiti=linear combinationirir

i

P(i)=exp(logiti)exp(logiti)+exp(logitj)++exp(logitr)i,j,,rrexp(logit)=1P(i)=exp(logiti)exp(logiti)+1


Y

İkili lojistik regresyon modelleri, Lojistik Regresyon prosedürü veya Multinomial Lojistik Regresyon prosedürü kullanılarak takılabilir. Her prosedür diğerinde bulunmayan seçeneklere sahiptir. Önemli bir teorik ayrım, Lojistik Regresyon prosedürünün, verilerin nasıl girildiğine ve değişken değişkenlerin sayısına bakılmaksızın, bireysel vaka seviyesindeki verileri kullanarak tüm tahminleri, kalıntıları, etki istatistiklerini ve uygunluk testlerini üretmesidir. Multinomiyal Lojistik Regresyon prosedürü, içsel olarak, öngörüleri, artıkları ve bu alt popülasyonlara dayanan uygunluk testlerini öngören eş değişkenli modellere sahip alt popülasyonlar oluşturmak için içsel olarak toplar.

Lojistik Regresyon aşağıdaki benzersiz özellikleri sunar:

• Hosmer-Lemeshow, modele uyum iyiliği testi

• Kademeli analizler

• Model parametrelerini tanımlayan kontrastlar

• Sınıflandırma için alternatif kesim noktaları

• Sınıflandırma arazileri

• Bir servis talebi grubuna yerleştirilmiş bir servis talebi grubuna takılan model

• Tahminleri, artıkları saklar ve istatistikleri etkiler

Multinomial Logistic Regression, aşağıdaki benzersiz özellikleri sağlar:

Modelin uyum iyiliği için Pearson ve sapma ki-kare testleri

• Uygunluk testleri için verilerin gruplandırılması için alt popülasyonların belirlenmesi

• Sayımların, öngörülen sayımların ve alt gruplara göre kalıntıların listelenmesi

• Aşırı dağılım için varyans tahminlerinin düzeltilmesi

• Parametre tahminlerinin kovaryans matrisi

• Parametrelerin doğrusal kombinasyonlarının testleri

• İç içe modellerin açık özellikleri

• Farklı değişkenler kullanarak 1-1 eşleşmiş koşullu lojistik regresyon modellerine uyma


Bu modellerin farklı olacağını biliyorum ama hangisinin hangisi daha iyi durumda olduğunu bilmiyorum. Soruyu başka bir şekilde soracağım. Size bir görev verildiyse: Her kişi için, bazı cep telefonu şirketlerinin favori şirket olma olasılığını tahmin et (her birinin en sevdiği cep telefonu şirketini varsayalım). Bu yöntemlerden hangisini kullanırsınız ve ikincisine göre avantajları nelerdir?
Tomek Tarczynski

@Tomek Cevabımı biraz genişlettim
ttnphns 14:13

@ Julieth'in OP'nin orijinal sorusuna en iyi cevap olduğunu düşünmeme rağmen, ilgisiz alternatiflerin bağımsızlığı varsayımına giriş için sana borçluyum. Hala sahip olduğum tek soru, ayrı bir lojistiğin gerçekten etrafta dolaşıp dolaşamadığı; Söz konusu probit ve "iç içe logit" e bağladığınız Vikipedi maddesi IIA
Ben Ogorek'in

iriir

13

Unvan nedeniyle, "çoklu lojistik regresyonun avantajlarının" "multinom regresyon" anlamına geldiğini farz ediyorum. Model aynı anda uygun olduğunda genellikle avantajlar vardır. Bu özel durum Agresti'de (Kategori Veri Analizi, 2002) pg 273'te açıklanmıştır. Özetle (Agresti'nin ifadesi), ortak bir modelden elde edilen tahminlerin tabakalı bir modelden farklı olmasını beklersiniz. Ayrı lojistik modeller daha büyük standart hatalara sahip olma eğilimindedir, ancak sonucun en sık seviyesi referans seviyesi olarak ayarlandığında çok kötü olmayabilir.


Teşekkürler! Bu kitabı bulmaya çalışacağım, ne yazık ki google.books yalnızca sayfa
268'e

@TomekTarczynski Paragraftaki konuyla ilgili bilgileri özetledim, bu yüzden kitaba bakmaktan bu soru ile ilgili daha fazla bilgi alamayabilirsiniz (kitap harika olsa da diğer iyi bilgileri elde edersiniz).
julieth

4
Agresti kitabından alıntı: "Ayrı-uydurma tahminleri, J-1 logitlerinin eşzamanlı uyumu için ML tahminlerinden farklıdır. Daha az verimlidirler, daha büyük standart hatalara sahip olma eğilimindedirler. Ancak Begg ve Gray 1984, verimlilik kaybının olduğunu gösterdi Tepki kategorisinin en yüksek prevalansa sahip olduğu durumlarda taban çizgisi düşük olduğu için ".
Franck Dernoncourt
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.