Çok terimli lojistik regresyon varsayımları


Yanıtlar:


6

MNL'deki temel varsayım, hataların bağımsız ve özdeş bir Gumbel aşırı değer dağılımı ile dağıtılmasıdır. Bu varsayımı sınamanın problemi, a priori yapılmasıdır . Standart regresyonda en küçük kareler eğrisine uyuyorsunuz ve kalan hatayı ölçüyorsunuz. Bir logit modelinde, hatanın zaten noktanın ölçümünde olduğunu varsayarsınız ve bu varsayımdan bir olasılık işlevini hesaplarsınız.

Önemli bir varsayım, numunenin eksojen olduğudur. Seçime dayalıysa, kullanılması gereken düzeltmeler vardır.

Modelin kendisinin varsayımlarına göre, Train üç tanesini açıklar:

  1. Sistematik ve rastgele olmayan tat varyasyonu.
  2. Alternatifler arasında oransal ikame (IIA özelliğinin bir sonucu).
  3. Hata teriminde seri korelasyon yok (panel verileri).

Sorununuz bağlamında çoğunlukla savunmanız gereken ilk varsayım. Üçüncüsü büyük ölçüde aynıdır, çünkü hata terimleri tamamen rastgeledir.

İkincisi, bir dereceye kadar test edilebilir. Yuvalanmış bir logit modeli belirtirseniz ve yuvalar arası ikame modelinin tamamen esnek olduğu ( ) ortaya çıkarsa , MNL modelini kullanabilirsiniz ve IIA varsayımı geçerlidir. Ancak, iç içe logit modeli için günlük olabilirlik işlevinin yerel maksimaya sahip olduğunu unutmayın, bu nedenle tutarlı bir şekilde aldığınızdan emin olmalısınız .λ=1λ=1

SPSS'de bunlardan herhangi birini yaparken, mlogitpaketi R'de kullanmanızı önermekten başka size yardımcı olamam . Afedersiniz.


Ayrıca, çok terimli probit modeli, farklı bir dizi varsayımla karşılaştırılabilir çıktı verir. Bu nedenle bir MNP / MNL karşılaştırması da değerli olabilir.
gregmacfarlane

3

Multinomiyal lojistiğin en önemli pratik varsayımlarından biri, en küçük frekans kategorisindeki gözlem sayısının büyük olması, örneğin modelin sağ tarafındaki parametre sayısının 10 katı olmasıdır.Y


Bunun her zaman tamamen doğru olmadığı ortaya çıkıyor. Gerçek nüfus sıklığının ne olduğu hakkında bazı eksojen bilgiler olması koşuluyla, asla gözlemlemediğiniz alternatifler için tutarlı parametrelerin tahmin edilebileceğini gösteren bazı (çok) çalışmalar yapılmıştır. Ancak bu farklı bir tahminci gerektirir, bu yüzden genel olarak haklısınız.
gregmacfarlane

1
Daha önce bir Bayesyan için çağrılıyor gibi görünüyor - katılmıyorum. Ancak, dışsal bilgi olmadan, kısıtsız multinomiyal lojistik, tahmin edilmesi gereken çok sayıda parametreye sahiptir.
Frank Harrell

2

gmacfarlane çok açıktı. Ama daha kesin olmak gerekirse, ve bir kesit analizi yaptığınızı varsayalım, temel varsayım IIA'dır (alakasız alternatiflerin bağımsızlığı). Verilerinizi IIA varsayımına sığmaya zorlayamazsınız, test etmeli ve tatmin olmasını ummalısınız. Spss testi 2010 yılına kadar kesin olarak başaramadı. R elbette bunu yapar, ancak mlogit postestimation komutları tarafından sağlanan IIA testlerini stata taşımak ve uygulamak sizin için daha kolay olabilir.

IIA tutmazsa, karışık multinomial logit veya nested logit makul alternatiflerdir. Birincisi ışıltı içinde tahmin edilebilir, ikincisi çok daha cimri nlogit komutuyla.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.