Esas olarak ilk üç sorunuza odaklanacağım. Kısa cevaplar şunlardır: (1) IV'ün DV üzerindeki etkisini her zaman periyodu için karşılaştırmanız gerekir, ancak (2) sadece büyüklükleri karşılaştırmak yanlış sonuçlara yol açabilir ve (3) bunu yapmanın birçok yolu vardır, ancak hangisinin doğru olduğu konusunda fikir birliği yoktur.
Aşağıda neden katsayı büyüklüklerini basitçe karşılaştıramayacağınızı ve sizi şimdiye kadar düşünülmüş bazı çözümlere yönlendiremeyeceğinizi açıklıyorum.
Allison'a (1999) göre OLS'den farklı olarak lojistik regresyon katsayıları, bu tür heterojenlik ilgili değişkenle ilgili olmasa bile gözlemlenmeyen heterojenlikten etkilenmektedir.
Aşağıdaki gibi bir lojistik regresyona uyduğunuzda:
(1)
ln( 11 - pben) =β0+ β1x1 ben
Aslında , ikili bağımlı değişkente değerini varsaymak için her bir gözlemin altında yatan eğilimi temsil eden bir gizli değişkeninin değerini tahmin eden bir denklem takıyorsunuz, belirli bir eşiğin üzerindeyse ne olur . Bunun denklemi (Williams, 2009): 1 y ∗y*1y*
(2)
y*= α0+ α1x1 ben+ σε
teriminin , diğer terimlerden bağımsız olduğu ve bir lojistik dağıtım veya probit durumunda normal bir dağılım ve tamamlayıcı log-log durumunda bir log-lojistik dağılım ve aşağıdaki durumlarda cauchy dağılımını izlediği varsayılır. cauchit.ε
Williams'a (2009) göre, denklem 2'deki katsayıları denklem 1'deki katsayıları ile ilgilidir:βαβ
(3)
βj= αjσj = 1 , . . . , J.
Denklem 2 ve 3'te, gözlemlenmeyen varyasyonun ölçeklendirme faktörüdür ve tahmini katsayılarının boyutunun gözlemlenmeyen bağlı olduğunu görebiliriz . Buna dayanarak, Allison (1999), Williams (2009) ve Mood (2009), diğerleri arasında, farklı gruplar, ülkeler veya dönemler için tahmin edilen lojistik modeller arasındaki katsayıları saf bir şekilde karşılaştıramayacağınızı iddia ediyor.β σσβσ
Çünkü gözlemlenmeyen varyasyon gruplar, ülkeler veya dönemler arasında farklılık gösterirse karşılaştırmalar yanlış sonuçlar verebilir. Farklı modeller kullanan ve aynı modeldeki etkileşim terimlerini kullanan her iki karşılaştırma da bu sorundan muzdariptir. Logit'in yanı sıra, bu aynı zamanda kuzenleri probit, tıkanma-log, cauchit ve bu bağlantı fonksiyonları kullanılarak tahmin edilen ayrık zamanlı tehlike modelleri için de geçerlidir. Sıralı logit modelleri de bundan etkilenir.
Williams (2009), çözümün gözlemlenmeyen varyasyonu heterojen bir seçim modeli (bir konum ölçeği modeli olarak da bilinir) ile modellemek olduğunu ve bunun için bir Stata eklentisi sağladığını savunmaktadır oglm
(Williams 2010). R'de heterojen seçim modelleri, CRAN aracılığıyla mevcut olan paketin hetglm()
fonksiyonuna uygun olabilir glmx
. Her iki programın da kullanımı çok kolaydır. Son olarak, Williams (2009) SPSS'in PLUM
bu modelleri uydurma rutininden bahsetmektedir , ancak hiç kullanmadım ve kullanmanın ne kadar kolay olduğu konusunda yorum yapamam.
Bununla birlikte, varyans denklemi yanlış belirtilmişse veya ölçüm hatası varsa, heterojen seçim modellerini kullanan karşılaştırmaların daha da taraflı olabileceğini gösteren en az bir çalışma belgesi vardır.
Mood (2010), varyansın modellenmesini içermeyen, ancak öngörülen olasılık değişikliklerinin karşılaştırmasını kullanan diğer çözümleri listeler.
Görünüşe göre bu çözülmemiş bir konudur ve genellikle alanımın (Sosyoloji) konferanslarındaki kağıtların farklı çözümler ürettiğini görüyorum. Alanınızdaki insanların neler yaptığına bakmanızı ve ardından bununla nasıl başa çıkacağınıza karar vermenizi öneririm.
Referanslar
- Allison, PD (1999). Logit ve Probit Katsayılarının Gruplar Arasında Karşılaştırılması. Sosyolojik Yöntemler ve Araştırma, 28 (2), 186-208.
- Mood, C. (2010). Lojistik Regresyon: Yapabileceğimizi düşündüğümüz şeyi ve bu konuda neler yapabileceğimizi neden yapamıyoruz? Avrupa Sosyolojik İncelemesi, 26 (1), 67-82.
- Williams, R. (2009). Gruplar Arasındaki Logit ve Probit Katsayılarını Karşılaştırmak için Heterojen Seçim Modellerini Kullanma. Sosyolojik Yöntemler ve Araştırma, 37 (4), 531-559.
- Williams, R. (2010). Heterojen seçim modellerinin oglm ile uyumu. Stata Journal, 10 (4), 540-567.