Farklı bağımlı değişkenlere sahip modellerde lojistik katsayılar karşılaştırılsın mı?


14

Bu, birkaç gün önce sorduğum bir soru . Konuya farklı bir eğim verdiğini hissediyorum, bu yüzden yeni bir soru listeledi.

Soru şudur: Farklı bağımlı değişkenlere sahip modeller arasındaki katsayıların büyüklüğünü karşılaştırabilir miyim? Örneğin, tek bir örnekte ekonominin Temsilciler Meclisi'nde mi yoksa Başkan için mi daha güçlü bir oy tahmincisi olduğunu bilmek istiyorum. Bu durumda, iki bağımlı değişkenim Meclis'teki oy (Demokrat için 1 kodlu ve Cumhuriyetçi için 0 kodlu) ve Başkan (Demokrat için 1 ve Cumhuriyetçi için 0) oy ve bağımsız değişkenim ekonomidir. Her iki ofiste de istatistiksel olarak anlamlı bir sonuç beklemekteyim, ama bir diğerinde 'daha büyük' ​​bir etkisi olup olmadığını nasıl değerlendirebilirim? Bu özellikle ilginç bir örnek olmayabilir, ancak karşılaştırmanın bir yolu olup olmadığını merak ediyorum. Birinin katsayının 'boyutuna' bakamayacağını biliyorum. Yani, bağımlı değişkenli modellerde katsayıların karşılaştırılması mümkün müdür? Ve eğer öyleyse, nasıl yapılabilir?

Bunlardan herhangi biri anlamlı değilse, bana bildirin. Tüm tavsiyeler ve yorumlar takdir edilmektedir.


2
Birinin katsayının 'boyutuna' bakamayacağını nasıl bilebilirsiniz?
onestop

İki hesabınızı birleştirdim. SSS bölümünde belirtildiği gibi yine de kaydolmanız gerekir . (@onestop Thx yinelemeye işaret ettiği için.)
chl

Önceki sorumun cevaplarından katsayılara bakarak yordayıcıların modeller arasındaki etkisini 'modeller arasında karşılaştıramayacağımı varsaydım. Yukarıdaki örneğim için işler farklı mı?
Ejs

2
Ödül başlatmak - hiçbirinin tek bir oyu olmayan üç çok farklı cevabı olan önemli bir soru gibi görünüyor . Daha iyisini yapabiliriz. Andy W'nin kağıt bağlantı üzerinde bu ilgili soruya uygun görünüyor.
Matt Parker

Yanıtlar:


4

Kısa cevap "evet yapabilirsiniz" - ancak "büyük model" in Maksimum Olabilirlik Tahminlerini (MLE) her ikisine de takılan her iki modeldeki tüm ortak değişkenlerle karşılaştırmalısınız.

Bu, sorunuzu cevaplamak için olasılık teorisini elde etmenin "yarı resmi" bir yoludur

Örnekte, ve aynı tip değişkenlerdir (kesirler / yüzdeler) ve bu nedenle karşılaştırılabilirler. Aynı modeli her ikisine de uyduğunuzu varsayacağım. Yani iki modelimiz var: Y 2Y1Y2

l o g ( p 1 i

M1:Y1iBin(n1i,p1i)
log(p1i1p1i)=α1+β1Xi
M2:Y2iBin(n2i,p2i)
log(p2i1p2i)=α2+β2Xi

Böylece değerlendirmek istediğiniz hipoteziniz var:

H0:β1>β2

Ve bazı verileriniz ve bazı önceki bilgileriniz (lojistik model kullanımı gibi) var. Yani olasılığı hesaplıyorsunuz:{Y1i,Y2i,Xi}i=1n

P=Pr(H0|{Y1i,Y2i,Xi}i=1n,I)

Şimdi , regresyon parametrelerinin hiçbirinin gerçek değerine bağlı değildir, bu nedenle marjinalleştirilerek kaldırılması gerekir.H0

P=Pr(H0,α1,α2,β1,β2|{Y1i,Y2i,Xi}i=1n,I)dα1dα2dβ1dβ2

Hipotez, entegrasyon aralığını basitçe kısıtlar, bu yüzden:

P=β2Pr(α1,α2,β1,β2|{Y1i,Y2i,Xi}i=1n,I)dα1dα2dβ1dβ2

Olasılık veriler üzerinde koşullu olduğu için, her model için iki ayrı posterior içerecektir.

Pr(α1,β1|{Y1i,Xi,Y2i}i=1n,I)Pr(α2,β2|{Y2i,Xi,Y1i}i=1n,I)

Şimdi ve arasında doğrudan bir bağlantı olmadığı için , sadece bilinen üzerinden dolaylı bağlantılar, ikinci çıkacaktır. aynı ilk posteriordaki için de .Y1iα2,β2XiY2i

Standart lojistik regresyon teorisinden ve tekdüze önceki olasılıklar varsayıldığında, parametreler için posterior, MLE'lere eşit ortalama ile V- ve ile belirtilen bilgi matrisine eşit varyans ile yaklaşık iki değişkenli normaldir - parametrelere bağlı olmayan, sadece MLE'ler. böylece bilinen varyans matrisi ile düz ileriye doğru normal integrallere sahipsiniz. herhangi bir katkı olmaksızın marjinalleşir (diğer herhangi bir "ortak değişken" gibi) ve olağan sonuçla kalırız (isterseniz türetmenin ayrıntılarını gönderebilirim, ancak oldukça "standart" şeyler):V1V2αj

P=Φ(β^2,MLEβ^1,MLEV1:β,β+V2:β,β)

Nerede sadece standart normal CDF olduğunu. Bu normal araç testinin olağan karşılaştırmasıdır. Ancak bu yaklaşımın her birinde aynı regresyon değişkenleri setinin kullanılmasını gerektirdiğini unutmayın. Birçok öngörücüye sahip çok değişkenli durumda, farklı regresyon değişkenlerine sahipseniz, integraller yukarıdaki teste etkili bir şekilde eşit olacaktır, ancak her iki modelden tüm ortak değişkenleri içeren "büyük model" deki iki betanın MLE'lerinden.Φ()


3

Neden olmasın? Modeller, herhangi bir model öngörücüsünde 1 birim değişikliğin sonuç değişkeni için "1" olasılığını ne kadar etkileyeceğini tahmin ediyor. Modellerin aynı olduğunu varsayacağım - içlerinde aynı öngörücülere sahipler. 2 modelde herhangi bir öngörücünün göreceli büyüklüklerini karşılaştırmanın en bilgilendirici yolu, modellerin, yordayıcı ilgili sonuç değişkenlerinin olasılıklarını etkiler - ve karşılaştırın! İki tahmin için güven aralıkları belirlemek isteyeceksiniz, böylece farkın pratikte ve istatistiksel olarak "önemli" olduğunu tatmin edebilirsiniz.


Teşekkürler dmk8, çok yararlı. Bazı takip noktaları / soruları: Tüm kontrol değişkenlerini ellerinde tutarken, ilgi değişkenini (örneğin ekonomi kötüden iyiye) değiştirmek söz konusu olduğunda sıklıkla kastedilen bu mudur? Deterministik olarak ne demek istiyorsun? Olasılıklar arasındaki güven aralıklarını nasıl belirlerim?
Ejs

2
Krala danışın. Hayal kırıklığına uğratmayacak. King, G., Tomz, M. ve Wittenberg., J. (2000). İstatistiksel Analizlerden En İyi Şekilde Yararlanmak: Yorum ve Sunumun Geliştirilmesi. Am. J. Pol. Sci, 44 (2), 347-361'de tarif edilmektedir.
dmk38

2

"Bağımsız değişkenim ekonomidir" ile belirli bir yordayıcı için kısayol kullandığınızı varsayıyorum.

Bir düzeyde, şöyle bir açıklama yaparken yanlış bir şey görmüyorum

X, Y1'i _ oran oranı ve% 95 güven aralığı [_, _] ile tahmin ederken X, Y2'yi olasılık oranı oranı ve% 95 güven aralığı [_, _] ile tahmin eder.

@ dmk38'in son önerileri bu konuda çok yardımcı görünüyor.

Karşılaştırmayı kolaylaştırmak için katsayıları standartlaştırmak da isteyebilirsiniz.

Başka bir düzeyde, örneğiniz genelleştirmek isteyebileceğiniz yılların popülasyonunun rasgele olmayan bir örneğini oluşturduğunda kelimenin tam anlamıyla çıkarımsal istatistikler (standart hatalar, p -değerleri, CI'ler) almaya dikkat edin .


Evet, 'ekonomi' ulusal ekonomik koşulların algılanması için bir kısaltmadır. Modele diğer öngörücüler (kontroller) dahil edildiğinde de aynı tavsiye geçerli midir?
Ejs

@Ejs - Korkarım son sorunuzun kısa cevabı yok. İstatistiksel kontrol kullanırken ilişkileri değerlendirmenin ne anlama geldiğini anlıyorsunuz - kapsamlı çalışmaya layık inanılmaz karmaşık bir konu. Muhtemelen büyük bir değişken olan değişken seçim konusuna da giriyorsunuz. Bu konulardaki kararlı öğrenciler için en iyi kaynak, Pedhazur'un amazon.com/Multiple-regression-behavioral-research-Pedhazur/…
rolando2

1

iki insan grubunu karşılaştırmak olduğunu söyleyelim: olanlar ve .X1=1X1=0

Üstel , karşılık gelen katsayı, sahip olanlar için başarı oran oranı olarak yorumlanır olanlar için başarı oran üzerinden , koşullu modeldeki diğer değişkenler. X 1 = 1 X 1 = 0β1X1=1X1=0

Dolayısıyla, farklı bağımlı değişkenlere sahip iki modeliniz varsa, in yorumu aynı değişkenler kümesinde koşullandırılmadığından değişir. Sonuç olarak, karşılaştırma doğrudan değildir ...β1


Bunun roland2'nin önerisi üzerinde herhangi bir etkisi var mı?
Ejs

@Ejs. Standardizasyon adımına atıfta bulunuyor musunuz? Bu arada cevabım yardımcı oluyor mu? Soruyu yanlış anladım mı?
ocram
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.