Lojistik Regresyon: Sürekli Değişkenleri Yorumlama


11

Lojistik regresyonda sürekli değişkenler için olasılık oranlarını yorumlamak hakkında birkaç sorum vardı. Bunların lojistik regresyon hakkında (ve muhtemelen genel olarak regresyon hakkında) temel sorular olduğunu hissediyorum ve cevapları bilmediğim için biraz utanmama rağmen, gururumu yutacağım ve onlara soracağım. gelecek!

İşte benim durumum ... Denetimli serbestliğin bir parçası olarak, denetimli serbestliklerinin bir parçası olarak, bir iş / yaşam becerileri eğitim programına kayıtlı olan bir örneğe bakıyorum. Programdan çıktıkları yaşın, programdan çıktıktan altı ay sonra istihdamı ne ölçüde öngördüğünü görmek istedim.

(Ayrıca, modelde başka öngörücüler olduğunu unutmayın, ancak bunları hariç tuttum çünkü istatistiksel olarak anlamlı değiller ve bunu olabildiğince açık tutmak istiyorum.)

Tahmin: Eğitim programından çıkış yaşı (Ortalama yaş = 17.4, SS = 1.2, Aralık 14.3-20.5)

Sonuç: Çalışıyor mu Çalışmıyor mu (Çalışmıyor = 1, Çalışmıyor = 0)

Sonuç: Oran oranı 3.01 (p <.005) (Uyum istatistiklerinin iyiliği vb. Hariç tuttum, çünkü sadece oran oranının yorumlanması hakkında cevaplar arıyorum; Model uyumunun değerlendirilmesi, CI , vb.)

Kelimelere dökmek: Yaş bir yıl arttıkça taburcu olduktan altı ay sonra çalışma olasılığı üç birim artar.

Sorular:

1) "Yaş bir yıl arttıkça ..." dediğim zaman, yaş için başlangıç ​​noktası nedir?

Yaş sıfırdan başlıyor mu? Örneğin, "Yaş 0'dan arttıkça [yani, bu modeli bir grafiğe yerleştirirseniz en düşük yaş] ...”

Yaş, örnekteki yaş aralıkları arasında en düşük yaştan başlıyor mu? Örneğin, “Yaş 14,3'ten arttıkça ...”

VEYA

Yaş, örneğin ortalama yaşından başlar mı? Örneğin, “Yaş 17,4'ten arttıkça ...”,

2) Merkezleme bu sonucu yorumlamama yardımcı olur YA DA bu sadece y-int'in yorumlanmasında etkili midir? Eğer yardımcı olursa, ortalama ortalama yapmayı ya da aralıktaki en düşük yaşı örneklemdeki diğer tüm yaşlardan çıkarmayı düşünüyordum. Herhangi bir öneri?

3) Son olarak, 14 yaşında bir gençle karşılaştırıldığında, 17 yaşında bir gencin istihdam edilme olasılığının dokuz kat daha fazla olduğunu söylemek uygun mudur? Soruyorum çünkü lojistik regresyonun sigmoidal bir ilişki içerdiğini biliyorum ve bu 3 birim artış oranının regresyon çizgisi boyunca herhangi bir noktada tutarlı olup olmadığını merak ediyorum.

Çok teşekkürler!

Aaron


1
Sen ilginizi çekebilir bu .
tchakravarty

4
"Önemsiz" değişkenlerin kaldırılması çok sorunludur.
Frank Harrell

@FrankHarrell, bu durumda önemsiz değişkenlerin kaldırılmasının neden çok sorunlu olduğunu açıklayabilir misiniz?
Mark White

Bu, bu sitede ayrıntılı olarak tartışılmıştır. Kısaca standart hataları, P değerlerini, güven aralığı kapsamını vb.
Mahveder

Yanıtlar:


6

1) Bir oran oranı olduğundan , nereden başladığınızın bir önemi yoktur. 18 yaşındaki bir çocuğun oranı 17 yaşındaki bir erkeğin 3 katıdır. Ya da 17 yaşında bir çocuğun 18 yaşındakinin 1 / 3'ü kadardır. Aynı şey. Belirli bir yaştaki bir kişinin işe alınma olasılığını elde etmek istiyorsanız , formülü parametre tahminleriyle (OR'lerle değil) kullanabilirsiniz. Ya da kullandığınız programı sizin için alabilirsiniz.

2) Merkezlemenin yardımcı olup olmadığı bir görüş meselesidir. Ortalanmış modelleri daha net bulamıyorum, ancak bazı insanlar biliyor.

3) Oranlar "olası" ile tam olarak aynı değildir (birçok kişi sanki konuşmuş olsa da) ve 17 yaşındaki bir çocuğun oranı 14 yaşındaki bir çocuğun 27 katı olacaktır.

Sonunda, bu model konusunda temkinli olurdum. Model OR'nin 14 ile 15, 15 ve 16 arasında aynı olduğunu varsayar. Konu hakkında bildiklerime dayanarak bu benim için pek mümkün görünmüyor.


0

Bir birey için eğitim problemine kayıt olma olasılıkları, diğer tüm değişkenleri sabit tuttuktan sonra, bir yaşından küçük / daha büyük olan bir başka bireyin oranının # katıdır.

Bu benim görüşüm.


1
Bunun önceki cevaba nasıl katkıda bulunduğunu genişletebilir misiniz?
mdewey
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.