Lojistik regresyonda sürekli değişkenler için olasılık oranlarını yorumlamak hakkında birkaç sorum vardı. Bunların lojistik regresyon hakkında (ve muhtemelen genel olarak regresyon hakkında) temel sorular olduğunu hissediyorum ve cevapları bilmediğim için biraz utanmama rağmen, gururumu yutacağım ve onlara soracağım. gelecek!
İşte benim durumum ... Denetimli serbestliğin bir parçası olarak, denetimli serbestliklerinin bir parçası olarak, bir iş / yaşam becerileri eğitim programına kayıtlı olan bir örneğe bakıyorum. Programdan çıktıkları yaşın, programdan çıktıktan altı ay sonra istihdamı ne ölçüde öngördüğünü görmek istedim.
(Ayrıca, modelde başka öngörücüler olduğunu unutmayın, ancak bunları hariç tuttum çünkü istatistiksel olarak anlamlı değiller ve bunu olabildiğince açık tutmak istiyorum.)
Tahmin: Eğitim programından çıkış yaşı (Ortalama yaş = 17.4, SS = 1.2, Aralık 14.3-20.5)
Sonuç: Çalışıyor mu Çalışmıyor mu (Çalışmıyor = 1, Çalışmıyor = 0)
Sonuç: Oran oranı 3.01 (p <.005) (Uyum istatistiklerinin iyiliği vb. Hariç tuttum, çünkü sadece oran oranının yorumlanması hakkında cevaplar arıyorum; Model uyumunun değerlendirilmesi, CI , vb.)
Kelimelere dökmek: Yaş bir yıl arttıkça taburcu olduktan altı ay sonra çalışma olasılığı üç birim artar.
Sorular:
1) "Yaş bir yıl arttıkça ..." dediğim zaman, yaş için başlangıç noktası nedir?
Yaş sıfırdan başlıyor mu? Örneğin, "Yaş 0'dan arttıkça [yani, bu modeli bir grafiğe yerleştirirseniz en düşük yaş] ...”
Yaş, örnekteki yaş aralıkları arasında en düşük yaştan başlıyor mu? Örneğin, “Yaş 14,3'ten arttıkça ...”
VEYA
Yaş, örneğin ortalama yaşından başlar mı? Örneğin, “Yaş 17,4'ten arttıkça ...”,
2) Merkezleme bu sonucu yorumlamama yardımcı olur YA DA bu sadece y-int'in yorumlanmasında etkili midir? Eğer yardımcı olursa, ortalama ortalama yapmayı ya da aralıktaki en düşük yaşı örneklemdeki diğer tüm yaşlardan çıkarmayı düşünüyordum. Herhangi bir öneri?
3) Son olarak, 14 yaşında bir gençle karşılaştırıldığında, 17 yaşında bir gencin istihdam edilme olasılığının dokuz kat daha fazla olduğunu söylemek uygun mudur? Soruyorum çünkü lojistik regresyonun sigmoidal bir ilişki içerdiğini biliyorum ve bu 3 birim artış oranının regresyon çizgisi boyunca herhangi bir noktada tutarlı olup olmadığını merak ediyorum.
Çok teşekkürler!
Aaron