Bence yorumlarda çok iyi bilgiler alıyorsunuz. Lojistik regresyon ile ilgili bazı temel gerçeklerin bu şeyleri daha anlaşılır hale getirip getirmeyeceğini merak ediyorum, bu yüzden bunu aklımda tutarak birkaç şeyi açıklayayım. Lojistik regresyonda katsayılar lojistik ölçekte (dolayısıyla isim ...). Bir gözlem için ortak değişken değerlerinizi eklerseniz, katsayılarla çarpıp toplarsanız , bir logit elde edersiniz .
logit = β0+ β1x1+ β2x2+ . . . + βkxk
Bir logit, kimseye sezgisel bir anlam vermeyen bir sayıdır, bu nedenle bir sayı ile ne yapacağının komik görünmesini bilmek çok zordur (örneğin, çok yüksek veya çok düşük). Bu şeyleri anlamanın en iyi yolu onları orijinal ölçeklerinden (log) anlayabileceğinize, özellikle olasılıklara dönüştürmektir. Bunu yapmak için, logitinizi alıp üssünüz. Bu,
e sayısını (
) alıp
logit'in gücüne yükselttiğiniz anlamına gelir .
Logitinizin 2 olduğunu düşünün:
e 2 = 7.389056
Bu size oranları verecektir. Oranları bir artı ikiye bölerek olasılıkları bir olasılığa dönüştürebilirsiniz:
7.389056e ≈ 2.718281828
e2= 7.389056
İnsanlar genellikle olasılıkla başa
çıkmayıçok daha kolay buluyor.
7.3890561 + 7.389056= 0.880797
Modeliniz için, tüm değişkenlerinizin değerinin tam olarak 0 olduğu bir gözleminiz olduğunu, ardından tüm katsayılarınızın düşeceğini ve yalnızca kesişme değerinizle kalacağınızı düşünün. Biz değerini exponentiate, biz oran olacağını, bu -700 olsaydı (oranlarda olarak 0 olsun ama -1060 bana bir değer vermek için bilgisayarımı alamayan, bu çok küçük yazılımımın sayısal sınırları göz önüne alındığında). Bu olasılıkları bir olasılığa dönüştürmek, ( 0 / ( 1 + 0 )9,8 × 10- 3050 / ( 1 + 0 )), bize tekrar 0 verir. Böylece, çıktınızın size söylediği şey, tüm değişkenleriniz 0'a eşit olduğunda etkinliğinizin (her ne olursa olsun) gerçekleşmemesi. bu. Standart bir lojistik regresyon denklemi (örneğin, kare bir terim olmadan) zorunlu olarak, bir değişken ve başarı olasılığı arasındaki ilişkinin monoton olarak arttığını veya monoton olarak azaldığını varsayar.. Bu, her zaman daha büyük ve daha büyük (veya daha küçük ve daha küçük) hale geldiği anlamına gelir ve bu nedenle, bir yönde yeterince ilerlerseniz, bilgisayarımın 0'dan ayrı söyleyemeyeceği kadar küçük sayılara ulaşırsınız. canavarın doğası. Olduğu gibi, modeliniz için, çok ileri gitmek, değişken değerlerinizin 0'a eşit olduğu yere gider.
0 katsayısına gelince, bu değişkenin önerdiğiniz gibi bir etkisi olmadığı anlamına gelir. Şimdi, bir değişkenin bir etkisi olmayacaktır, yine de, temelde asla tam olarak 0 katsayısı elde edemezsiniz. Bu durumda neden oluştuğunu bilmiyorum; yorumlar bazı olası öneriler sunar. Başka bir teklif verebilirim, yani bu değişkente herhangi bir değişiklik olmayabilir. Örneğin, seks kodlayan bir değişkeniniz varsa, ancak sadece örneğinizdeki kadınlar. Bunun gerçek cevap olup olmadığını bilmiyorum (örneğin, R, NA
bu durumda döner , ancak yazılım farklıdır) - sadece başka bir öneri.