Lojistik regresyon katsayılarının analizi


12

İşte lojistik regresyon katsayılarının bir listesi (birincisi bir engeldir)

-1059.61966694592
-1.23890500515482
-8.57185269220438
-7.50413155570413
 0
 1.03152408392552
 1.19874787949191
-4.88083274930613
-5.77172565873336
-1.00610998453393

Kesişimin bu kadar düşük olduğunu garip buluyorum ve aslında 0'a eşit bir katsayım var. Bunu nasıl yorumlayacağımdan tam olarak emin değilim. 0, belirli değişkenin model üzerinde hiçbir etkisi olmadığını gösteriyor mu? Ama birinin sütununu girerek yapılan kesme aniden gerçekten önemli midir? Yoksa verilerim sadece saçmalık ve model buna tam olarak uymuyor.


2
Diğer değişkenlerinizin aralığı veya standart sapması nedir? Değişkenin sıfır tahmini ile standart sapması arasında diğerlerine göre büyük bir fark var mı? Standart sapma diğerlerine göre küçükse sıfır katsayısı bekleyebilirsiniz (sayısal hassasiyet). Ayrıca kesme, temel olarak büyük ortalamalara (sıfırdan uzağa) sahip değişkenleriniz olduğu anlamına gelir. Değişkenlerinizi ortalamak daha yorumlanabilir bir kesişme sağlar ve diğer değişkenlerin betalarını değiştirmez (yinelemeli algoritma hatası bir yana).
olasılık

1
Eğer altıncı değişkenin tüm değerlerinden 1027 çıkarırsanız, kesişim 0'a oldukça yakın olurdu. Bu sizi daha iyi hissettirir mi? :-)
whuber

4
Bu gibi katsayıların bir listesini göstermek, hiçbir bağlam olmadan, muhtemelen "Joe'nun 31'i var, bu çok değil mi?" 31 ne demeden . 31 otomobil? Çok. 31 çocuk? Bir sürü şey! 31 dolar mı? Fazla değil.
Peter Flom - Monica'yı eski durumuna döndürün

1
Sıfır katsayısıyla ilgili olarak: Bunun gerçekleştiğini, tüm katsayılarınızı buraya yapıştırmadan önce XL'ye koymanın bir artefaktı olarak görebiliyordum - genellikle gördüğümüz çok sayıda ondalık basamakla tutarlı görünen bir şey. Belki bu XL hücrelerden biri tamsayıya yuvarlanarak sıfır vermiştir. Bunun gibi şeyler oldu.
rolando2 10:12

Katkılarınız için hepinize teşekkürler! Her birinize gerçekten minnettarım! Sorularımın çoğu cevaplandı
shiu6rewgu

Yanıtlar:


16

Bence yorumlarda çok iyi bilgiler alıyorsunuz. Lojistik regresyon ile ilgili bazı temel gerçeklerin bu şeyleri daha anlaşılır hale getirip getirmeyeceğini merak ediyorum, bu yüzden bunu aklımda tutarak birkaç şeyi açıklayayım. Lojistik regresyonda katsayılar lojistik ölçekte (dolayısıyla isim ...). Bir gözlem için ortak değişken değerlerinizi eklerseniz, katsayılarla çarpıp toplarsanız , bir logit elde edersiniz .

lojit=β0+β1x1+β2x2+...+βkxk
Bir logit, kimseye sezgisel bir anlam vermeyen bir sayıdır, bu nedenle bir sayı ile ne yapacağının komik görünmesini bilmek çok zordur (örneğin, çok yüksek veya çok düşük). Bu şeyleri anlamanın en iyi yolu onları orijinal ölçeklerinden (log) anlayabileceğinize, özellikle olasılıklara dönüştürmektir. Bunu yapmak için, logitinizi alıp üssünüz. Bu, e sayısını ( ) alıp logit'in gücüne yükselttiğiniz anlamına gelir . Logitinizin 2 olduğunu düşünün: e 2 = 7.389056 Bu size oranları verecektir. Oranları bir artı ikiye bölerek olasılıkları bir olasılığa dönüştürebilirsiniz: 7.389056e2,718281828
e2=7.389056
İnsanlar genellikle olasılıkla başaçıkmayıçok daha kolay buluyor.
7.3890561+7.389056=0.880797

Modeliniz için, tüm değişkenlerinizin değerinin tam olarak 0 olduğu bir gözleminiz olduğunu, ardından tüm katsayılarınızın düşeceğini ve yalnızca kesişme değerinizle kalacağınızı düşünün. Biz değerini exponentiate, biz oran olacağını, bu -700 olsaydı (oranlarda olarak 0 olsun ama -1060 bana bir değer vermek için bilgisayarımı alamayan, bu çok küçük yazılımımın sayısal sınırları göz önüne alındığında). Bu olasılıkları bir olasılığa dönüştürmek, ( 0 / ( 1 + 0 )9.8x10-3050/(1+0)), bize tekrar 0 verir. Böylece, çıktınızın size söylediği şey, tüm değişkenleriniz 0'a eşit olduğunda etkinliğinizin (her ne olursa olsun) gerçekleşmemesi. bu. Standart bir lojistik regresyon denklemi (örneğin, kare bir terim olmadan) zorunlu olarak, bir değişken ve başarı olasılığı arasındaki ilişkinin monoton olarak arttığını veya monoton olarak azaldığını varsayar.. Bu, her zaman daha büyük ve daha büyük (veya daha küçük ve daha küçük) hale geldiği anlamına gelir ve bu nedenle, bir yönde yeterince ilerlerseniz, bilgisayarımın 0'dan ayrı söyleyemeyeceği kadar küçük sayılara ulaşırsınız. canavarın doğası. Olduğu gibi, modeliniz için, çok ileri gitmek, değişken değerlerinizin 0'a eşit olduğu yere gider.

0 katsayısına gelince, bu değişkenin önerdiğiniz gibi bir etkisi olmadığı anlamına gelir. Şimdi, bir değişkenin bir etkisi olmayacaktır, yine de, temelde asla tam olarak 0 katsayısı elde edemezsiniz. Bu durumda neden oluştuğunu bilmiyorum; yorumlar bazı olası öneriler sunar. Başka bir teklif verebilirim, yani bu değişkente herhangi bir değişiklik olmayabilir. Örneğin, seks kodlayan bir değişkeniniz varsa, ancak sadece örneğinizdeki kadınlar. Bunun gerçek cevap olup olmadığını bilmiyorum (örneğin, R, NAbu durumda döner , ancak yazılım farklıdır) - sadece başka bir öneri.


2
Doğal günlük oranlarını çarparak on baz oranlarını elde edebileceğinizi unutmayın30670037-46010-460

10

Kesişimin yorumlanması

Lojistik regresyonu size '1' olmanın posterior olasılığını vermek olarak düşünebilirsiniz. Kesişme, veri kümesinden türetilen kategoriler üzerinde bir önceliği temsil eder: özellikle, modelin yalnızca kesişmesi olduğunda log (p (Y = 1) / p (Y = 0) 'nın ampirik tahminidir. kategorik eş değişkenler olduğunda ve eş değişkenlerin daha genel olarak 0 olduğu (ancak daha az yorumlanabilir) durumlarda 'referans' sınıflarıdır.Bu nedenle, güçlü negatif numaranız muhtemelen '1'lerin, Yine, hiçbir gözlem olmayabilir, bu yüzden kesişme değeri konusunda endişelenmeye değmez.Bu tartışma oldukça açıktır.

Endişelerin parametreler arasında bu kullanışlı şekilde ayrılması nedeniyle, daha iyi dengelenmiş bir örnek üzerinde eğitim alarak ve sadece kesmeyi ayarlayarak kategori dengesizliğini düzeltebilirsiniz . Ayrıntılı bir tartışma için King ve Zeng'e bakınız .


"Bu tartışma" ile bağlantı kopmuş gibi görünüyor. Bu bağlantıyı kurtarma şansınız var mı?
Alexey Grigorev

1
@ alexey-grigorev UCLA bağlantısını güncelledim
conjugateprior

... ve bir aşağı oy aldı. Çok tuhaf.
konjugateprior
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.