Lojistik regresyonda basit tahminlerin odds oranlarına yorumlanması


29

Lojistik regresyon kullanmaya biraz yeni geldim ve biraz da aynı olacağını düşündüğüm aşağıdaki değerleri yorumlamam arasındaki tutarsızlıkla karıştırdım:

  • üstelleştirilmiş beta değerleri
  • Beta değerleri kullanılarak sonucun tahmini olasılığı.

Beslenme ve sigortanın hem ikili hem de servetin sürekli olduğu, kullandığım modelin basitleştirilmiş bir versiyonu:

Under.Nutrition ~ insurance + wealth

(Gerçek) modelim, sigorta için 88’lik beta değeri döndürüyor.

"Sigortalı bir birey için yetersiz beslenilme olasılığı, sigortasız bir birey için yetersiz beslenme olasılığının 0,8 katıdır."

Bununla birlikte, bireyler için olasılık farkını 0 ve 1 değerlerini sigorta değişkenine ve ortalama servet değerini koyarak hesapladığımda beslenme yetersizliğindeki fark sadece .04. Bu şu şekilde hesaplanır:

Probability Undernourished = exp(β0 + β1*Insurance + β2*Wealth) /
                             (1+exp(β0 + β1*Insurance + β2*wealth))

Birisi bu değerlerin neden farklı olduğunu ve daha iyi bir yorumlamanın (özellikle ikinci değer için) ne olabileceğini açıklayabilirse gerçekten çok sevinirim.


Diğer Açıklama Düzenlemeleri
Anladığım kadarıyla, sigortasız bir kişi için yetersiz beslenebilme olasılığı (B1'in sigortaya karşılık geldiği yer):

Prob(Unins) = exp(β0 + β1*0 + β2*Wealth) /
              (1+exp(β0 + β1*0+ β2*wealth))

Sigortalı bir kişi için yeterince beslenmeme olasılığı:

Prob(Ins)= exp(β0 + β1*1 + β2*Wealth) /
           (1+exp(β0 + β1*1+ β2*wealth))

Sigortasız bir kişiye, sigortalı bir kişiye göre yetersiz beslenilme olasılığı:

exp(B1)

Bu değerler arasında (matematiksel olarak) çeviri yapmanın bir yolu var mı? Hala bu denklemden biraz kafam karıştı (muhtemelen RHS'de farklı bir değer olmalıyım):

Prob(Ins) - Prob(Unins) != exp(B)

Layman'ın ifadesiyle, soru, bir bireyin sigorta oranının, oran oranının gösterdiği kadar yetersiz beslenebilme olasılığını değiştirmemesidir. Verilerimde Prob (Ins) - Prob (Unins) = .04, üsteleştirilmiş beta değeri .8 (neden bu kadar fark olmasın ?2?)


2
Bu harika ve net açıklamalar logistik lojistik modellere / regresyonlara uygulanabilir mi?

Yanıtlar:


50

Bana aşikar görünüyor ki sürece . Bu yüzden, kargaşanın ne olabileceği konusunda daha az net olacağım. Ne diyebilirim (değil) eşittir işaretinin sol taraftaki (LHS) olmasıdır oran RHS ise, yetersiz beslenen olma ihtimali yetersiz beslenen olma. Kendi başına incelendiğinde, olduğu olasılık oranı Eğer oran (hareket etmesine olanak çarpımsal bir faktördür, oran (kadar) ). exp(β0+β1x)=0exp(β1)xx+1

exp(β0+β1x)exp(β0+β1x)1+exp(β0+β1x)
exp(β0+β1x)=0exp(β1)xx+1

Ek / farklı bilgilere ihtiyaç duyarsanız bana bildirin.

Güncelleme:
Bence bu çoğunlukla olasılıklar ve olasılıklarla aşina olmamanız ve birbirleriyle olan ilişkileriyle ilgili bir mesele. Bunların hiçbiri çok sezgisel değil, bir süre oturup oturup onunla konuşmayı öğrenmelisin ; hiç kimseye doğal gelmiyor.

Mesele şu ki, mutlak sayıların kendi başlarına yorumlamaları çok zor. Diyelim ki, bir madalyonun olduğu bir zamandan bahsetmiştim ve bunun adil olup olmadığını merak ettim. Bu yüzden biraz çevirdim ve 6 kafa aldım. Bu ne anlama geliyor? 6 çok, biraz, doğru mu? Söylemesi çok zor. Bu konuyla ilgilenmek için sayılara bir miktar bağlam vermek istiyoruz. Böyle bir durumda, ihtiyaç duyulan bağlamın nasıl sağlanacağına dair iki bariz seçenek vardır: toplam yazı sayısını verebilirim ya da yazı sayısını verebilirim. Her iki durumda da, 6 kafanın anlaşılması için yeterli bilgiye sahipsiniz ve size söylemişti, tercih ettiğiniz kişi olmasaydı, diğer değeri hesaplayabilirsiniz. Olasılık, toplam etkinlik sayısına bölünen kafa sayısıdır. Oran, kafa sayısının sayı sayısına oranıdır.kafasız (sezgisel olarak, bu durumda çalışan kuyruk sayısını söylemek istiyoruz, ancak 2'den fazla olasılık varsa). Her iki sayı da, örneğin 4-5 olabilir. Muhtemel, uzun vadede, her 5 kez olmamak için 4 kez bir şey olacağı anlamına gelir. Bahis oranları bu şekilde sunulduğunda, " Las Vegas bahis oranları " denir . Bununla birlikte istatistiklerde, standartlaştırma amacıyla genellikle bölünerek oranların 0,8 olduğunu (yani 4/5 = .8) söylüyoruz. Olasılıklar ve olasılıklar arasında da dönüşüm yapabiliriz:

olasılık=olasılık1+olasılık                olasılık=olasılık1-olasılık
(Bu formüllerle, oranların en üstte LHS olduğunu ve olasılıkta RHS olduğunu kabul etmek zor olabilir, ancak bunun ortada işarete eşit olmadığını unutmayın .) Bir oran oranı , sadece bölünmüş bir şeyin oranlarıdır. başka bir şeyin olasılığı; Lojistik regresyon bağlamında, her bir , diğerleri eşit tutulduğunda, ilgili değişkenlerin ardışık değerleri için oran oranıdır. exp(β)

Bu denklemlerin hepsinden tanımak önemli olan, olasılıkların, olasılıkların ve oran oranlarının herhangi bir şekilde eşit olmamasıdır; olasılık .04 kadar gider sırf çok mu değil oran veya olasılık oranı .04 böyle bir şey olması gerektiğini ima! Ayrıca, olasılıklar değişirken, olasılıklar (ham lojistik regresyon denkleminin çıktısı) arasında değişebilir ve oranlar ve oranlar arasında değişebilir. . Bu son kısım hayati öneme sahiptir: Sınırlı olasılık aralığı nedeniyle, olasılıklar doğrusal değildir , ancak olasılıklar doğrusal olabilir. Bu, örneğin (olduğu gibi)[0,1](-,+)(0,+)wealthSabit artışlarla artar, yetersiz beslenme olasılığı değişken miktarlarda artacaktır, ancak oran sabit bir miktar artacaktır ve oran sabit çarpımsal bir faktörle artacaktır. Lojistik regresyon modelinizde verilen herhangi bir değer kümesi için, bazı belirli ve , ama başka her yerde eşit olmayacak. xx

exp(β0+β1x)-exp(β0+β1x')=exp(β0+β1x)1+exp(β0+β1x)-exp(β0+β1x')1+exp(β0+β1x')
xx'

(Her ne kadar farklı bir soru bağlamında yazılmış olsa da, buradaki cevabım LR'yi ve ilgili meseleleri daha iyi anlamanıza yardımcı olabilecek lojistik regresyon hakkında birçok bilgi içermektedir.)


Cevap için teşekkürler - yukarıdaki düzenleme ile ilgili kafamdaki karışıklığı daha da açıkladım.
mike

Tam bir açıklama yazmak için zaman ayırdığınız için çok teşekkür ederiz - çok yardımcı oldu.
mike

Bir şey değil, Mike, CV bunun için.
gung - Reinstate Monica

The Las Vegas oran bağlantısı: Vegas'ta hiç bulunmadım, ancak Vegas tabanlı siteler tarafından sunulan bazı fiyatları araştırırken, fraksiyonel oranlar (para hattının aksine) teklif ettikleri bazı yerlerde, İngilizlerin "karşı oranlar" sistemini takip ediyorlar. istatistiksel "lehte oranlar". Bu nedenle, bağlantınızdaki "Las Vegas bahis oranları", "9'dan 1'e" kadar olası bir olay için değil, ("9'dan 1'e kadar bir istatistikçi için anlamına gelir) olası bir olay değil! Bir karışıklık kaynağı burada ele almaya çalışıyorum
Silverfish

@ Silverfish, uzun zamandır Las Vegas'a gitmedim. Tipik olarak oranlarını veya oranlarını listelediklerini hatırlamıyorum. Bununla birlikte, '4 ila 5' Las Vegas oran denir .
dediklerinin - Eski Monica


-1

Olasılık oranı OR = Exp (b) Olasılık A = SQRT (OR) / (SQRT (OR) +1) anlamına gelir; burada Olasılık A, A olayının olasılığıdır ve OR, gerçekleşen olayın oranıdır / A olayının gerçekleşmemesi oranıdır (veya Yukarıdaki sorudaki gibi sigortaya maruz kalmış / maruz kalmamış). Çözmem biraz zaman aldı; Bunun iyi bilinen bir formül olmadığından emin değilim.

Bir örnek var. Farz edelim ki, üniversiteye kabul edilen 10 kişi var; Bunlardan 7'si erkektir. Bu nedenle, her erkek için kabul edilme olasılığı% 70'dir. Erkekler için kabul edilecek oranlar 7/3 = 2.33 ve kabul edilmemeler 3/7 = 0.43. Olasılık oranı (OR) 2,33 / 0,43 = 5,44, bu da erkekler için 5,44 kat daha fazla şans kadınlar için kabul edilme anlamına geliyor. OR için insan için kabul edilme olasılığını bulalım: P = SQRT (5.44) / (SQRT (5.44) +1) = 0.7

Güncelleme Bu, yalnızca kabul edilen erkek veya kadın sayısı başvuru sayısına eşitse geçerlidir. Başka bir deyişle, OR değildir. Olasılık kazancını (ya da kaybını) ek bilgi bilmeden faktöre bağlı olduğunu bulamıyoruz.


7232

Evet, kesinlikle haklısın, teşekkür ederim. Bilinen VEYA'yı (örneğin, lojistik regresyon çıktısı olarak elde ettiğimiz) önceki olasılıklar hakkında bilgi bilmeden kazanım veya kayıplara dönüştüremeyeceğimizi tespit ettim. Güncelleme cevabımı koydum.
Niksr
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.