Poisson regresyonundaki katsayılar nasıl yorumlanır?


64

Poisson regresyonundaki ana etkileri (yapay kodlanmış faktör katsayıları) nasıl yorumlayabilirim?

Aşağıdaki örneği varsayın:

treatment     <- factor(rep(c(1, 2), c(43, 41)), 
                        levels = c(1, 2),
                        labels = c("placebo", "treated"))
improved      <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)),
                        levels = c(1, 2, 3),
                        labels = c("none", "some", "marked"))    
numberofdrugs <- rpois(84, 10) + 1    
healthvalue   <- rpois(84, 5)   
y             <- data.frame(healthvalue, numberofdrugs, treatment, improved)
test          <- glm(healthvalue~numberofdrugs+treatment+improved, y, family=poisson)
summary(test)

Çıktı:

Coefficients:
                 Estimate Std. Error z value Pr(>|z|)    
(Intercept)       1.88955    0.19243   9.819   <2e-16 ***
numberofdrugs    -0.02303    0.01624  -1.418    0.156    
treatmenttreated -0.01271    0.10861  -0.117    0.907   MAIN EFFECT  
improvedsome     -0.13541    0.14674  -0.923    0.356   MAIN EFFECT 
improvedmarke    -0.10839    0.12212  -0.888    0.375   MAIN EFFECT 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Ben vaka hız biliyoruz numberofdrugsolduğunu exp(-0.023)=0.977. Fakat kukla değişkenlerin temel etkilerini nasıl yorumlayabilirim?


Benzer bir cevap (ancak daha matematiksel çerçeveli) burada bulunabilir: Poisson GLM sonuçlarında parametre tahminleri nasıl yorumlanır .
gung - Monica'yı yeniden yerleştirme

Başvurulan sorunun konu dışı olarak kapatılması ilginçtir. (Konu dışı olduğu konusunda hemfikir değildim, çünkü herhangi bir cevap kullanıcıya bir katsayı tablosu veren herhangi bir istatistik programının çıktısı için de geçerli olacak ve bunun temelde yaklaştığı konusunda hemfikir olacaktı. Bir kopyasının olması.) Bana göre SO topluluğu, R'den gelen çıktıların yorumlanmasını isteyen sorular üzerinde çok "sıkı" dır. Kodlama yardımına ihtiyaç duyduğuna dair herhangi bir öneri olmadığı için StackOverflow için gerçekten konuyla ilgili değillerdir.
DW '

@DWin, istatistiksel çıktının yorumlanmasının Çapraz Doğrulama'da konu dışı olduğunu sanmıyorum . Bu soruyu, bunun bir kopyası olarak kapatmak için oy kullandım. Diğerleri OT'ye oy veriyor gibi görünüyor, topladım, çünkü onlara OP "bilgisayar çıktısını oraya attı ve [birinin] stat analizini [onlar] için yapmasını umuyordum" gibi görünüyordu.
gung - Reinstate Monica

1
@gung: OT olarak adlandıran sen değildin. Yorumlarınız o noktada açıktı. (Sizinle aynı fikirde olduğumu sanıyordum.) Yakın oylamada listelenen "sebep" çoğu zaman çoğunluk veya çoğulculuk kararıdır.
DWin

Yanıtlar:


56

Exponentiated numberofdrugskatsayı Çarpımsal vadeli tahmini hesaplamak için kullanmaktır healthvaluezaman numberofdrugs1 birimi tarafından artar. Kategorik (faktör) değişkenler durumunda, üstelleştirilmiş katsayı, bu değişken için baz (birinci faktör) seviyesine göre çarpımsal terimdir (R, varsayılan olarak tedavi kontrastlarını kullandığından). exp(Intercept)Bazal oranıdır ve diğer tüm tahminler buna göreceli olacaktır.

healthvalueÖrneğinizde, 2uyuşturucu kullanan biri için tahmini "placebo"ve improvement=="none"olacaktır (exp içindeki çarpımı eşdeğeri olarak kullanmak):

 exp( 1.88955 + 2*-0.02303 + 0 + 0 )
 [1] 6.318552

Birisi iken 4ilaçlar, "treated"ve "some"gelişme olurdu tahminen healthvaluearasında

exp( 1.88955 + 4*-0.02303 + -0.01271 + -0.13541)
[1] 5.203388

EK: Bu, "kütük ölçeğinde katkı" olduğu anlamına gelir. "Log-odds skalasındaki katkı maddesi", öğretmenim Barbara McKnight'ın, herhangi bir tahmin yaparken, lojistik regresyonda uygulanan tüm terim katsayılarını kullanma ihtiyacını vurgularken kullandığı ifadesiydi. Önce tüm katsayılar çarpı değişken değerlerini eklersiniz, sonra üstelleşirsiniz. Katsayıları R'deki regresyon nesnelerinden döndürmenin yolu genellikle coef()ekstraktör işlevini kullanmaktır (aşağıda farklı bir rasgele gerçekleştirme ile yapılır):

 coef(test)
  #   (Intercept)    numberofdrugs treatmenttreated     improvedsome   improvedmarked 
  #   1.18561313       0.03272109       0.05544510      -0.09295549       0.06248684 

Yani özne için tahmini hesaplama 4ilaçlar, "treated"birlikte "some"iyileşme olacaktır:

 exp( sum( coef(test)[ c(1,2,3,4) ]* c(1,4,1,1) ) ) 
 [1] 3.592999

Ve bu durum için doğrusal tahmin: toplamı olmalıdır

 coef(test)[c(1,2,3,4)]*c(1,4,1,1) 
 #    (Intercept)    numberofdrugs treatmenttreated     improvedsome 
 #     1.18561313       0.13088438       0.05544510      -0.09295549

Bu ilkeler, kullanıcıya bir katsayı tablosu döndüren herhangi bir istatistik paketine uygulanmalıdır. Yöntem ve ilkeler, benim R kullanmamdan ortaya çıkabileceğinden daha genel.


Varsayılan ekranda 'kaybolduklarından' seçilen açıklamaları kopyalıyorum:

S: Yani katsayıları oranlar olarak yorumluyorsunuz! Teşekkür ederim! - MarkDollar

Y: Katsayılar, oranların doğal_lojistleridir. - DWin

S2: Bu durumda, bir poisson regresyonunda, üstelleştirilmiş katsayılar “oran oranları” olarak da adlandırılıyor mu? - oort

A2: Hayır. Eğer lojistik regresyon olsaydı, bunlar LHS'nin olayların sayısı ve örtülü payda risk altındaki sayı olduğu Poisson regresyonunda olsaydı, üstelik katsayılar "oran oranları" ya da "nispi riskler" olur.


Yani iki kez oy vermene izin verdi mi? Ne kadar güzel. Bir R kodu önerisinin yorumlamanın uygulanmasının onu sınıflandırma hassasiyetinden kurtardığını düşündüm. OP, kendi kendine yeten bir örnek oluşturdu. Belki bir çıkarıcı işlevi göstermeliydim, sanırım yapacağım.
DW '

Evet, SO'ya verdiğiniz yanıtı artırdım, sonra buraya taşındı ve tekrar kazandım :)
Brandon Bertelsen

Şimdiye kadar teşekkürler! Aptallar ve süvariler arasındaki gerçekliği biliyorum, ama sadece Ana etkileri nasıl yorumlayacağımla ilgileniyorum (onları işaretledim). Örneğin, tedavi edilen 'exp (-0.012) = 0.99' için bir Ana etkiden sicim oranını almak ve referans kategorisinden işleme alındığında, iyileştirme değerinin düştüğü oran olarak yorumlamak mümkün müdür? Olmalı, değil mi?
MarkDollar

Açıklanan katsayılar her zaman oranlar olarak yorumlanır. 'Neyin' 'neyin' oranları, analiz birimlerine bağlıdır. 'Oranlar' farklı bir rakam ve zaman değerine sahip. . Eğer "evet", belki o zaman, terminoloji değiştirmek için istekli olup olmadığını Yani iyi cevaplar tamamen analiz durumu anlatan gelir.
DWin

Ah tamam, bilmek istediğim şey bu. Yani katsayıları oranlar olarak yorumluyorsunuz! Teşekkür ederim!
MarkDollar
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.