Poisson GLM sonuçlarında parametre tahminleri nasıl yorumlanır [kapalı]


14
Call:
glm(formula = darters ~ river + pH + temp, family = poisson, data = darterData)

Deviance Residuals:
    Min      1Q   Median     3Q    Max
-3.7422 -1.0257   0.0027 0.7169 3.5347

Coefficients:
              Estimate Std.Error z value Pr(>|z|)
(Intercept)   3.144257  0.218646  14.381  < 2e-16 ***
riverWatauga -0.049016  0.051548  -0.951  0.34166
pH            0.086460  0.029821   2.899  0.00374 **
temp         -0.059667  0.009149  -6.522  6.95e-11 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for poisson family taken to be 1)
Null deviance: 233.68 on 99 degrees of freedom
Residual deviance: 187.74 on 96 degrees of freedom
AIC: 648.21

Yukarıdaki tabloda her bir parametre tahmininin nasıl yorumlanacağını bilmek istiyorum.



6
Bu soru konu dışı gibi görünmektedir çünkü bir R çıktısını herhangi bir akıllı soru olmadan açıklamakla ilgilidir. Bu "Bilgisayar çıktımı oraya döktüm ve benim için stat analizini çalıştırıyorsun" kategorisidir ...
Xi'an

1
Dispersiyon parametreniz, modelinizde bazı sorunlar olduğunu gösteriyor gibi görünüyor. Bunun yerine bir quasipoisson dağılımı kullanmayı düşünmelisiniz. Bahse girerim parametre tahminleriniz büyük ölçüde değişecek ve yorum da değişecektir. Eğer "komplo (model)" çalıştırırsanız, kalıntılarınızın bazı grafiklerini alırsınız, gerçek modelinizi yorumlamaya başlamadan önce bu desenlere istenmeyen desenler için bir göz atın. Modelinizin uyumunu hızlı bir şekilde çizmek için visreg paketinden "visreg (modelfit)" kullanabilirsiniz
Robbie

3
@ Xi'an, soru seyrek ve gerekli düzenleme olmasına rağmen, konu dışı olduğunu düşünmüyorum. Konu dışı sayılmaz bu soruları göz önünde bulundurun: R'ın lm yorumlanması () çıktısı , ve binom regresyon için R'ın çıktı yorumlanması . Ancak yineleniyor gibi görünüyor .
gung - Monica'yı eski

2
Bu, Poisson regresyonundaki katsayılar nasıl yorumlanır? Lütfen bağlantılı konuyu okuyun. Bunu okuduktan sonra hala bir sorunuz varsa, buraya geri dönün ve öğrendiklerinizi ve hala bilmeniz gerekeni belirtmek için sorunuzu düzenleyin, daha sonra yardım etmeyen başka bir yerde malzemeyi çoğaltmadan ihtiyacınız olan bilgileri sağlayabiliriz sen.
gung - Monica'yı eski

Yanıtlar:


28

Sorunuzun başlığının, ne istediğinizi doğru bir şekilde yakaladığını düşünmüyorum.

GLM'deki parametrelerin nasıl yorumlanacağı sorusu çok geniştir çünkü GLM çok geniş bir model sınıfıdır. Bir GLM'nin üstel aileden bilinen bir dağılımı takip ettiği varsayılan yanıt değişkenini modellediğini ve ters çevrilebilir bir fonksiyon seçtiğimizi hatırlayın için öngörücü değişkenleri . Bu modelde, herhangi bir parametresinin yorumlanması , nin göre . tanımlayınyg

E[y|x]=g1(x0+x1β1++xJβJ)
Jxβjg(y)xjμE[y|x]=g1(x)ve gösterimi temiz tutmak için . Ardından, , Şimdi tanımlamak bir vektör olarak sıfır ve tek bir içinde , inci pozisyon bu nedenle örneğin eğer , sonra . Sonra ηxβj{1,,J}
βj=ηxj=g(μ)xj.
ejJ11jJ=5e3=(0,0,1,0,0)
βj=g(E[y|x+ej])g(E[y|x])

Hangi sadece araçlar üzerindeki etkisidir bir birim artış .βjηxj

şu şekilde de ifade edebilirsiniz: ve

E[y|x]xj=μxj=dμdηηxj=μηβj=dg1dηβj
E[y|x+ej]E[y|x]Δjy^=g1((x+ej)β)g1(xβ)

hakkında hiçbir şey bilmeden alabildiğimiz kadarıyla. üzerindeki etkisi transforme koşullu ortalama üzerinde, bir birim artış, ve koşullu ortalama etkisi bir birim artış olan .gβjηyxjyxjg1(β)


Ama R'nin varsayılan bağlantı işlevini kullanarak Poisson regresyonunu özellikle soruyorsunuz, ki bu durumda doğal logaritma. Bu durumda, ve olan belirli bir GLM türünü soruyorsunuz . Sonra belirli bir yorum konusunda biraz çekiş yapabiliriz.yPoisson(λ)g=ln

Yukarıda söylediğimden, . Ve bildiğimiz için, olduğunu da biliyoruz . Ayrıca verdiğini biliyorum , diyebiliriz ki μxj=dg1dηβjg(μ)=ln(μ)g1(η)=eηdeηdη=eη

μxj=E[y|x]xj=ex0+x1β1++xJβJβj

Sonunda somut bir şey anlamına gelir:

Çok küçük bir değişiklik göz önüne alındığında , monte tarafından değişiklikler .xjy^y^βj

Not: Bu yaklaşım, ne kadar hassasiyete ihtiyacınız olduğuna bağlı olarak, 0.2 kadar büyük değişiklikler için gerçekten işe yarayabilir.

Ve daha bilindik birim değişiklik yorumunu kullanarak: olan araçlar

Δjy^=ex0+x1β1++(xj+1)βj++xJβJex0+x1β1++xJβJ=ex0+x1β1++xJβJ+βjex0+x1β1++xJβJ=ex0+x1β1++xJβJejβex0+x1β1++xJβJ=ex0+x1β1++xJβJ(ejβ1)

Bir birim değişiklikten dolayı , monte tarafından değişiklikler .y y ( E β j - 1 )xjy^y^(ejβ1)

Burada dikkat edilmesi gereken üç önemli parça vardır:

  1. Öngörücülerdeki bir değişikliğin etkisi, yanıt düzeyine bağlıdır.
  2. Öngörücülerdeki ilave bir değişikliğin yanıt üzerinde çarpma etkisi vardır.
  3. Katsayıları sadece okuyarak yorumlayamazsınız (kafanızda keyfi üstel değerleri hesaplayamazsanız).

Yani örnekte, 1 artarak pH etkisi artırmaktır tarafından ; yani ile çarpılır . Sonuç, sabit bir zaman diliminde (örneğin, bir hafta) gözlemlediğiniz dart sayısıdır. Yani haftada 100 ok da 6,7 ​​pH'da gözlemliyorsanız, nehrin pH'ını 7,7'ye yükseltmek artık haftada 109 dart görmeyi bekleyebileceğiniz anlamına geliyor.lny^ y e0.091.09y^(e0.091) y^e0.091.09


Burada birkaç değişiklik yaptım, @ ssdecontrol. Sanırım yayınınızı takip etmeyi biraz daha kolaylaştıracaklar, ancak beğenmediyseniz özür dilerim.
gung - Monica'yı eski

Cevabımdan anlayamıyorum o zaman cevabı açıkça gözden geçirmem gerekiyor. Hala neyle ilgili kafan karıştı?
shadowtalker

Doğrusal regresyondaki gibi bu sayıları denkleme takın
shadowtalker 14:14

1
@skan no, yani . ve , tek bir gözlemi temsil eden rasgele değişkenlerdir. , endekslenmiş bir vektördür ; , bu gözlem için belirli bir özelliği / regresörü / girişi / öngörücüyü temsil eden rasgele değişkendir. x y x j x jE[y|x]xyxjxj
shadowtalker

2
Ve fazla düşünmeyin. Bir GLM'deki tüm parçaları anladıktan sonra, buradaki manipülasyonlar sadece matematik ilkelerinin doğrudan bir uygulamasıdır. İlgilendiğiniz değişkene göre türevi almak kadar basit.
shadowtalker

3

Benim önerim, iki nehrin birleşiminden ve ortak değişkenlerin her birinin iki veya üç değerinden oluşan küçük bir ızgara oluşturmak, ardından predictişlevi ızgara ile birlikte kullanmak olacaktır newdata. Sonra sonuçları grafiğe alın. Modelin gerçekte öngördüğü değerlere bakmak çok daha açıktır. Tahminleri orijinal ölçüm ölçeğine ( type = "response") geri dönüştürmek isteyebilir veya istemeyebilirsiniz .


1
Bu yaklaşımı sevdiğim kadar (her zaman yaparım) Sanırım bina anlayışı için verimsiz.
shadowtalker
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.