Genelleştirilmiş doğrusal modelleri aşırı dağılmış olabilir veya olmayabilir saymak veri bazı kümeleri uydurmaya çalışıyorum. Burada geçerli olan iki kanonik dağılım, EV ve varyans ile Poisson ve Negatif Binom (Negbin)
glm(..,family=poisson)
ve glm.nb(...)
sırasıyla R kullanılarak takılabilir . quasipoisson
Anladığım kadarıyla aynı EV ve varyans ile ayarlanmış bir Poisson olan aile de var
,
yani Poisson ve Negbin arasında bir yere düşmek. Quasipoisson ailesi ile ilgili temel sorun, bunun için uygun bir olasılık olmaması ve bu nedenle çok fazla istatistiksel test ve uyum önleminin (AIC, LR vb.) Bulunmamasıdır.
QP ve Negbin varyanslarını karşılaştırırsanız, \ phi = 1 + \ frac {\ mu} {\ theta} koyarak bunları eşitleyebileceğinizi fark edebilirsiniz . Bu mantığa devam ederek, quasipoisson dağılımını Negbin'in özel bir örneği olarak ifade etmeye çalışabilirsiniz:
,
yani lineer olarak bağımlı \ mu olan bir Negbin . Yukarıdaki formüle göre rastgele bir sayı dizisi oluşturarak ve bunu ile uyarak bu fikri doğrulamaya çalıştım glm
:
#fix parameters
phi = 3
a = 1/50
b = 3
x = 1:100
#generating points according to an exp-linear curve
#this way the default log-link recovers the same parameters for comparison
mu = exp(a*x+b)
y = rnbinom(n = length(mu), mu = mu, size = mu/(phi-1)) #random negbin generator
#fit a generalized linear model y = f(x)
glmQP = glm(y~x, family=quasipoisson) #quasipoisson
glmNB = glm.nb(y~x) #negative binomial
> glmQP
Call: glm(formula = y ~ x, family = quasipoisson)
Coefficients:
(Intercept) x
3.11257 0.01854
(Dispersion parameter for quasipoisson family taken to be 3.613573)
Degrees of Freedom: 99 Total (i.e. Null); 98 Residual
Null Deviance: 2097
Residual Deviance: 356.8 AIC: NA
> glmNB
Call: glm.nb(formula = y ~ x, init.theta = 23.36389741, link = log)
Coefficients:
(Intercept) x
3.10182 0.01873
Degrees of Freedom: 99 Total (i.e. Null); 98 Residual
Null Deviance: 578.1
Residual Deviance: 107.8 AIC: 824.7
Her ikisi de parametreleri yeniden üretir ve quasipoisson \ phi için 'makul' bir tahmin verir . Artık quasipoisson için bir AIC değeri de tanımlayabiliriz:
df = 3 # three model parameters: a,b, and phi
phi.fit = 3.613573 #fitted phi value copied from summary(glmQP)
mu.fit = glmQP$fitted.values
#dnbinom = negbin density, log=T returns log probabilities
AIC = 2*df - 2*sum(dnbinom(y, mu=mu.fit, size = mu.fit/(phi.fit - 1), log=T))
> AIC
[1] 819.329
( Nesnede bulamadığım için, değerini el ile kopyalamak zorunda kaldım )summary(glmQP)
glmQP
Yana , bu quasipoisson, tahmin edileceği üzere, daha iyi bir uyum olduğuna işaret edecek; en azından yapması gerekeni yapar ve bu nedenle bir quasipoisson'un AIC'si (ve buna bağlı olarak olasılıkla) için makul bir tanım olabilir. O zaman bana bırakılan büyük sorular A I C Q P
- Bu fikir mantıklı mı? Doğrulamam döngüsel muhakemeye mi dayanıyor?
- İyi kurulmuş bir konudan eksik görünen bir şeyi 'icat eden' herkes için ana soru: eğer bu fikir mantıklıysa, neden zaten uygulanmamıştır
glm
?
Düzenleme: şekil eklendi