Sapma bir GLM konseptidir, ZIP ve ZINB modelleri glm değildir, ancak GLM olan sonlu dağılım karışımları olarak formüle edilir ve bu nedenle EM algoritması ile kolayca çözülebilir.
Bu notlar sapma teorisini kısaca açıklar. Bu notları okursanız, Poisson regresyonu için doymuş modelin log-olasılık olduğuna dair kanıt görürsünüz.
ℓ ( λs) = ∑i = 1 , ∀ yben≠ 0n[ ybenl o g( yben) - yben- l o g( yben! ) ]
eklenti tahminlerinden edilen .yben= λ^ben
Şimdi ZIP olasılığına devam edeceğim çünkü matematik daha basit, ZINB için benzer sonuçlar var. Ne yazık ki ZIP için Poisson gibi basit bir ilişki yoktur. inci gözlemler log-olabilirlik olduğunuben
ℓben( ϕ , λ ) = Zbenlo g( ϕ + ( 1 - ϕ ) e- λ) + ( 1 - Zben) [ - λ + ybenlo g( λ ) - l o g(yben! ) ] .
böylece wrt kısmi türevleri almak gerekiyordu bu çözmek için uyulmaması hem ve , 0 denklemleri ayarlayın ve sonra için çözmek ve . Buradaki zorluk vardır değerleri, bunlar geçebiliriz veya içine ve gözlemleyerek olmadan mümkün değildir koymak için hangi içine gözlemler. Ancak, değerini bilseydik bir ZIP modeline ihtiyacımız olmazdı çünkü eksik verilerimiz olmazdı. Gözlenen veriler EM formalizmindeki "tam veri" olasılığına karşılık gelir. λ cp λ cp y i = 0 λZbenλφλφyben= 0λ^ Zıyi=0, Zıφ^Zbenyi=0Zi
Makul olabilecek bir yaklaşım , tam veri günlüğü olasılığının beklentisi ile çalışmak , kaldıran ve bir beklentiyle yer değiştiren ile çalışmaktır. EM algoritmasının en son güncellemelerle hesapladığı kısmın (E adımı) bir kısmı. sapmaya karşı bu yaklaşımı inceleyen literatürden habersizim .E ( ℓ i ( ϕ , λ ) ) Z i e x p e c t e dZiE(ℓi(ϕ,λ))Ziexpected
Ayrıca, önce bu soru soruldu, bu yazıyı cevapladım. Bununla birlikte, aynı konu hakkında Gordon Smyth'in güzel bir yorumu ile başka bir soru daha var:
sıfır şişirilmiş bileşik poisson modeli için sapma
, aynı yanıttan bahsettiği sürekli veri (R) (bu, ben yapacağım yorumun bir detayıdır söylemek) artı diğer yazıya yorumlarda bahsettikleri okumak isteyebilirsiniz. (sorumluluk reddi, atıfta bulunulan makaleyi okumadım)