Glm modelleri için rezidüel teşhis grafiklerini yorumlamak?


33

Glm modellerinin kalıntı grafiklerini nasıl yorumlayacağınıza ilişkin kılavuzlar arıyorum. Özellikle poisson, negatif binom, binom modelleri. Modeller "doğru" olduğunda bu alanlardan ne bekleyebiliriz? (örneğin, bir Poisson modeliyle uğraşırken, öngörülen değer arttıkça varyansın artmasını bekliyoruz)

Cevapların modellere bağlı olduğunu biliyorum. Herhangi bir referans (veya dikkate alınması gereken genel hususlar) yardımcı / takdir edilecektir.

Yanıtlar:


16

Bunun regresyon analizi yaparken en zorlu kısımlardan biri olduğunu düşünüyorum. Ayrıca yorumların çoğuyla da mücadele ediyorum (özellikle binom teşhisi delilik!).

Ben sadece bu yazı tökezledi http://www.r-bloggers.com/model-validation-interpreting-residual-plots/ kim http://statmaster.sdu.dk/courses/st111/module04/index.html bağladı # SECTION00020000000000000000

Bana en çok yardımcı olan, kalıntıları, dahil edilen VE modele dahil edilmeyen her tahmin parametresine göre çizmek. Bu, aynı zamanda çoklu doğrusallık nedenlerinden dolayı önceden düşürülmüş olanları da ifade eder. Bu kutular için, koşullu dağılım alanları ve normal dağılım alanları harikadır. bu olası hataları tespit etmeye yardımcı olur

"R ile Orman Analitiği" (UseR Serisi) 'de karışık etki modelleri (ve glms de) için kalıntıların nasıl yorumlanacağı iyi bir açıklamadır. İyi okuma! http://www.springer.com/statistics/life+sciences,+medicine+%26+health/book/978-1-4419-7761-8

Bir gün önce, kullanıcıların "tamam" ve "tamam değil" olarak oylayabilecekleri kalıntı kalıpları toplayabilecek bir web sitesi hakkında düşündüm. ama bu web sitesini hiç bulamadım;)


8

Burada açıklanan yöntemleri önerebilirim:

 Buja, A., Cook, D. Hofmann, H., Lawrence, M. Lee, E.-K., Swayne,
 D.F and Wickham, H. (2009) Statistical Inference for exploratory
 data analysis and model diagnostics Phil. Trans. R. Soc. A 2009
 367, 4361-4383 doi: 10.1098/rsta.2009.0120

Birkaç farklı fikir var, ancak çoğunlukla gerçek ilişkinin ne olduğunu bildiğiniz ve bu ilişkinin gerçek veri analizinize dayandığı verileri simüle etmeye geliyorlar. Ardından, teşhisi gerçek verilerinizden, simüle edilmiş veri setlerinin teşhisi ile karşılaştırın. vis.testR TeachingDemos paketinde işlev kağıt önerilerin 1 bir varyasyonunu uygular. Daha iyi bir anlayış için makalenin tamamını (sadece kısa özetimden değil) okuyun.


Bunun dağınık veya diğer parsellerde rastgele sapan kalıpları görmek için iyi bir öneri olduğunu düşünüyorum, ancak artıkları görüntülerken tek amaç bu değil. Sıklıkla rastgele sapmalarla ilgileniriz (örneğin; güvenlik önlemleri, modelde hatalı belirtilen doğrusallık, ihmal edilen değişkenler, aykırı değerler veya yüksek kaldıraç değerleri vb.). Rastgele oluşturulan verilere yapılan karşılaştırmalar, artıkların neden rastgele olmadığının veya çözüm yolunun belirlenmesinde hiçbir şekilde yardımcı olmuyor.
Andy W,

@AndyW, sanırım asıl soruyu farklı yorumluyoruz. Cevabım, araştırmacının aramaya ihtiyaç duyduğu bir şey olup olmadığını veya artık arsanın makul olup olmadığını öğrenmelerini sağlayarak başlar. Makul görünmüyorsa ne yapmalı, bir sonraki adım ve cevabımın ötesinde (bazı ek varsayımlar yeni bir simülasyon kümesi kullanılarak karşılaştırılabilir).
Greg Snow,

5

Bu soru oldukça eski, ancak yakın zamanda herhangi bir GL (M) M'nin kalıntılarını standart bir alana dönüştürmek için DHARMa R paketini kullanabileceğinizi eklemek faydalı olacağını düşündüm . Bu yapıldıktan sonra, dağılımdan sapma, bir tahminciye artık bağımlılık, heteroskedastisite veya otokorelasyon gibi kalıntı problemlerini normal şekilde görsel olarak değerlendirebilir / test edebilirsiniz. Üzerinde çalışılan örnekler ve ayrıca burada ve burada CV ile ilgili diğer sorular için paket skeçine bakın .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.