Ofsetleri olan Poisson rasgele efekt modellerinde aşırı dağılım ve modelleme alternatifleri


12

Denek içi bir deney kullanarak deneysel araştırmalardan elde edilen sayım verilerini modellerken bir dizi pratik soru ile karşılaştım. Denemeyi, verileri ve şimdiye kadar yaptığım şeyleri kısaca açıklıyorum, ardından sorularımı takip ediyorum.

Katılımcıların bir örneğine sırayla dört farklı film gösterildi. Her filmden sonra, RQ (tahmin edilen sayım değişkeni) için ilgi çekici olan belirli ifadelerin tekrarlama sayısını saydığımız bir röportaj gerçekleştirildi. Ayrıca olası en fazla sayıda olayı da kodladık (kodlama birimleri; ofset değişkeni). Ek olarak, filmlerin çeşitli özellikleri sürekli bir ölçekte ölçüldü, bunlardan biri için film özelliğinin, diğerleri kontrol ederken ifade sayısı üzerindeki etkisinin nedensel bir hipotezine sahibiz (tahmin ediciler).

Şimdiye kadar benimsenen modelleme stratejisi aşağıdaki gibidir:

Rastgele bir etki tahmin edin, nedensel değişkenin ortak değişken olarak ve diğer değişkenlerin kontrol ortak değişkenleri olarak kullanıldığı Poisson modeli. Bu modelin 'log (birimler)' e (kodlama birimleri) eşit bir ofseti vardır. Nesneler arasında rastgele efektler alınır (konulara filme özgü sayımlar yerleştirilir). Nedensel hipotezi doğruladık (nedensel değişkenin sig katsayısı). Tahminlerde R'de lme4 paketini, özellikle glmer fonksiyonunu kullandık.

Şimdi aşağıdaki sorularım var. Poisson regresyonunda yaygın bir sorun aşırı dağılımdır. Bunun negatif bir binom regresyonu kullanılarak test edilebileceğini ve dağılım parametresinin basit bir Poisson modelinin model uyumunu geliştirip geliştirmediğini değerlendirerek biliyorum. Ancak, bunu rastgele bir etki bağlamında nasıl yapacağımı bilmiyorum.

  • Durumumda aşırı dağılım için nasıl test yapmalıyım? Ben nasıl sığacağımı biliyorum basit bir Poisson / negatif binom regresyon (rastgele etkileri olmadan) aşırı dağılım test. Test aşırı dispersiyonun varlığını düşündürmektedir. Ancak bu modeller kümelemeyi dikkate almadığı için bu testin yanlış olduğunu düşünüyorum. Ayrıca aşırı dağılım testleri için ofsetin rolü hakkında emin değilim.
  • Negatif bir binom rastgele etki regresyon modeli gibi bir şey var mı ve R'ye nasıl uymalıyım?
  • Veriler üzerinde denemem gereken alternatif modeller için önerileriniz var mı, yani tekrarlanan ölçüm yapısını, değişkenleri ve pozlamayı (kodlama birimleri) dikkate alarak?

1
yeni başlayanlar için glmm.wikidot.com/faq adresindeki
Ben Bolker

1
Teşekkürler, çok yardımcı! Belki birileri bu ve diğer bilgilerden bir cevap derlemek ister.
tomka

Yanıtlar:


1

[0,)

Yararlı bir cevaba yol açmayı garanti etmeyen aşırı dağılmayı kontrol etmek yerine ve dağılımı ölçmek için dağılım indekslerini inceleyebilse de, uygun bir kalite aramasının ayrı bir dağıtım seçeneğini kullanarak en iyi dağılımı aramanızı daha yararlı öneririm. Mathematica'nın FindDistribution rutini gibi. Bu tür bir arama, bilinen dağılımın / dağıtımların yalnızca aşırı dağılmayı azaltmak için değil, aynı zamanda diğer bir çok veri özelliğini, örneğin bir düzine ölçülen uyum iyiliğini daha yararlı bir şekilde modellemek için en iyi şekilde çalıştığı şeyleri tahmin etmek için oldukça kapsamlı bir iş yapar. Farklı yollar.

Ayrıca benim aday dağılımlarını incelemek için, ben ederim hoc sonrası incelemek artığı homoscedasticity kontrol etmek ve / veya dağıtım türü ve ayrıca aday dağılımları verilerin fiziksel bir açıklama tekabül olarak mutabık kılınabilir olmadığını düşünün. Bu prosedürün tehlikesi, genişletilmiş bir veri kümesinin en iyi modellemesi ile tutarsız bir dağılımı tanımlamaktır. Bir post hoc prosedürü yapmama tehlikesi, uygun bir test (çöp çöpü dışında) olmadan önceden seçilmiş bir dağıtım atamaktır. Post hoc'un üstünlüğüyaklaşım, montaj hatalarını sınırlaması ve zayıflığıdır, yani birçok dağıtımın denenmesi ile modelleme hatalarını saf şansla azımsayabilir. O zaman, artıkları incelemek ve fizikselliği düşünmek için sebep budur. Yukarıdan aşağıya veya a priori yaklaşım, mantıklılık konusunda böyle bir post hoc kontrol sunmaz. Yani, modellemenin fizikselliğini farklı dağılımlarla karşılaştırmanın tek yöntemi post hoc karşılaştırmaktır. Böylece fizik teorisinin doğası ortaya çıkar, yorucu alternatif açıklamalar olarak kabul etmeden önce birçok deneyle verilerin varsayımsal bir açıklamasını test ederiz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.