Denek içi bir deney kullanarak deneysel araştırmalardan elde edilen sayım verilerini modellerken bir dizi pratik soru ile karşılaştım. Denemeyi, verileri ve şimdiye kadar yaptığım şeyleri kısaca açıklıyorum, ardından sorularımı takip ediyorum.
Katılımcıların bir örneğine sırayla dört farklı film gösterildi. Her filmden sonra, RQ (tahmin edilen sayım değişkeni) için ilgi çekici olan belirli ifadelerin tekrarlama sayısını saydığımız bir röportaj gerçekleştirildi. Ayrıca olası en fazla sayıda olayı da kodladık (kodlama birimleri; ofset değişkeni). Ek olarak, filmlerin çeşitli özellikleri sürekli bir ölçekte ölçüldü, bunlardan biri için film özelliğinin, diğerleri kontrol ederken ifade sayısı üzerindeki etkisinin nedensel bir hipotezine sahibiz (tahmin ediciler).
Şimdiye kadar benimsenen modelleme stratejisi aşağıdaki gibidir:
Rastgele bir etki tahmin edin, nedensel değişkenin ortak değişken olarak ve diğer değişkenlerin kontrol ortak değişkenleri olarak kullanıldığı Poisson modeli. Bu modelin 'log (birimler)' e (kodlama birimleri) eşit bir ofseti vardır. Nesneler arasında rastgele efektler alınır (konulara filme özgü sayımlar yerleştirilir). Nedensel hipotezi doğruladık (nedensel değişkenin sig katsayısı). Tahminlerde R'de lme4 paketini, özellikle glmer fonksiyonunu kullandık.
Şimdi aşağıdaki sorularım var. Poisson regresyonunda yaygın bir sorun aşırı dağılımdır. Bunun negatif bir binom regresyonu kullanılarak test edilebileceğini ve dağılım parametresinin basit bir Poisson modelinin model uyumunu geliştirip geliştirmediğini değerlendirerek biliyorum. Ancak, bunu rastgele bir etki bağlamında nasıl yapacağımı bilmiyorum.
- Durumumda aşırı dağılım için nasıl test yapmalıyım? Ben nasıl sığacağımı biliyorum basit bir Poisson / negatif binom regresyon (rastgele etkileri olmadan) aşırı dağılım test. Test aşırı dispersiyonun varlığını düşündürmektedir. Ancak bu modeller kümelemeyi dikkate almadığı için bu testin yanlış olduğunu düşünüyorum. Ayrıca aşırı dağılım testleri için ofsetin rolü hakkında emin değilim.
- Negatif bir binom rastgele etki regresyon modeli gibi bir şey var mı ve R'ye nasıl uymalıyım?
- Veriler üzerinde denemem gereken alternatif modeller için önerileriniz var mı, yani tekrarlanan ölçüm yapısını, değişkenleri ve pozlamayı (kodlama birimleri) dikkate alarak?