Bir iş arkadaşı, bazı kötü Heteroscedasticity ile tezi için bazı biyolojik verileri analiz ediyor (aşağıdaki şekil). Karma bir modelle analiz ediyor, ancak artıklarla sorun yaşıyor.
Yanıt değişkenlerinin log dönüştürülmesi işleri temizler ve bu soruya verilen geri bildirimlere dayanarak bu uygun bir yaklaşım gibi görünmektedir. Bununla birlikte, başlangıçta, dönüştürülmüş değişkenleri karma modellerle kullanma konusunda sorunlar olduğunu düşünmüştük. Littell & Milliken'in (2006) Karışık Modeller için SAS'ta sayım verilerini dönüştürmenin ve sonra normal bir doğrusal karışık modelle analiz etmenin neden uygun olmadığını gösteren bir ifadeyi yanlış yorumladığımız ortaya çıkıyor (tam teklif aşağıdadır) .
Kalıntıları da geliştiren bir yaklaşım, Poisson dağılımına sahip genelleştirilmiş doğrusal bir model kullanmaktı. Poisson dağılımının sürekli verileri modellemek için kullanılabileceğini (örneğin, bu yayında tartışıldığı gibi ) okudum ve istatistik paketleri buna izin veriyor, ancak model uygun olduğunda neler olduğunu anlamıyorum.
Temel hesaplamaların nasıl yapıldığını anlamak amacıyla, sorularım: Sürekli verilere bir Poisson dağılımı yerleştirdiğinizde, 1) veriler en yakın tam sayıya yuvarlanır mı 2) bu, bilgi kaybına ve 3) Sürekli veriler için bir Poisson modeli kullanmak ne zaman mümkün olur?
Littel & Milliken 2006, s. 529 "[sayım] verilerinin dönüştürülmesi verimsiz olabilir. Örneğin, bir dönüşüm rasgele model efektlerinin dağılımını veya modelin doğrusallığını bozabilir. Sonuç olarak, dönüştürülmüş veri kullanan karma bir modelden çıkarım oldukça şüphelidir. "