Zaten günlük dönüştürülmüş bir DV'de LOG bağlantı işlevi ile GLM normal dağıtımını kullanabilir miyim?
Evet; varsayımlar bu ölçekte tatmin edildiyse
Varyans homojenliği testi normal dağılım kullanılarak gerekçelendirmek için yeterli mi?
Neden varyans eşitliği normallik anlamına gelir?
Kalan kontrol prosedürü, link fonksiyon modelini seçmeyi haklı göstermek için doğru mu?
Varsayımlarınızın uygunluğunu kontrol etmek için hem histogramları hem de uyum iyiliği testlerini kullanmaya dikkat etmelisiniz:
1) Normalliği değerlendirmek için histogramı kullanmaya dikkat edin . (Ayrıca buraya bakın )
Kısacası, binwidth seçiminizde küçük bir değişiklik kadar basit bir şeye, hatta sadece bin sınırının bulunduğu yere bağlı olarak, verilerin şeklinin oldukça farklı izlenimlerini elde etmek mümkündür:
Aynı veri kümesinin iki histogramı. İzlenimin buna duyarlı olup olmadığını görmek için birkaç farklı binwidth kullanmak yararlı olabilir.
2) Normallik varsayımının makul olduğu sonucuna varmak için uyum iyiliği testlerini kullanmaya dikkat edin. Biçimsel hipotez testleri gerçekten doğru soruyu cevaplamaz.
örneğin, 2. madde altındaki bağlantılara bakın . burada
Varyans hakkında, benzer veri kümeleri kullanan bazı makalelerde bahsedildi "çünkü dağılımlar homojen varyanslara sahipti, çünkü Gauss dağılımına sahip bir GLM kullanıldı." Bu doğru değilse, dağıtımı nasıl doğrulayabilir veya karar verebilirim?
Normal koşullarda, soru 'hatalarım (veya koşullu dağılımlar) normal mi?' - olmayacaklar, kontrol etmemiz bile gerekmiyor. Daha alakalı bir soru 'mevcut olan normal olmayanlık derecesi çıkarımlarımı ne kadar kötü etkiliyor?'
Bir çekirdek yoğunluğu tahmini veya normal QQplot (kalıntıların grafiği ve normal skorlar) öneririm. Dağılım makul derecede normal görünüyorsa, endişelenecek çok az şeyiniz var. Aslında, açıkça normal olmadığında bile , ne yapmak istediğinize bağlı olarak hala çok önemli olmayabilir (normal tahmin aralıkları gerçekten normalliğe dayanır, ancak diğer birçok şey büyük örnek boyutlarında çalışma eğiliminde olacaktır )
Büyük örneklerde, normallik genellikle daha az ve daha az önemli hale gelir (yukarıda belirtildiği gibi PI'lerin dışında), ancak normalliği reddetme yeteneğiniz gittikçe artar.
Düzenleme: Varyans eşitliği nokta gerçekten olmasıdır olabilir hatta büyük bir örneklem boyutlarında, senin çıkarımlar etkileyebilir. Ama muhtemelen bunu hipotez testleriyle de değerlendirmemelisiniz. Varyans varsayımını yanlış yapmak, varsayılan dağıtımınız ne olursa olsun bir sorundur.
İyi uyum için model için ölçekli sapmanın Np civarında olması gerektiğini okudum değil mi?
Normal bir model taktığınızda bir ölçek parametresi vardır, bu durumda dağılımınız normal olmasa bile ölçek sapması Np hakkında olacaktır.
sizce log link ile normal dağılım iyi bir seçimdir
Neyi ölçtüğünüzü veya neyin çıkarımını kullandığınızı bilmenin devam etmesine rağmen, GLM için başka bir dağıtım önerip önermediğinizi veya çıkarımlarınız için ne kadar önemli olabileceğini yargılayamıyorum.
Bununla birlikte, diğer varsayımlarınız da makulse (doğrusallık ve varyans eşitliği en azından kontrol edilmeli ve potansiyel bağımlılık kaynakları göz önünde bulundurulmalıdır), çoğu durumda CI'leri kullanmak ve katsayılar veya kontrastlar üzerinde testler yapmak gibi şeyler yapmaktan çok rahat olurum - bu kalıntılarda, gerçek bir etki olsa bile, bu tür çıkarımlar üzerinde önemli bir etkisi olmaması gereken çok az bir çarpıklık izlenimi vardır.
Kısacası, iyi olmalısın.
(Başka bir dağıtım ve bağlantı fonksiyonu iken olabilir onlar da daha mantıklı edebilecekleri tek kısıtlı koşullarda, uyum açısından daha iyi bir az şey yapın.)