Log bağlantılı Gama GLM vs log bağlantılı Gauss GLM vs log dönüştürülmüş LM


13

Sonuçlarımdan, GLM Gamma'nın çoğu varsayımı karşıladığı anlaşılıyor, ancak log dönüştürülmüş LM'ye göre önemli bir gelişme mi? Çoğu literatür Poisson ya da Binom GLM'leri ile uğraştı. RANDOMİZASYONU KULLANARAK GENELLEŞTİRİLMİŞ LİNEER MODEL VARSAYIMLARININ DEĞERLENDİRİLMESİ makalesini çok yararlı buldum , ancak karar vermek için kullanılan gerçek grafiklerden yoksundur. Umarım deneyimi olan biri beni doğru yöne yönlendirebilir.

Dağıtımı aşağıda çizilen yanıt değişkenim T'nin dağılımını modellemek istiyorum. Gördüğünüz gibi, bu olumlu çarpıklık geçerli:
Geçerli XHTML.

Dikkate almam gereken iki kategorik faktör var: METH ve CASEPART.
Bu çalışmanın esas olarak keşifçi olduğunu, bir modeli teorikleştirmeden ve etrafında DoE gerçekleştirmeden önce bir pilot çalışma olarak hizmet ettiğini unutmayın.

Teşhis çizimleri ile R'de aşağıdaki modeller var:

LM.LOG<-lm(log10(T)~factor(METH)+factor(CASEPART),data=tdat)

Geçerli XHTML
Geçerli XHTML

GLM.GAMMA<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="Gamma"(link='log'))

Geçerli XHTML
Geçerli XHTML

GLM.GAUS<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="gaussian"(link='log'))

Geçerli XHTML
Geçerli XHTML

Ayrıca, artıklarda Shapiro-Wilks testi ile aşağıdaki P değerlerine ulaştım:

LM.LOG: 2.347e-11  
GLM.GAMMA: 0.6288  
GLM.GAUS:  0.6288  

AIC ve BIC değerlerini hesapladım, ancak doğruysam, GLM'ler / LM'deki farklı aileler nedeniyle bana fazla bir şey söylemiyorlar.

Ayrıca, aşırı değerleri not ettim, ancak net bir "özel neden" olmadığı için bunları aykırı olarak sınıflandıramıyorum.



1
Her üç modelin de bir regresördeki artışın tipik yanıttaki göreceli bir değişiklikle ilişkili olması açısından çarpıcı olduğunu belirtmek gerekir. İki log-lineer GLM için "tipik" aritmetik ortalama anlamına gelirken, log-dönüştürülmüş LM için geometrik araçlardan bahsediyoruz. Bu nedenle, etkileri ve tahminleri yorumlamak istediğiniz yol, sadece mükemmel artık grafiklere sahip olmakla kalmaz, aynı zamanda model seçimi için de itici bir faktördür (bunlar yine de veriye dayalıdır).
Michael M

@MichaelMayer - Yanıt için teşekkürler, çok yararlı. Seçimin yorumu nasıl etkilediğini biraz daha genişletebilir misiniz? Yoksa beni referans yönüne mi yönlendiriyorsun?
TLJ

@ Marcinthebox- Göndermeden önce bu soruyu inceledim. Soruma çok kısaca cevap vermiyor.
TLJ

Yanıtlar:


19

Gaussian'a log-lineer uyum oldukça açıktır; kalıntılarda güçlü heteroskedastisite vardır. Öyleyse bunu dikkate alalım.

Geriye kalan lognormal ve gama.

histogramının doğrudan kullanımı olmadığına dikkat edin, çünkü marjinal dağılım değişkenlerin bir karışımı olacaktır (her biri öngörücüler için farklı bir değer kümesinde koşullandırılmıştır); iki modelden biri doğru olsa bile, bu grafik koşullu dağılım gibi görünmeyebilir.T

Her iki model de bu durumda hemen hemen eşit derecede uygun görünüyor. Her ikisinin de ortalamanın karesiyle orantılı bir varyansı vardır, bu nedenle artıklara uyum için yayılma modeli benzerdir.

Düşük bir aykırı değer bir gama ile lognormalden biraz daha iyi uyum sağlar (yüksek aykırı değer için tersi). Belirli bir ortalama ve varyansta, lognormal daha eğimlidir ve daha yüksek bir varyasyon katsayısına sahiptir.

Hatırlanması gereken bir şey, lognormal beklentisinin ; ortalamaya ilgi duyuyorsanız, sadece günlük ölçeği uyumunu üstlenemezsiniz. Gerçekten de, ortalamayla ilgileniyorsanız, gama lognormal ile ilgili bir takım sorunları önler (örneğin lognormalde parametre belirsizliği ekledikten sonra, log-t dağılımına dayalı bir tahmininiz olur. Tahmin aralıkları hala iyi çalışıyor, ancak bu ortalamanın tahmin edilmesi için bir sorun olabilir.exp(μ)σ2

İlgili bazı tartışmalar için buraya ve buraya bakınız .


1
@Gleb_b bu cevap analizim için çok faydalı. Bir kaç sorum var. (1) Birincisi, bu 'İkisinin de ortalamaya karsıyla orantılı varyansı var mı?' (2) Ve bu 'düşük bir aykırı bir gamma ile biraz daha iyi uyuyor mu? Belirli bir ortalama ve varyansta, ...' qq grafiğine dayanıyor mu? (3) Anladığım kadarıyla glm (örn. Gama, poisson ve negatif binom), artıkların normalliği ve varyans homojenliği varsayımına sahip değildir. Eğer öyleyse, artık ve normal qq grafiğine karşı artıkların planlanması teşhis için uygun olabilir?
tatami

2
Bu tamamen yeni bir soru ya da gerçekten birkaç (çoğu zaten sitemizde cevaplandı!) - modelin bir parçası olacak kadar geniştir. 2. Hayır, bunlar dağılımlar hakkında genel gerçeklerdir. 3. Normal olmadıklarını düzeltin, ancak QQ grafiğinde kullanılan kalıntılar (dahili olarak öğrenci) sapma kalıntılarıdır - özellikle gama durumunda - genellikle normal dağılıma çok yakın olma eğilimindedir (nedenini açıklayan bir cevap yazdım) bir nokta) ve esasen sabit bir varyansa sahip olmalıdır. Normallikten biraz sapma beklenmedik değil, önemli sapma ...
ctd

2
ctd ... normalden (diğer parsellerin iyi olduğu varsayılarak) dağıtım varsayımıyla ilgili bir sorun olduğunu gösterebilir.
Glen_b
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.