bağlam
Bu soru R kullanır, ancak genel istatistiksel konularla ilgilidir.
Ölüm faktörlerinin (hastalık ve parazitliğe bağlı ölüm yüzdesi) zaman içinde güve popülasyonu büyüme hızı üzerindeki etkilerini analiz ediyorum, burada larva popülasyonları 8 yıl boyunca yılda bir kez 12 bölgeden örneklendi. Nüfus artış hızı verileri zaman içinde net fakat düzensiz döngüsel bir eğilim gösterir.
Basit bir genelleştirilmiş doğrusal modelden (büyüme oranı ~% hastalık +% parazitizm + yıl) kalıntılar, zaman içinde benzer şekilde açık ama düzensiz döngüsel bir eğilim göstermiştir. Bu nedenle, aynı formdaki genelleştirilmiş en küçük kareler modelleri, zamansal otokorelasyon, örneğin bileşik simetrisi, otoregresif işlem sırası 1 ve otoregresif hareketli ortalama korelasyon yapıları ile başa çıkmak için uygun korelasyon yapılarına sahip verilere de bağlanmıştır.
Modellerin tümü aynı sabit etkileri içerir, AIC kullanılarak karşılaştırılır ve REML tarafından takılır (farklı korelasyon yapılarının AIC ile karşılaştırılmasına izin vermek için). R paket nlme ve gls işlevini kullanıyorum.
Soru 1
GLS modellerinin kalıntıları, zamana karşı çizildiğinde hala neredeyse aynı çevrimsel kalıplar sergilemektedir. Otokorelasyon yapısını doğru bir şekilde açıklayan modellerde bile bu tür kalıplar her zaman kalacak mı?
İkinci sorumun altındaki R'de bazı basitleştirilmiş ama benzer veriler simüle ettim, bu da, şimdi yanlış olduğunu bildiğim model artıklarında geçici olarak otokorelasyonlu modelleri değerlendirmek için gerekli yöntemleri anladığım gerçeğe dayanan sorunu gösteriyor (cevaba bakınız).
soru 2
Verilerime olası tüm olası korelasyon yapıları ile GLS modelleri taktım, ancak hiçbiri herhangi bir korelasyon yapısı olmadan GLM'den daha iyi uymuyor: sadece bir GLS modeli marjinal olarak daha iyi (AIC puanı = 1.8 daha düşük), daha yüksek AIC değerleri. Bununla birlikte, bu sadece tüm modellerin GLS modellerinin açıkça daha iyi olduğu ML değil REML tarafından takıldığı durumdur, ancak istatistik kitaplarından, REML'yi sadece farklı korelasyon yapılarına ve aynı sabit etkilere sahip modelleri nedenlerle karşılaştırmak için kullanmanız gerektiğini anlıyorum. Burada detay vermeyeceğim.
Verilerin açıkça geçici olarak otokorelasyonlu doğası göz önüne alındığında, hiçbir model basit GLM'den orta derecede daha iyi değilse, uygun bir yöntem kullandığımı varsayarak, hangi modelin çıkarım için kullanılacağına karar vermenin en uygun yolu nedir (sonunda kullanmak istiyorum) Farklı değişken kombinasyonlarını karşılaştırmak için AIC)?
Uygun korelasyon yapıları olan ve olmayan modellerde kalan kalıpları araştıran Q1 'simülasyonu'
'Zaman'ın döngüsel etkisi ve' x'in pozitif doğrusal etkisi ile simüle edilmiş yanıt değişkeni oluşturun:
time <- 1:50
x <- sample(rep(1:25,each=2),50)
y <- rnorm(50,5,5) + (5 + 15*sin(2*pi*time/25)) + (x/1)
y, 'zaman' üzerinde rasgele değişikliklerle döngüsel bir eğilim göstermelidir:
plot(time,y)
Ve rastgele varyasyon ile 'x' ile pozitif doğrusal bir ilişki:
plot(x,y)
"Y ~ time + x" için basit bir doğrusal katkı modeli oluşturun:
require(nlme)
m1 <- gls(y ~ time + x, method="REML")
Model, 'zamana' karşı çizildiğinde, beklendiği gibi, artıklarda net döngüsel desenler gösterir:
plot(time, m1$residuals)
Ve 'x' ile işaretlendiğinde artıklarda herhangi bir model veya eğilimin güzel, net olmaması ne olmalıdır:
plot(x, m1$residuals)
AIC kullanılarak değerlendirildiğinde, 1. siparişin otoregresif korelasyon yapısını içeren basit bir "y ~ time + x" modeli, otokorelasyon yapısı nedeniyle verilere önceki modele göre çok daha iyi uymalıdır:
m2 <- gls(y ~ time + x, correlation = corAR1(form=~time), method="REML")
AIC(m1,m2)
Bununla birlikte, model yine de hemen hemen aynı 'geçici olarak' otokorelasyonlu kalıntıları göstermelidir:
plot(time, m2$residuals)
Herhangi bir tavsiye için çok teşekkür ederim.