Hesaplama Nakagawa ve Schielzeth en (2013) R2glmm yöntemi kullanarak karışık modellerinde


13

Karışık modellerde değerlerini hesaplama hakkında okuyordum ve R-sig SSS'sini okuduktan sonra, bu forumdaki diğer yayınlar (birkaçını bağlayacağım, ancak yeterli itibarım yok) ve kullandığım diğer referansları anladım Karışık modeller bağlamında değerleri karmaşıktır.R 2R2R2

Ancak, yakın zamanda bu iki makaleye rastladım. Bu yöntemler umut verici görünse de (bana göre) bir istatistikçi değilim ve bu nedenle başkalarının önerdikleri yöntemler ve önerilen diğer yöntemlerle nasıl karşılaştırılacağı hakkında bir fikir olup olmayacağını merak ediyordum.

Nakagawa, Shinichi ve Holger Schielzeth. "Genelleştirilmiş doğrusal karma efekt modellerinden R2 elde etmek için genel ve basit bir yöntem." Ekoloji ve Evrimde Yöntemler 4.2 (2013): 133-142.

Johnson, Paul CD'si. "Nakagawa ve Schielzeth'in R2GLMM'sinin rastgele yamaç modellerine genişletilmesi." Ekoloji ve Evrim Yöntemleri (2014).

İs yöntemi, MuMIn paketindeki yöntemin aşağıdaki açıklamasını veren r.squaredGLMM işlevi kullanılarak da uygulanabilir .

Karışık efektli modeller için iki tipte kategorize edilebilir. Marjinal sabit faktörlerle açıklanan varyansı temsil eder ve şu şekilde tanımlanır: Koşullu , hem sabit hem de rastgele faktörlerle (yani tüm model) açıklanan varyans olarak yorumlanır ve denklemine göre hesaplanır. burada sabit efekt bileşenlerinin varyansıdır ve tüm varyans bileşenlerinin (grup, bireysel vb.) ,R 2R2R2

RGLMM(m)2=σf2σf2+(σl2)+σe2+σd2
R2
RGLMM(c)2=(σf2+(σl2))(σf2+(σl2)+σe2+σd2
σf2(σl2)σl2ek dispersiyona bağlı varyans ve dağılıma özgü varyanstır. σd2

Analizimde uzunlamasına verilere bakıyorum ve öncelikle modeldeki sabit etkilerle açıklanan varyansla ilgileniyorum

library(MuMIn) 
library(lme4)

fm1 <- lmer(zglobcog ~ age_c + gender_R2 + ibphdtdep + iyeareducc + apoegeno + age_c*apoegeno + (age_c | pathid), data = dat, REML = FALSE, control = lmerControl(optimizer = "Nelder_Mead"))

# Jarret Byrnes (correlation between the fitted and the observed values)
r2.corr.mer <- function(m) {
   lmfit <-  lm(model.response(model.frame(m)) ~ fitted(m))
   summary(lmfit)$r.squared
}

r2.corr.mer(fm1)
[1] 0.8857005

# Xu 2003
1-var(residuals(fm1))/(var(model.response(model.frame(fm1))))
[1] 0.8783479

# Nakagawa & Schielzeth's (2013)
r.squaredGLMM(fm1)
      R2m       R2c 
0.1778225 0.8099395 

Yayınınızı mathjax biçimlendirmesini kullanacak şekilde düzenledim. Lütfen yanlışlıkla herhangi bir hata tanımadığımı tekrar kontrol edin.
Sycorax, Reinstate Monica'yı

Sorunuz anladığım kadarıyla gerçek bir sorudan yoksun. Ne istediğini açıklayabilir misin? Ne kullanacağınıza dair bir öneri?
Henrik

Merhaba @Henrik, ne kullanacağım konusunda bir öneriyle ilgileniyordum, evet, ama aynı zamanda farklı yöntemlerin birbirleriyle nasıl karşılaştırıldığı ve farklılıkların ne olduğu hakkında daha geniş bir ilgiyle ilgilendim.
Andrews

Orijinal ve yukarıdaki denklemlerin yanlış olduğuna inanıyorum. Bu, @ user777'nin değişikliklerinden kaynaklanmıyor. Sağdaki iki terim paydada olmalıdır. Bkz bu .
Cyrille

Bu hata MuMIn paket belgelerinde kapanış köşeli parantez eksik olması nedeniyle oluşmuş olabilir .
Cyrille

Yanıtlar:


11

Douglas Araes'in 17 Aralık 2014'teki R-Sig-ME posta listesine, genel doğrusal karışık modeller için bir istatistiğinin nasıl hesaplanacağı sorusuna yapıştırarak cevap veriyorum. Böyle bir şey. Bates, R için paketin orijinal yazarı ve karma modeller hakkında iyi bilinen bir kitabın ortak yazarı ve ortak yazarıdır ve CV, metnin yalnızca bir bağlantıdan ziyade bir cevapta olmasını sağlayacaktır. o.R2lme4nlme

İnsanlar "GLMM'ler için R2" den bahsettiğinde biraz seğirmeyi kabul etmeliyim. Doğrusal bir model için R2 iyi tanımlanmıştır ve birçok arzu edilen özelliğe sahiptir. Diğer modeller için bu özelliklerin tümünü değil bazılarını yansıtan farklı miktarlar tanımlanabilir. Ancak bu, doğrusal modeller için R2'nin sahip olduğu tüm özelliklere sahip bir sayı elde etme anlamında bir R2'yi hesaplamaz. Genellikle böyle bir miktarın tanımlanmasının birkaç farklı yolu vardır. Özellikle GLM'ler ve GLMM'ler için önce "yanıt varyansı oranı açıklandı" tanımlayabilmeniz için öncelikle "yanıt varyansı" ile ne demek istediğinizi tanımlamanız gerekir.

Diğer modellere uygulandığı şekliyle doğrusal modellerle ilişkili diğer niceliklerden herhangi birinin R2 veya serbestlik derecesini neyin oluşturduğuna dair karışıklık, formülü kavramla karıştırmaktan gelir. Formüller modellerden türetilmiş olmasına rağmen, türetme genellikle oldukça karmaşık matematik içerir. Potansiyel olarak kafa karıştırıcı bir türevden kaçınmak ve sadece "kovalamaca kesmek" için formülleri sunmak daha kolaydır. Ancak formül kavram değildir. Bir formülü genellemek, konsepti genellemekle eşdeğer değildir. Ve bu formüller pratikte neredeyse hiç kullanılmaz, özellikle genelleştirilmiş doğrusal modeller, varyans analizi ve rastgele etkiler için. Giriş metinlerinde verilen formüllere göre hesaplanan tek miktarın örnek ortalaması olduğu bir "meta-teoremim" var.

Bu konuda huysuz bir yaşlı adam gibi görünebilirim ve belki de öyleyim, ancak tehlike, insanların "R2 benzeri" bir miktarın doğrusal modeller için bir R2'nin tüm özelliklerine sahip olmasını beklemesidir. Yapamaz. Tüm özellikleri GLMM gibi çok daha karmaşık bir modelde genelleştirmenin bir yolu yoktur.

Bir zamanlar komitede doktora tez önerisini inceledim. adaylık. Öneri, hangisinin "en iyi" olduğuna karar vermek için doğrusal olmayan bir regresyon modeli için bir R2 hesaplamanın yolları olarak düşünülebilecek 9 farklı formülü incelemekti. Tabii ki, bu sadece birkaç farklı model ve her biri için sadece birkaç farklı parametre değeri kümesiyle bir simülasyon çalışmasıyla yapılacaktı. Bu tamamen anlamsız bir egzersiz olduğunu benim önerim sıcak karşılandı değildi.


10

Literatüre göz attıktan sonra , karma modeller için değerlerini hesaplamak için birkaç farklı yöntemi karşılaştıran aşağıdaki makaleye rastladım , burada (MVP) yöntemleri Nakagawa ve Schielzeth tarafından önerilen yönteme denktir.R2R2

  • Lahuis, D ve diğerleri (2014) Çok Düzeyli Modeller için Açıklanan Varyans Ölçüleri. Örgütsel Araştırma Yöntemleri.

resim açıklamasını buraya girin

Genel olarak, önlemlerin çoğu (Formül, Formül, (OLS) ve (MVP)), tüm koşullar ve modeller arasında kabul edilebilir yanlılık, tutarlılık ve verimlilik seviyeleri sergilemiştir. Ek olarak, bu önlemler için ortalama yanlılık değerleri arasındaki fark küçüktü. Formül ve Formül rastgele kesişme modellerinde en az önyargılıydı ve Formül ve (MVP) rasgele eğimli modellerde en az yanlıydı. Verimlilik açısından, Formül ve (MVP) rasgele kesme modelinde en düşük standart sapma değerlerine sahipti. (MVP) ve (OLS) rastgele eğimli modelde en düşük standart sapmalara sahipti. Genel olarak, Formula etkili bir tahmin edici değildi.R2R2R2R2R2R2

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.