Glmer çıktımdaki 'sabit etkilerin korelasyonunu' nasıl yorumlayabilirim?


26

Aşağıdaki çıktı var:

Generalized linear mixed model fit by the Laplace approximation 
Formula: aph.remain ~ sMFS2 +sAG2 +sSHDI2 +sbare +season +crop +(1|landscape) 

 AIC   BIC    logLik deviance
 4062  4093  -2022   4044

Random effects:
Groups    Name        Variance Std.Dev.
landscape (Intercept) 0.82453  0.90804 
Number of obs: 239, groups: landscape, 45

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  2.65120    0.14051  18.868   <2e-16     
sMFS2        0.26922    0.17594   1.530   0.1260    
sAG2         0.09268    0.14529   0.638   0.5235    
sSHDI2       0.28345    0.17177   1.650   0.0989  
sbare        0.41388    0.02976  13.907   <2e-16 
seasonlate  -0.50165    0.02729 -18.384   <2e-16 
cropforage   0.79000    0.06724  11.748   <2e-16 
cropsoy      0.76507    0.04920  15.551   <2e-16 

Correlation of Fixed Effects:
           (Intr) sMFS2  sAG2   sSHDI2 sbare  sesnlt crpfrg
sMFS2      -0.016                                          
sAG2        0.006 -0.342                                   
sSHDI2     -0.025  0.588 -0.169                            
sbare      -0.113 -0.002  0.010  0.004                     
seasonlate -0.034  0.005 -0.004  0.001 -0.283              
cropforage -0.161 -0.005  0.012 -0.004  0.791 -0.231       
cropsoy    -0.175 -0.022  0.013  0.013  0.404 -0.164  0.557

Sürekli değişkenlerimin tümü ( sdeğişken adından önce küçük ile gösterilen ) standartlaştırılır (z-puanları). season2 seviyeli (erken ve geç) cropkategorik bir değişkendir ve 3 seviyeli (mısır, yem ve soya) kategorik bir değişkendir.

Sabit etkiler matrisinin bu korelasyonu beni gerçekten şaşırtıyor, çünkü tüm korelasyonların değişken çiftlerinin basit regresyonlarına baktığımda yaptıklarının zıt işareti var. yani, sabit etkiler matrisinin korelasyonu, cropforageve sbareaslında, bu değişkenler arasında çok güçlü bir NEGATİF korelasyon olduğunda - ve yem bitkilerinin mısır ve soya mahsullerine kıyasla daha az çıplak öğütülmüş olma eğiliminde olduklarında güçlü bir pozitif korelasyon olduğunu ortaya koymaktadır . Sürekli değişken çiftleri aynı soruna sahiptir, sabit etkiler matrisinin korelasyonu, her şeyin olması gerekenin tam tersi olduğunu söylüyor ... Bu sadece modelin karmaşıklığından kaynaklanıyor olabilir mi (basit bir regresyon değil)? Değişkenlerin standardize edilmiş olması ile ilgisi olabilir mi?

Teşekkürler.

Yanıtlar:


27

“Sabit etkilerin korelasyonu” çıktısı, kendisine en çok atfedilebilecek sezgisel anlama sahip değildir. Spesifik olarak, değişkenlerin korelasyonu ile ilgili değildir (OP notunda olduğu gibi). Aslında, regresyon katsayılarının beklenen korelasyonu ile ilgili. Her ne kadar bu çoklu bağlantı ile konuşabilse de, mutlaka olması gerekmez. Bu durumda, eğer deneyi tekrar yaptıysanız ve bunun için katsayının cropforageküçüldüğü, bunun da katsayıyı alacağının muhtemel olduğunu söylüyor sbare.

Lme4 Baayen ile ilgili “Dilsel Verilerin Analizi: İstatistiğe R Kullanarak Pratik Bir Giriş” adlı kitabı, kısmen bu çıktının bir kısmını bastırır ve sadece özel durumlarda faydalı olduğunu beyan eder. İşte Bates’in kendisinin çıktının bu bölümünü nasıl yorumlayacağını açıkladığı bir listerv mesajı:

Sabit etkilerin tahmin edicisinin yaklaşık bir korelasyonudur. (“Yaklaşık” kelimesini ekliyorum çünkü yapmalıyım ama bu durumda bu yaklaşım çok iyi.) Bundan daha iyi nasıl açıklayacağımı bilmiyorum. Modeldeki parametrelerden bir MCMC örneği aldığınızı varsayalım, o zaman sabit etkiler parametreleri örneğinin bu matris gibi bir korelasyon yapısı göstermesini beklersiniz.


3
Üzgünüm, bu muhtemelen saçma bir soru olacak, ama o zaman bu ilişkiyi göz önünde bulundurmak neden önemlidir? Yani, hangi durumlarda bu çıktı dikkate alınmalı?
mtao

1
@Teresa Ne için kullandığınıza bağlıdır. Yorumlamayı önemsiyorsanız, o zaman iki etki kaynağının ne kadar kafa karıştırıcı olduğunu anlatıyor. Tahmini önemsiyorsanız, diğer tahmin modellerinin nasıl görünebileceği hakkında biraz bilgi verir ve bir tahminde bulunmadığınız takdirde modelin nasıl değişebileceği konusunda bazı ipuçları verir.
russellpierce

1
Öyleyse, bu çıktıda örneğin 0,90'lık bir korelasyonla iki değişkenim olduğunu hayal edin. Yorumlama anlamında, onlardan birini düşürmem gerektiğini düşünüyorum, çünkü "kafa karıştırıcı" ve aynı bilgiyi söylüyor gibi görünüyorlar. Tahmini gelince, eğer bir tanesini düşürürsem, diğer modeller bağıntılandıkları kadar fazla değişmemelidir, değil mi? Yoksa bunu yanlış mı yorumluyorum?
mtao

3
Biliyor musun, bence doğru söylediklerimi tekrarlıyorsun; ama, yansıması üzerine 100pct ben haklı değilim emin değilim. En iyi şekilde yeni bir soru açarak hizmet edebilirsiniz - bu, sorunuza daha fazla göz atacak ve doğru bir cevap alma olasılığınızı artıracaktır.
russellpierce

1
@russellpierce, bu cevap için teşekkürler. Bir soru olsa da, öngörücüler birbirleriyle ilişki kurduklarında çoklu bağlantıların oluştuğunu öğrendim . Ancak cevabınızda , çok kutupluluk ile konuşabilen regresyon katsayılarının (tahmin edicilerin değil) korelasyonu olduğunu söylüyorsunuz . Neden tahmin edilen katsayılar yerine sadece yordayıcıları ilişkilendirmiyorsun?
yer

0

Olumsuz ve pozitif korelasyonlarınız değerlerinde aynıysa ve sadece işaretleri farklıysa, değişkeni yanlış giriyorsunuzdur. Ancak, istatistiklerde zaten oldukça gelişmiş göründüğünüzden bunun sizin için geçerli olduğunu sanmıyorum.

Karşılaştığınız tutarsızlık olabilir ve büyük olasılıkla çok kutupluluk olabilir. Bazı bağımsız değişkenlerin üst üste binen bazı etkileri paylaştığı veya başka bir deyişle kendileriyle ilişkili olduğu anlamına gelir . örneğin, "büyüme hızı" ve "tümör büyüklüğü" değişkenlerine modelleme, mümkün olduğu ve muhtemelen daha büyük tümörlerin (tespit edilmeden önce) daha yüksek büyüme oranlarına sahip olmaları nedeniyle, çoklu-doğrusallığa neden olabilir. Bu modelin kafasını karıştırabilir. Ve modelinizde birbirleriyle ilişkili birkaç bağımsız değişken varsa, sonuçları yorumlamak bazen oldukça zor olabilir. Bazen, bazı korelasyonların işaretinin tersine döneceği ölçüde bile, tamamen tuhaf katsayılara yol açmaktadır.

Önce çok kutupluluk kaynaklarını saptamalı ve onlarla başa çıkmalı ve sonra analizinizi tekrar etmelisiniz.


1
1; yanıltıcı. OP değişkenlerini yanlış girmedi ve çok kutupluluk bir sorun olmayabilir. Ham sabit etkiler arasındaki bir korelasyon bu noktaya gelebilir, ancak Simpson'un paradoksu bu yaklaşımın sizi yanlış yöne yönlendirmesine izin verebilir.
russellpierce

1
Neden "yanıltıcı"? Hangi kısmı yanıltıcıydı? Çok net bir şekilde konuştum ve net sonuçlara varmaktan kaçındım. Söylediğim şey gerçekten çok kutupluluk işaretlerinden biri ve bize VIF'leri de kontrol etmemiz gerektiğini söylüyor. Ama "OP değişkenlerini yanlış girmedi ve çok kutupluluk bir sorun olmayabilir."
Vic,

1
Üstelik görevimi tam olarak bile okumadın bile (ve reddetti ve yanıltıcı olarak adlandır). Olsaydı, yüksek korelasyonların gerçekten MC'ye işaret edip etmediğine emin olmak için OP'nin VIF'leri (multiC için resmi göstergeler olarak) kontrol etmesini önerdiğimi gördünüz. ama yine de, kibir ve kişisel saldırılar olmadığı sürece öğrenmeye açığım.
Vic,

1
@Vic: Şu ana kadar yorumlarınızı görmediniz. Cevabımı kişisel bir saldırı olarak görmeni istemedim. Yanıltıcı olduğu kanısındaydım ve yukarıda doğru cevap olduğuna inandığım şeyi verdim. Gönderinizi tam zamanında okudum. Yorumlara girip girmediğimi bilmiyorum. Oyumun karşısında duruyorum.
russellpierce

1
... ancak bu kararda yanılmam için izin veriyorum. Ancak, neden sadece oy kullanmamayı tercih ettim?
russellpierce

0

Sabit etkiler arasındaki bu korelasyonların, modelin "vcov" sini bir korelasyon matrisine dönüştürerek elde edildiğini göstermek faydalı olabilir. Eğer fit, sonra monte lme4 modelidir

vc <- vcov(fit)

# diagonal matrix of standard deviations associated with vcov
S <- sqrt(diag(diag(vc), nrow(vc), nrow(vc)))

# convert vc to a correlation matrix
solve(S) %*% vc %*% solve(S)

ve sabit etkiler arasındaki korelasyon diyagonal olmayan girdilerdir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.