Model ortalama sonuçlarını R cinsinden yorumlama


11

R'deki model ortalaması kullanarak bazı verileri analiz etmemden ne rapor edeceğimizi anlamaya ve bilmeye çalışıyorum.

Belirli bir değişken üzerinde ölçüm yönteminin etkisini analiz etmek için aşağıdaki komut dosyasını kullanıyorum: İşte veri kümesi: https://www.dropbox.com/s/u9un273gzw9o30u/VMT4.csv?dl=0

Takılacak model:

LM.1 <- gls(VMTf ~ turn+sex+method, na.action="na.fail", method = "ML",VMT4)

tam modeli araştırmak

require(MuMIn)
d=dredge(LM.1)
print(d)
coefficients(d)

Parametre tahminleri almak için tüm modellerin özet bilgilerini edinin

summary(model.avg(d))

Tüm modellerin ortalaması alınabileceğini (tam model ortalaması) veya sadece bir alt kümesinin (koşullu ortalama) olabileceğini biliyorum. Şimdi bilmek istiyorum: Ne zaman çıkarımlarda bulunmak için tam veya şartlı ortalama kullanmak daha iyidir. Tüm bunlar hakkında bilimsel bir makale için ne rapor etmeliyim? Model ortalama durumu için Z değeri ve ilişkili p tam olarak ne anlama gelir?

Sorularımı görselleştirmeyi kolaylaştırmak için. İşte sonuç tablosu,

> summary(model.avg(d))# now, there are effects

Call:
model.avg(object = d)

Component model call: 
gls(model = VMT ~ <8 unique rhs>, data = VMT4, method = ML, na.action = 
 na.fail)

Component models: 
       df  logLik   AICc delta weight
1       4 -247.10 502.52  0.00   0.34
12      5 -246.17 502.83  0.31   0.29
13      5 -246.52 503.52  1.01   0.20
123     6 -245.60 503.88  1.36   0.17
(Null)  2 -258.62 521.33 18.81   0.00
3       3 -258.38 522.95 20.43   0.00
2       3 -258.60 523.39 20.88   0.00
23      4 -258.36 525.05 22.53   0.00

Term codes: 
method    sex   turn 
     1      2      3 

Model-averaged coefficients:  
(full average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)            42.63521    0.37170     0.37447 113.856  < 2e-16 ***
methodlight chamber    -1.05276    0.36098     0.36440   2.889  0.00386 ** 
methodthermal gradient -1.80567    0.36103     0.36445   4.955    7e-07 ***
sex2                    0.19023    0.29403     0.29548   0.644  0.51970    
turn                    0.05005    0.10083     0.10141   0.494  0.62165    

(conditional average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)             42.6352     0.3717      0.3745 113.856  < 2e-16 ***
methodlight chamber     -1.0528     0.3609      0.3643   2.890  0.00386 ** 
methodthermal gradient  -1.8058     0.3608      0.3642   4.958  7.1e-07 ***
sex2                     0.4144     0.3089      0.3119   1.328  0.18402    
turn                     0.1337     0.1264      0.1276   1.047  0.29492    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Relative variable importance: 
                     method sex  turn
Importance:          1.00   0.46 0.37
N containing models:    4      4    4

Yanıtlar:


5

Bkz. Grueber ve ark. 2011, "Ekoloji ve evrimde çok modelli çıkarım: zorluklar ve çözümler" Evrimsel Biyoloji 24: 699-711.

Tam veya koşullu verileri kullanmak isteyip istemediğinize ilişkin hedeflere bağlıdır. Alanımda en çok hangi modellerin desteklendiğini belirlemek için AICC gibi ölçütleri kullanırız, ardından bunları koşullu alt kümeniz olarak kullanırız. Bu bilgi daha sonra rapor edilecektir. Örneğin, ilk dört modeliniz birbirinin 2 AIC birimindedir, bu nedenle hepsi alt kümenize dahil edilir. Diğerleri orada (daha yüksek AIC) çıkış yoludur, bu nedenle bunlardan gelen bilgileri dahil etmek, beta tahminlerinizin kalitesini gerçekten azaltacaktır.


2
Önerilen örneğinizde bile, belki de dört "en iyi" modelden ikisinde görünen bazı terimler olacaktır. Bu iki katsayı değerinin ya da görünmedikleri iki model için iki değerin ve iki sıfır değerinin ortalamasını alıyor musunuz?
user2390246

5

Tam ve koşullu ortalamaların tam olarak ne olduğu arasındaki farkın öncülünün yanlış olduğunu düşünüyorum. Biri sıfır içeren bir ortalamadır (tam) ve biri sıfır içermeyen (koşullu). model.avg () komutunun yardım dosyasından:

Not

'Altküme' (veya 'koşullu') ortalaması, yalnızca parametrenin göründüğü modellere göre ortalanır. Alternatif olarak, 'tam' ortalama, her modele bir değişkenin dahil edildiğini varsayar, ancak bazı modellerde karşılık gelen katsayı (ve ilgili varyansı) sıfıra ayarlanır. 'Alt küme ortalamasının' aksine, değeri sıfırdan uzağa eğilme eğilimi yoktur. 'Dolu' ortalama bir tür büzülme tahmin edicisidir ve yanıtı zayıf olan değişkenler için 'alt küme' tahmin edicilerinden daha küçüktür.

Yalnızca bir model alt kümesi kullanmak istiyorsanız (örneğin delta AIC'ye dayalı olarak), model.avg () içindeki alt küme bağımsız değişkenini kullanın. Dahil olan modellerden bazılarında diğerlerinin sahip olduğu bazı değişkenler eksik olduğu sürece, koşullu ve tam tahminler almaya devam edersiniz.


Evet. Katılıyorum. Doğru yorum budur.
ekolog1234
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.