R'de anova () işlevini kullanarak iki modelin karşılaştırılması


32

Belgelere göre anova():

Bir dizi nesne verildiğinde, 'anova' modelleri belirtilen sıraya göre birbirleriyle test eder ...

Modelleri birbirine karşı test etmek ne demektir? Peki sipariş neden önemli?

GenABEL eğitiminden bir örnek :

    >  modelAdd = lm(qt~as.numeric(snp1))
    >  modelDom = lm(qt~I(as.numeric(snp1)>=2))
    >  modelRec = lm(qt~I(as.numeric(snp1)>=3))
     anova(modelAdd, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ as.numeric(snp1)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)
    1   2372 2320                      
    2   2371 2320  1    0.0489     0.82
     anova(modelDom, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ I(as.numeric(snp1) >= 2)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)
    1   2372 2322                      
    2   2371 2320  1      1.77     0.18
     anova(modelRec, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ I(as.numeric(snp1) >= 3)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)  
    1   2372 2324                        
    2   2371 2320  1      3.53    0.057 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Bu çıktıyı nasıl yorumlayabilirim?

Yanıtlar:


31

Kullandığınızda anova(lm.1,lm.2,test="Chisq"), karşılaştırmak için Ki-kare testi yapar lm.1ve lm.2(örneğin, kalan karelerin toplamındaki azalmanın istatistiksel olarak anlamlı olup olmadığını test eder ). Bu markaları yalnızca anlamda o Not lm.1ve lm.2iç içe modellerdir.

Örneğin, kullandığınız ilk anova'da, testin p değeri 0,82'dir. Bu, "modelAdd" takılı modelin düzeyinde modelGen'den önemli ölçüde farklı olmadığı anlamına gelir . Bununla birlikte, 3. anova'daki p-değerini kullanarak, "modelRec" modeli model 0,1'deki "modelGen" modelinden önemli ölçüde farklıdır .α=0.05α=0.1

Doğrusal Modellere Uygun ANOVA'ya da göz atın .


1
Fakat bu ikisinden birinin daha iyi olup olmadığı hakkında bir şey ifade ediyor mu? Teşekkürler!
13'te

5
"Daha iyi" terimini nasıl tanımladığınıza bağlıdır. Daha az artık kareler toplamı sağlayan model olarak tanımlarsanız, cevap evet olur. Bunun nedeni, bu testin artık kareler toplamındaki azalmayı karşılaştırmasıdır.
Stat

3
Öte yandan, iki model önemli ölçüde farklı değilse, daha basit bir modelin "daha iyi" olduğu söylenebilir mi? Ben burada parlamentoyu düşünüyorum.
Sininho

1
peki ya anova (mod1, mod2, test = "LRT"), bunun farkı nedir?
ElleryL
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.