Null ve model sapmalarını kullanarak GLM modelini test edin


11

R'de bir glm modeli oluşturdum ve bir test ve eğitim grubu kullanarak test ettim, bu yüzden iyi çalıştığından eminim. R'nin sonuçları:

Coefficients:
                            Estimate Std. Error  t value Pr(>|t|)    
(Intercept)               -2.781e+00  1.677e-02 -165.789  < 2e-16 ***
Coeff_A                    1.663e-05  5.438e-06    3.059  0.00222 ** 
log(Coeff_B)               8.925e-01  1.023e-02   87.245  < 2e-16 ***
log(Coeff_C)              -3.978e-01  7.695e-03  -51.689  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for quasibinomial family taken to be 0.9995149)

    Null deviance: 256600  on 671266  degrees of freedom
Residual deviance: 237230  on 671263  degrees of freedom
AIC: NA

Katsayıların tüm p değerleri beklendiği gibi küçük.

Bu soruya bakarak ( GLM R'de Rezidüel ve Null Sapmayı Yorumlamak ), null hipotezinin aşağıdaki denklemi kullanarak tutabildiğini hesaplayabilmeliyim:

p-value = 1 - pchisq(deviance, degrees of freedom)

Bunu yapıştırmak:

1 - pchisq(256600, 671266)
[1] 1

Yani, tüm katsayıların p değerleri çok küçük olsa da ya da bunu nasıl hesaplayacağımı yanlış yorumlamışsam bile, sıfır hipotezinin reddedilemeyeceğini düşünmekte haklı mıyım?

Yanıtlar:


18

Burada bir yanlış anlaşılma var. Fark sıfır sapma ve modelin sapma arasında ki-kare serbestlik derecesi ile boş dF eşit bir şekilde dağıtılır eksi modelin df. Modeliniz için bu şöyle olur:

1-pchisq(256600 - 237230, df=(671266 - 671263))
# [1] 0

Varsayılan olarak, değerin solundakipchisq() dağılımın oranını verir . Oranı farkınızdan daha fazla elde etmek için sonucu belirtebilir veya çıkarabilirsiniz (sizin ve benim yaptığımız gibi). lower.tail = FALSE1


2
İfadeyle tam olarak hangi hipotezi test ediyorsunuz 1-pchisq(256600 - 237230, df=(671266 - 671263))?
jII

5
@jesterII, sapmanın şans eseri beklenenden daha fazla değişip değişmediğini kontrol ediyorsunuz. Yani, bir bütün olarak modelin null modelden daha iyi olup olmadığını test ediyorsunuz. Doğrusal bir modelde global F testine benzer.
gung - Monica'yı eski

Sıfır hipotezi 'bir bütün olarak model sıfır modelinden daha iyidir' ve sıfır hipotezini reddettiniz, yani model zayıf mı?
jII

3
@jesterII, hiçbir sıfır hipotezi şudur: 'bir bütün olarak modeldir hiçbir iyi boş modelden daha'. Bu reddedildiğinden, verilerin boş modelle tutarlı olmadığı sonucuna varıyoruz. Dikkat, bu mutlaka modelimizin 'iyi' veya 'doğru' olduğu anlamına gelmez.
gung - Monica'yı eski
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.