Null ve model sapmalarını kullanarak GLM modelini test edin

R'de bir glm modeli oluşturdum ve bir test ve eğitim grubu kullanarak test ettim, bu yüzden iyi çalıştığından eminim. R'nin sonuçları:

Coefficients:
                            Estimate Std. Error  t value Pr(>|t|)    
(Intercept)               -2.781e+00  1.677e-02 -165.789  < 2e-16 ***
Coeff_A                    1.663e-05  5.438e-06    3.059  0.00222 ** 
log(Coeff_B)               8.925e-01  1.023e-02   87.245  < 2e-16 ***
log(Coeff_C)              -3.978e-01  7.695e-03  -51.689  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for quasibinomial family taken to be 0.9995149)

    Null deviance: 256600  on 671266  degrees of freedom
Residual deviance: 237230  on 671263  degrees of freedom
AIC: NA

Katsayıların tüm p değerleri beklendiği gibi küçük.

Bu soruya bakarak ( GLM R'de Rezidüel ve Null Sapmayı Yorumlamak ), null hipotezinin aşağıdaki denklemi kullanarak tutabildiğini hesaplayabilmeliyim:

p-value = 1 - pchisq(deviance, degrees of freedom)

Bunu yapıştırmak:

1 - pchisq(256600, 671266)
[1] 1

Yani, tüm katsayıların p değerleri çok küçük olsa da ya da bunu nasıl hesaplayacağımı yanlış yorumlamışsam bile, sıfır hipotezinin reddedilemeyeceğini düşünmekte haklı mıyım?

r generalized-linear-model chi-squared

— Zfunk
kaynak

Burada bir yanlış anlaşılma var. Fark sıfır sapma ve modelin sapma arasında ki-kare serbestlik derecesi ile boş dF eşit bir şekilde dağıtılır eksi modelin df. Modeliniz için bu şöyle olur:

1-pchisq(256600 - 237230, df=(671266 - 671263))
# [1] 0

Varsayılan olarak, değerin solundakipchisq() dağılımın oranını verir . Oranı farkınızdan daha fazla elde etmek için sonucu belirtebilir veya çıkarabilirsiniz (sizin ve benim yaptığımız gibi). lower.tail = FALSE $1$

— gung - Monica'yı eski durumuna döndürün
kaynak

İfadeyle tam olarak hangi hipotezi test ediyorsunuz 1-pchisq(256600 - 237230, df=(671266 - 671263))?

— jII

@jesterII, sapmanın şans eseri beklenenden daha fazla değişip değişmediğini kontrol ediyorsunuz. Yani, bir bütün olarak modelin null modelden daha iyi olup olmadığını test ediyorsunuz. Doğrusal bir modelde global F testine benzer.

— gung - Monica'yı eski

Sıfır hipotezi 'bir bütün olarak model sıfır modelinden daha iyidir' ve sıfır hipotezini reddettiniz, yani model zayıf mı?

— jII

@jesterII, hiçbir sıfır hipotezi şudur: 'bir bütün olarak modeldir hiçbir iyi boş modelden daha'. Bu reddedildiğinden, verilerin boş modelle tutarlı olmadığı sonucuna varıyoruz. Dikkat, bu mutlaka modelimizin 'iyi' veya 'doğru' olduğu anlamına gelmez.

— gung - Monica'yı eski