Bu -değerlerinin yalnızca her bir düzeyin ortalamasının referans düzeyinin ortalamasından önemli ölçüde farklı olup olmadığını size söylediğinizden emin olabilirsiniz . Bu nedenle, size sadece seviyeler arasındaki ikili farkları anlatırlar . Kategorik öngörücünün bir bütün olarak anlamlı olup olmadığını test etmek, öngörücünün düzeylerinde herhangi bir heterojenite olup olmadığının test edilmesine eşdeğerdir. Modelde başka yordayıcı olmadığında, bu klasik bir ANOVA problemidir.p
Modelde başka öngörücüler olduğunda. kategorik bir öngörücünün önemini test etmek için iki seçeneğiniz vardır:
(1) olabilirlik oran testi: Bir sonuç olduğunu varsayalım , kantitatif belirleyiciler X i 1 , . . . , X, i p ve kategorik belirleyici Cı ı ile k seviyeleri. Kategorik öngörücüsü olmayan modelYiXi1,...,XipCik
Yi=β0+β1Xi1+...+βpXip+εi
İçinde R
bu modeli lm()
komutla sığdırabilir ve günlük olasılığını komutla çıkarabilirsiniz logLik
. Bu günlük olabilirliği . Daha sonra, modeli kategorik öngörücü ile sığdırabilirsiniz:L0
Yi=β0+β1Xi1+...+βpXip+∑j=1k−1αjBj+εi
burada olan bir kukla 1 ise D i = j ve 0 , aksi. K 'inci düzey sadece orada yüzden referans seviyesi olan k - 1 toplamında terimleri. kategorik değişkeni iletirseniz, bu kukla kodlamayı sizin için otomatik olarak yapar . Bu modeli benzer şekilde sığdırabilir ve günlük olasılığını yukarıdaki gibi çıkarabilirsiniz. Bu günlük olabilirliği L 1 olarak adlandırın . Daha sonra, D i'nin bir etkisi olmadığı sıfır hipotezi altında ,Bj1Di=j0kk−1R
lm()
L1Di
λ=2(L1−L0)
Bir sahiptir ile dağıtım k - 1 serbestlik derecesine. Yani, hesaplayabilirsiniz p kullanarak -değeri içinde önemi için teste.χ2k−1p1-pchisq(2*(L1-L0),df=k-1)
R
(2) -test:F Ayrıntılara girmeden (log-olasılıklardan ziyade karelerin toplamı kullanılması dışında LRT'ye benzer), bunun nasıl yapılacağını açıklayacağım R
. Komutu (buna çağır ) ve kategorik öngörücüsü olmayan modeli (buna çağır ) R
kullanarak "tam" modeli (yani kategorik öngörücü dahil tüm öngörücülere sahip modeli) takarsanız , bu hipotezi test eder. siz de.lm()
g1
g0
anova(g1,g0)
F
x3
oluşturmak için kullandığınız anlaşılıyory
, bu yüzden modele dahil edilmelidir ve değeri bu sonuca katılır.