Model olasılığı null'dan önemli ölçüde yüksek olmadığında (GAM) regresyon katsayılarının önemi


10

R paketi gamlss kullanarak ve verilerin sıfır şişirilmiş beta dağılımı varsayarak GAM tabanlı bir regresyon çalıştırıyorum . Temelde bu yüzden benim modelinde sadece tek açıklayıcı değişken vardır: mymodel = gamlss(response ~ input, family=BEZI).

Algoritma , açıklayıcı değişkenin ortalamaya ( ) etkisi için katsayısını ve için ilişkili p değerini verir :kμk(input)=0

Mu link function:  logit                                               
Mu Coefficients:                                                      
              Estimate  Std. Error  t value   Pr(>|t|)                  
(Intercept)  -2.58051     0.03766  -68.521  0.000e+00                  
input        -0.09134     0.01683   -5.428  6.118e-08

Yukarıdaki örnekte de görebileceğiniz gibi, hipotezi büyük bir güvenle reddedilmektedir.k(input)=0

Sonra null modeli çalıştırıyorum: null = gamlss(response ~ 1, family=BEZI)ve bir olasılık-oran testi kullanarak olasılıkları karşılaştırıyorum:

p=1-pchisq(-2*(logLik(null)[1]-logLik(mymodel)[1]), df(mymodel)-df(null)).

Bazı durumlarda, girişteki katsayıların yüksek derecede önemli olduğu bildirilse bile (> yukarıdaki gibi) elde ederim . Bunu oldukça sıra dışı buluyorum - en azından doğrusal veya lojistik regresyon deneyimimde hiç olmadı (aslında, sıfır ayarlı gamayı gamls ile kullanırken de hiç olmadı).p>0.05

Sorum şu: Bu durumda yanıt ve girdi arasındaki bağımlılığa hala güvenebilir miyim?

Yanıtlar:


1

Bunun GAM ile ilgili olması için acil bir neden göremiyorum. Gerçek şu ki, aynı şey için iki test kullanıyorsunuz. İstatistiklerde kesin bir kesinlik olmadığından, birinin önemli bir sonuç vermesini ve diğerinin vermemesini sağlamak çok mümkündür.

Belki de iki testten biri daha güçlüdür (ancak belki de daha fazla varsayımlara dayanır) veya belki de tek önemli olan yirmi bir tip I hatanızdır.

İyi bir örnek, numunelerin aynı dağıtımdan gelip gelmediğine dair testlerdir: bunun için çok parametrik testleriniz var (T testi bunun için kullanılabilen testtir: eğer araçlar farklıysa, dağılımlar da öyle olmalıdır) ve ayrıca parametrik olmayan olanlar: Parametrik olanın önemli bir sonuç verdiği ve parametrik olmayanın vermediği olabilir. Son olarak, veri (tip I), sadece olağanüstü olduğu için ya da parametrik olmayan bir test farkı almak için örnek boyutu yeterli değildir, çünkü, ya da parametrik testi varsayımları, yanlış bir sonucu olabilir, çünkü açıdan arasında gerçekten test etmek istediğiniz şey (farklı dağılımlar) farklı testler tarafından kontrol edilir (farklı "<->" daha yüksek "olma şansı anlamına gelir).

Bir test sonucu önemli sonuçlar gösteriyorsa ve diğeri sadece biraz anlamlı değilse, çok fazla endişelenmem.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.