GLM parametrelerinde çıkarım için serbestlik derecesi düzeltmeleri kullanılmalı mıdır?


11

Bu soru Martijn'ın buradaki cevabından ilham alıyor .

Bir binom veya Poisson modeli gibi bir parametre ailesi için bir GLM taktığımızı ve bunun tam bir olasılık prosedürü olduğunu varsayalım (aksine, quasipoisson). Sonra, varyans ortalamanın bir fonksiyonudur. Binom ile: ve Poisson ile var [ X ] = E [ X ] .var[X]=E[X]E[1X]var[X]=E[X]

Kalıntılar normal olarak dağıldığında doğrusal regresyonun aksine, bu katsayıların sonlu, kesin örnekleme dağılımı bilinmemektedir, sonuçların ve ortak değişkenlerin muhtemelen karmaşık bir kombinasyonudur. Ayrıca, sonucun varyansı için bir eklenti tahmini olarak kullanılan GLM'nin ortalama tahminini kullanarak .

Bununla birlikte, lineer regresyon gibi, katsayıların da asimptotik bir normal dağılımı vardır ve bu nedenle sonlu örnek çıkarımında, örnekleme dağılımlarına normal eğri ile yaklaşabiliriz.

Sorum şu: Sonlu örneklerde katsayıların örnekleme dağılımına T-dağılımı yaklaşımını kullanarak bir şey kazanıyor muyuz? Bir yandan, biz biliyoruz , bir ön yükleme veya sustalı çakı tahmincisi doğru bu farkları hesaba ne zaman T yaklaşımı yanlış bir seçim gibi görünüyor böylece, varyans henüz tam dağılımını bilmiyoruz. Öte yandan, belki de T-dağılımının hafif muhafazakarlığı pratikte tercih edilmektedir.


1
iyi soru. Bartlett düzeltmelerine bakmak isteyebilirsiniz .
Ben Bolker

1
Bu sorunun kötü olduğunu düşünüyorum, MLE veya QMLE kullanırken sadece asimptotik olarak haklı bir tahmin ve çıkarım var. sonlu ayarlarda A veya B varsayımının daha iyi olup olmadığını sormak, her zaman sıradan "kaybolacaktır" verilere ve hangi varsayımları yapmak istediğinize bağlıdır ". Şahsen bootstrapping'i seviyorum ve mümkün olduğunca kullanıyorum, ancak standart z veya t tabanlı testi kullanmanın artık yanlış olması yok - küçük veri probleminden kaçmanıza izin vermiyor ve bu yüzden hala varsayımlar yapıyorsunuz (sadece farklı olanlar) )
17'de

Yanıtlar:


3

Kısa cevap: Henüz tam bir cevap değil, ancak bağlantılı soru ile ilgili aşağıdaki dağılımlarla ilgilenebilirsiniz: z-testi (glm tarafından da kullanıldığı gibi) ve t-testini karşılaştırır

    layout(matrix(1:2,1,byrow=TRUE))

    # trying all 100 possible outcomes if the true value is p=0.7
    px <- dbinom(0:100,100,0.7)
    p_model = rep(0,101)
    p_model2 = rep(0,101)
    for (i in 0:100) {
      xi = c(rep(1,i),rep(0,100-i))
      model = glm(xi ~ 1, offset=rep(qlogis(0.7),100), family="binomial")
      p_model[i+1] = 1-summary(model)$coefficients[4]
      model2 <- glm(xi ~ 1, family = "binomial")
      coef <- summary(model2)$coefficients
      p_model2[i+1] = 1-2*pt(-abs((qlogis(0.7)-coef[1])/coef[2]),99,ncp=0)
    }


    # plotting cumulative distribution of outcomes z-test
    outcomes <- p_model[order(p_model)]
    cdf <- cumsum(px[order(p_model)])
    plot(1-outcomes,1-cdf, 
         ylab="cumulative probability", 
         xlab= "calculated glm p-value",
         xlim=c(10^-4,1),ylim=c(10^-4,1),col=2,cex=0.5,log="xy")
    lines(c(0.00001,1),c(0.00001,1))
    for (i in 1:100) {
      lines(1-c(outcomes[i],outcomes[i+1]),1-c(cdf[i+1],cdf[i+1]),col=2)
    #  lines(1-c(outcomes[i],outcomes[i]),1-c(cdf[i],cdf[i+1]),col=2)
    }

    title("probability for rejection with z-test \n as function of set alpha level")


    # plotting cumulative distribution of outcomes t-test
    outcomes <- p_model2[order(p_model2)]
    cdf <- cumsum(px[order(p_model2)])
    plot(1-outcomes,1-cdf, 
         ylab="cumulative probability", 
         xlab= "calculated glm p-value",
         xlim=c(10^-4,1),ylim=c(10^-4,1),col=2,cex=0.5,log="xy")
    lines(c(0.00001,1),c(0.00001,1))
    for (i in 1:100) {
      lines(1-c(outcomes[i],outcomes[i+1]),1-c(cdf[i+1],cdf[i+1]),col=2)
      #  lines(1-c(outcomes[i],outcomes[i]),1-c(cdf[i],cdf[i+1]),col=2)
    }

    title("probability for rejection with t-test \n as function of set alpha level")
    [![p-test vs t-test][1]][1]

Ve sadece küçük bir fark var. Ve ayrıca z-testi aslında daha iyidir (ancak bunun nedeni hem t-testi hem de z-testi "yanlış" olabilir ve muhtemelen z-testinin hatası bu hatayı telafi eder).

resim açıklamasını buraya girin

Uzun Cevap: ...

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.