Yarı-binom dağılımı nedir (GLM bağlamında)?


30

Birisinin, quasibinomial dağılımın ne olduğu ve ne yaptığı hakkında sezgisel bir bakış açısı sağlayabileceğini umuyorum. Bu noktalara özellikle ilgi duyuyorum:

  1. Quasibinomial'in binom dağılımına ne kadar farklı olduğu.

  2. Yanıt değişkeni bir oran olduğunda (örnek değerler 0.23, 0.11, 0.78, 0.98'i içerir), R'de bir quasibinomial model çalışacaktır ancak binom bir model çalışmayacaktır.

  3. Bir DOĞRU / YANLIŞ yanıt değişkeni aşırı dağıtıldığında neden kuasibinomial modeller kullanılmalıdır?

Yanıtlar:


20
  1. Binom dağılımı ve yarı-binom arasındaki fark, bu dağılımları karakterize eden olasılık yoğunluk fonksiyonlarında (pdf) görülebilir.

    Binom pdf:

    P(X=k)=(nk)pk(1p)nk

    Yarı-binom pdf:

    P(X=k)=(nk)p(p+kϕ)k1(1pkϕ)nk

    Yarı-binom dağılımı, binom dağılımına benzer olsa da, tarif etmeye çalışan fazladan bir \ phi parametresine ϕ( |ϕ|min{p/n,(1p)/n} ) sahiptir. sadece Binom dağılımı ile açıklanamayan verilerde ilave varyans.

    (Yarı-binom dağılımının ortalamasının, kendisinden ziyade .)pi=0nn!ϕi(nk)!p

  2. Bundan emin değilim, belki de R'deki glm fonksiyonu bunu açıklamak için quasibinomial modda ağırlık ekler mi?

  3. Ekstra parametrenin amacı , verilerdeki ekstra varyansı tahmin etmektir. Her genelleştirilmiş doğrusal model (GLM), sonuç / yanıt için bir dağıtım varsayımı yapar ve bu dağıtıma dayanan verilerin olasılığını en üst düzeye çıkarır. Bu, analistin yaptığı bir seçimdir ve verilerinizde daha fazla farklılığı hesaba katmanız gerektiğini düşünüyorsanız, glm'inizin yanıtını modellemek için yarı-binom dağılımını seçebilirsiniz. Binom yerine yarı-binomlu bir modele uymamız gerekip gerekmediğini test etmenin harika bir yolu, yarı-binomlu bir modele sığdırmak ve parametresinin 0 olup olmadığını görmek için sınamaktır .ϕϕ


2
Mükemmel Alejandro, şimdi ϕ parametresi 0 ise nasıl test edebilirim?
Juanchi

2
Not bu Rile glm.fit, binomialve quasibinomialdışında aynı olan quasibinomial(1) tam sayı kontrolünü kaldırır, ve (2) NA bir AIC döndürür. Daha fazla ayrıntı için bu cevaba bakınız.
miguelmorin

-1 Bu tür "yarı-binom" dağılımı, glms bağlamındaki yarı-binom olasılıkları ile tamamen ilgisiz görünüyor, bu yüzden neden bu kadar fazla kazandığını görmek zor.
Jarle Tufto

14

Yarı-binom, mutlaka belirli bir dağıtım değildir; o model doğrusal genel varyansın ortalama arasındaki ilişki için bir modeli tarif bir binom ortalama açısından binom için katı varyans.ϕ

Böyle bir şartnameye uyan bir dağılım var (açık olanı - ölçeklendirilmiş bir binom), ancak yarı-binomlu bir model takıldığında amaç bu değildir; Eğer hala 0-1 olan verilere uyarsanız, binom ölçeklendirilemez.

Dolayısıyla, yarı-binom değişkenlik modeli, parametresiyle, varyansın binom verisiyle alacağınızdan daha büyük (veya belki de daha küçük) olduğu verilerle daha iyi bir şekilde başa çıkabilmektedir; .ϕ

Yanıt değişkeni bir oran olduğunda (örnek değerler 0.23, 0.11, 078, 0.98'i içerir), R'de bir quasibinomial model çalışacaktır ancak binom bir model çalışmayacaktır.

Benim hatırladığım kadarıyla, binomial bir model R'de oranlarla * çalıştırılabilir, ancak doğru bir şekilde kurulmasını sağlamalısınız.

* binom verilerini bildiğim R'ye vermenin üç ayrı yolu var. Bunun bir olduğundan eminim.


Bunun önemlilik tahmini ile ilgisi nedir?
tim.farkas

2
+1 (ancak daha kapsamlı bir cevap görmeyi çok isterim!). Binom GLM oranlarını orantılı olarak ayarlamanın üç yolu muhtemelen şudur : stats.stackexchange.com/a/26779/28666 ? Bir bağlantı yardımcı olabilir. Ayrıca, "quasibinomial" hakkında gerçekten bir dağılım olmamakla ilgili söyledikleriniz, bu konudaki ikinci cevapla nasıl ilgilidir?
amip diyor Reinstate Monica

1
@amoeba cevabımda da belirtildiği gibi bir dağılım yazabilirsiniz (ölçeklendirilmiş bir binom), fakat bu sayım verileri için bir dağılım olamaz (quasibinomial, dağılım parametresi 1 olmadığı sürece tüm tam sayılarda değildir) veya sürekli veri için ( ayrık!). İnsanlar genellikle varyans yapısı nedeniyle sayı verileri için kullanırlar (ancak bu durumda üssel ailede böyle bir dağılım yoktur)
Glen_b -Reinstate Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.