1) Evet. Aynı değişkenlere sahip bireylerden gelen (?) Binom verilerini bir araya toplayabilir / de-toplayabilirsiniz. Bu, binom model için yeterli istatistiğin, her değişkenli vektör için toplam olay sayısı olduğu gerçeğinden gelir; Bernoulli ise sadece binom için özel bir durumdur. Sezgisel olarak, binom bir sonucu oluşturan her bir Bernoulli denemesi bağımsızdır, dolayısıyla bunları tek bir sonuç veya ayrı bireysel denemeler olarak saymak arasında bir fark olmamalıdır.
2) Elimizdeki Say benzersiz eş değişken vektörler bir binom bir sonucu olan, her biri denemeleri, yani
Bir lojistik regresyon belirttiğiniz model, yani
, bunun daha sonra önemli olmadığını görmemize rağmen.x 1 , x 2 , ... , x , n , N i Y ı ~ B ı n ( N i , p i ) l O g ı t ( p i ) = K Σ k = 1 β k x i knx1, x2, … , XnN-ben
Yben~ B i n ( Kben, pben)
l O g ı t ( sben) = ∑k = 1Kβkxben k
Bu modelin log olasılığı
ve parametre tahminlerimizi almak için bunu ( açısından) açısından ediyoruz.βsı
ℓ ( β; Y) = ∑i = 1ngünlük( NbenYben) +Ybengünlük( pben) + ( Nben- Yben) günlük( 1 - pben)
βpben
Şimdi, her bir , binom sonucunu, , bireysel Bernoulli / binary sonuçlarına . Özellikle,
Yani, ilk 1 ve geri kalanlar 0 . Bu tam olarak yaptığınız şeydi - ama ilkini 0s, geri kalanları 1s veya başka bir sipariş, eşit olarak yapmış olabilirsiniz , değil mi?i = 1 , … , nN-ben
Zben 1, … , Zben yben= 1
Zben ( Yben+ 1 ), … , Zben Nben= 0
Yben( Nben- Yben)
İkinci modeliniz,
nin yukarıdaki gibi için aynı regresyon modeline sahip olduğunu . Bu modelin log olasılığı
ve bu nedenle biz tanımlandığı şekilde , bu basitleştirilebilir s
oldukça tanıdık gelmeli.
Zben j~ B e r n O u l l I ( pben)
pbenℓ ( β; Z) = ∑i = 1nΣj = 1N-benZben jgünlük( pben) + ( 1 - Zben j) günlük( 1 - pben)
Zben jℓ ( β; Y) = ∑i = 1nYbengünlük( pben) + ( Nben- Yben) günlük( 1 - pben)
İkinci modelde tahminleri almak için, bunu açısından maksimize ediyoruz . Bu ve birinci log-olasılık arasındaki tek fark terimdir , göre sabit olan ve böylece maksimizasyonu etkilemez ve biz aynı tahminleri alacaksınız.βgünlük( NbenYben)β
3) Her gözlemde bir sapma kalıntısı var. Binom modelde, bunlar
burada , modelinizden tahmin edilen olasılıktır. Binom modelinizin doymuş olduğunu (0 artık serbestlik derecesi) ve tüm gözlemlere mükemmel şekilde uyduğunu unutmayın: , tüm gözlemler için, yani , .
Dben= 2 [ Ybengünlük( Yben/ Nbenp^ben) +( Nben- Yben) günlük( 1 - Yben/ Nben1 - p^ben) ]
p^benp^ben= Yben/ NbenDben= 0ben
Bernoulli modelinde,
Şimdi sahip olacağınız gerçeğin dışında sapma artıkları ( binom verileriyle olduğu gibi yerine ), bunların her biri
veya
yoksa
mı olduğuna bağlı olarak ve açıkça yukarıdakilerin aynısı değildir. Bu aşkın Özetle bile her sapma artıkların bir miktar almak için , aynı alamadım:
Dben j= 2 [ Zben jgünlük( Zben jp^ben) +(1- Zben j) günlük( 1 - Zben j1 - p^ben) ]
Σni = 1N-bennDben j= - 2 günlük( p^ben)
Dben j= - 2 günlük( 1 - p^ben)
Zben j= 10jbenDben= ∑j = 1N-benDben j= 2 [ Ybengünlük( 1p^ben) +( Nben- Yben) günlük( 11 - p^ben) ]
AIC'nin farklı olması (ancak sapmadaki değişiklik değil) iki modelin log olasılıkları arasındaki fark olan sabit terime geri dönmektedir. Sapma hesaplanırken bu iptal edilir, çünkü aynı verilere dayanan tüm modellerde aynıdır. AIC, olarak tanımlanmıştır
ve birleşimsel terim, s arasındaki farktır :
Bir benC= 2 K- 2 ℓ
ℓ
Bir benCB e r n O u l l ı- Bir benCB i n o m i , bir l= 2 ∑i = 1ngünlük( NbenYben) =9.575