Bağımlı veriler için Bernoulli rastgele değişkenlerinin toplamı nasıl modellenir?


9

Bunun gibi hemen hemen aynı sorularım var: Bernoulli rastgele değişkenlerinin toplamını nasıl verimli bir şekilde modelleyebilirim?

Ancak ayar oldukça farklıdır:

  1. S=Σben=1,N-Xben , , ~ 20, ~ 0.1P(Xben=1)=pbenN-pben

  2. Bernoulli rastgele değişkenlerinin sonuçları için verilerimiz var: ,Xben,jSj=Σben=1,N-Xben,j

  3. maksimum olasılık tahmini ile tahmin (ve ), çok daha büyük olduğu ortaya çıkar. diğer kriterler tarafından beklenen:pbenp^benMLEP^{S=3}(p^benMLE)P^{S=3}(p^benMLE)-P^expected{S=3}0.05

  4. Bu nedenle, ve bağımsız olarak ele alınamaz (küçük bağımlılıkları vardır).XbenXj (j>k)

  5. Bunun gibi bazı kısıtlamalar vardır: ve (bilinen), P \ ' nin tahminine yardımcı olmalıdır {S \} .pben+1pbenΣs2P^{S=s}=birP{S}

Bu durumda Bernoulli rastgele değişkenlerinin toplamını modellemeye nasıl çalışabiliriz?

Görevi çözmek için hangi literatür yararlı olabilir?

GÜNCELLENMİŞ

Başka fikirler de var:

(1) arasındaki bilinmeyen bağımlılığın 1 veya daha fazla başarıdan sonra başladığını varsayabiliriz . Ne zaman , ve .XbenΣben=1,KXben>0pK+1pK+1'pK+1'<pK+1

(2) MLE'yi kullanmak için en az şüpheli modele ihtiyacımız var. İşte bir varyant:

P{X1,...,Xk}=(1-p1)...(1-pk) eğer k k eğer ve ve herhangi bir k için .Σben=1,kXben=0P{X1,...,Xk,Xk+1,...,XN-}=(1-p1)...pkP'{Xk+1,...,XN-}Σben=1,k-1Xben=0Xk=1P'{Xk+1=1,Xk+2=1,...,XN-=1}pk+1pk+2...pN-

Biz, sadece ilgi yana (3) biz ayarlayabilir ( başarılarının kuyruktan elde edilmesi olasılığı). Ve parametrelendirmeyiP{S}P{Xk+1,...,XN}P{i=1,kXi=s;N(k+1)+1=l}i=k+1,NXiP{i=k,NXi=s;Nk+1=l}=ps,l

(4) ve parametrelerine dayalı model için MLE kullanın ile, için (ve herhangi bir ) ve diğer bazı doğal kısıtlar .p1,...,pNp0,1,p1,1;p0,2,p1,2,p2,2;...ps',l=0s'6l

Bu planla ilgili herşey yolunda mı?

GÜNCELLENDİ 2

Poisson dağılımı (mavi) ile karşılaştırıldığında ampirik dağılımın bazı örnekleri (kırmızı) (poisson araçları 2.22 ve 2.45, örnek boyutları 332 ve 259'dur):P{S}

sample1 sample2

Poisson 2.28 ve 2.51 (örnek boyutları 303 ve 249) olan örnekler (A1, A2) için:

sample3 sample4

Birleştirilmiş samlpe A1 + A2 için (örnek boyutu 552'dir):

örnek 3 + örnek 4

Görünüşe göre Poisson için bazı düzeltmeler en iyi model olmalı :).


2
Nelerdir ? Xben,j
chl

1
@Andrey (2) 'deki formüller ve (4)' deki ikinci kısıtlama anlamsızdır: şapkalar (4) 'te ne anlama geliyor? Nedir ? (Yalnızca tanımladığınız değil, .) Üç (4) toplamı içinde ifade mı ürünlere veya başka bir şey? SSjS
whuber

Xben,j Bernoulli rastgele sonuçlarıdır (j-th serisindeki i-sonuç), toplamın j-th sonucudur (serinin toplamı). toplamın rasgele değişkeni; (4) 'deki şapkalar, tahminler anlamına gelir. Dolayısıyla, en düşük değerlerinin toplamı hakkında bazı ekstra bilgiler vardır . Karışıklık için özür dilerim. SjSS
Andrey

Yanıtlar:


3

Bir yaklaşım, Xgenelleştirilmiş doğrusal model (GLM) ile. Burada formüle edersinizpben, başarı olasılığı benson gözlem tarihinin (lojistik doğrusal) bir işlevi olarak deneme. Yani esasen gürültünün Bernoulli ve link fonksiyonunun logit olduğu otoregresif bir GLM takıyorsunuz. Kurulum:

pben=f(b+bir1Xben-1+bir2Xben-2+...birkXben-k), nerede

f(x)=11+tecrübe(x), ve

Xben~BernÖullben(pben)

Modelin parametreleri {b,bir1,...birk}lojistik regresyon ile tahmin edilebilir. (Yapmanız gereken tek şey, her denemede gözlem geçmişinin ilgili bölümünü kullanarak tasarım matrisinizi oluşturmak ve bunu bir lojistik regresyon tahmin fonksiyonuna aktarmaktır; log olabilirliği içbükeydir, bu nedenle parametreler için benzersiz bir küresel maksimum vardır). Sonuçlar gerçekten bağımsız isebirben'sı sıfırlanacak; pozitifbirbendemek ki pbenbaşarı gözlendiğinde artar.

Model vermez üzerinde olasılığı için basit bir ifadeyi sağlamak toplamının arasındaXbenancak, model basit Markovian yapısına sahip olduğundan, simülasyon (parçacık filtreleme veya MCMC) ile hesaplanması kolaydır.

Bu tür bir model, beyindeki nöronların "sivri uçları" arasındaki zamansal bağımlılıkları modellemek için büyük bir başarı ile kullanılmıştır ve otoregresif nokta süreç modelleri hakkında kapsamlı bir literatür vardır. Bkz. Örneğin Truccolo ve ark. 2005 (bu makale Bernoulli olasılığı yerine bir Poisson kullanıyor olsa da, birinden diğerine eşleme basittir).


1

Bağımlılık topaklanmadan kaynaklanıyorsa, bileşik Poisson modeli, Sj. Çok özel bir rastgele referans bu Barbour ve Chryssaphinou ile.

Tamamen farklı bir yönde, çünkü N- 20'dir ve bu nedenle nispeten küçüktür. Xbenjancak kurulumunuzun ve verilerinizin mümkün olup olmadığını bilmiyorum. @Chl yorumları olarak, ne olduğunu açıklarsanız yararlı olacaktır.Xben,j'dır.

Eğer Xben,j'nin ardışık ölçümleri, örneğin zamanla temsil ettiği ve bağımlılık bununla ilişkili olduğu için üçüncü bir olasılık - ve yukarıdaki iki öneri arasında bir uzlaşma sağlamak için - gizli bir Markov modelini kullanmaktır. Xben,j'S.


Xben,jBernoulli'nin rastgele sonuçlarıdır. Yanlışlık için özür dilerim. Yani,Xbenspor takımlarının sıralı eşit zaman aralıkları için toplam puanlarıdır. İlk gol atıldıktan sonra, bir sonraki golün aralıktaki olasılıklarının farklı olacağı ortaya çıkmaktadır.
Andrey
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.