Çok terimli dağılım katsayılarının toplamı


10

Adil bir kalıp atıyorum. 1, 2 veya 3 aldığımda '1' yazıyorum; 4 aldığımda '2' yazıyorum; 5 veya 6 aldığımda '3' yazıyorum.

Let N Olmam yazdım tüm sayıların ürün için ihtiyaç atar toplam sayısının 100000 . Hesaplamak (veya yaklaşık) P(N25) ve Normal dağılımın bir fonksiyonu olarak bir yaklaşım verilebilir.

İlk olarak \ P (N \ geq 11) = 1 olduğunu biliyorum P(N11)=1çünkü log3100.00010.48 . Şimdi, a , b ve c sırasıyla 1, 2 ve 3 yazdığım sayı olsun. Sonra:

P(a,b,cn)={(na,b,c)(12)a(16)b(13)c if a+b+c=n0 otherwise

Ne hesaplamak istiyorum:

P(a+b+c252b3c100000)

Bunu nasıl hesaplayabilirim?

--DÜZENLE:

Bu yüzden durumu şu şekilde değiştirebileceğim önerildi:

P(a+b+c25αa+βb+γcδ)

burada , , ve .β = log 2 γ = log 3 δ = log 100000α=0β=log2γ=log3δ=log100000

Bu daha çözülebilir görünüyor! Ne yazık ki hala nasıl çözüleceğine dair hiçbir fikrim yok.


2
Forma durum yazmak için olsaydı + 1, bu sorun daha tanıdık küçük bir göz, ve yaklaşık çözümlere daha açık elverişli olabilir burada ve . α = 0 , β = log ( 2 ) , γ = log ( 3 ) , δ = log ( 100000 )αa+βb+γcδα=0,β=log(2),γ=log(3),δ=log(100000)
whuber

Durumu yazmak için bu yeni yolu ekledim, ancak maalesef bunun nasıl çözüleceğine dair en ufak bir fikrim yok!
Pedro Carvalho

Başka bir ipucu ise, '2' olayı varsa o zaman duracaksınız. Böylece, ve parametreleriyle (ayrıca ve ) negatif bir binom ile yaklaşık olarak tahmin edebilirsiniz . Kesin cevap da çok fazla kombinasyon olmadığı için yönetilebilir. Ayrıca, koşul doğru değildir - Bunu '2' veya '3' kaydedildi eklemeniz gerekir inci rulo17170.5111/3N
probabilityislogic

Yanıtlar:


1

Bu soru, çok terimli bir rastgele değişkenin doğrusal fonksiyonu olan bir miktarla uğraştığınız özel bir durumdur. Gerekli eşitsizliği karşılayan çok terimli kombinasyonları numaralandırarak ve bu aralıktaki dağılımı toplayarak probleminizi tam olarak çözmek mümkündür. büyük olduğu durumda , bu hesaplama açısından mümkün olmayabilir. Bu durumda, multinomial'e normal yaklaşımı kullanarak yaklaşık bir dağılım elde etmek mümkündür. Bu yaklaşımın genelleştirilmiş bir versiyonu aşağıda gösterilmiştir ve daha sonra bu özel örneğinize uygulanır.N


Genel yaklaşım sorunu: Varsayalım ki aralık ile değiştirilebilir rasgele değişkenler . Herhangi bir için, sayı sayılan sayı oluşturabiliriz sekansın ilk değerlerinde her sonucun ortaya çıkışı . Alttaki dizi değiştirilebilir olduğundan, sayım vektörü şu şekilde dağıtılır:n, N x x ( n ) ( X 1 , x 2 , . . . , X, m ) , n1,2,...,mnNXX(n)(X1,X2,...,Xm)n

X ~ Mu(n,θ)θ=limnX(n)/n.

Şimdi, negatif olmayan ağırlıkların bazı vektörlerimiz olduğunu varsayalım ve bu ağırlıkları doğrusal işlevi tanımlamak için kullanıyoruz:w=(w1,w2,...,wm)

A(n)i=1mwiXi.

Ağırlıklar negatif olmadığından, bu yeni miktar cinsinden azalmaz . Daha sonra sayısını tanımlıyoruz , doğrusal fonksiyonumuz için belirli bir minimum değer elde etmek için gereken en az sayıda gözlemdir. Bu değerin (stokastik olarak) büyük olması durumunda dağılımına yaklaşmak istiyoruz .N ( a ) dk { n N | A ( n ) a } N ( a )nN(a)min{nN|A(n)a}N(a)


Genel yaklaşım problemi çözmek: İlk olarak, not bu yana olan olmayan azalan (tüm ağırlıklar, negatif olmayan olduğu varsayılmaktadır, çünkü alır), var:nA(n)n

P(N(a)n)=P(N(a)>n1)=P(A(n1)<a).

Dolayısıyla, dağılımı doğrudan dağılımı ile ilgilidir . Önceki miktarın büyük olduğu varsayılarak, ayrı rasgele vektör 'u çok değişkenli normal dağılımdan sürekli bir yaklaşımla değiştirerek ikincisinin dağılımına yaklaşabiliriz. Bu, doğrusal nicelik için normal bir yaklaşıma yol açar ve bu miktarın momentlerini doğrudan hesaplayabiliriz. Bunu yapmak için , ve için . Bazı temel cebirlerde bu bize şunları verir:A X A ( n ) E ( X i ) = n θ i V ( X iNAXA(n)E(Xi)=nθiC ( X i , X j ) = - n θ i θ j i jV(Xi)=nθi(1θi)C(Xi,Xj)=nθiθjij

μE(1nA(n))=i=1mwiθi,

σ2V(1nA(n))=i=1mwiθi(i=1mwiθi)2=μ(1μ).

Multinomial'e normal yaklaşımı almak şimdi bize yaklaşık dağılım . Bu yaklaşım getirilerinin uygulanması:A(n) ~ N(nμ,nμ(1μ))

P(N(a)n)=P(A(n1)<a)Φ(a(n1)μ(n1)μ(1μ)).

(Sembol standart normal dağılım fonksiyonu için standart gösterim içindir.) Miktar ile ilgili olasılıkları bulmak için bu yaklaşım uygulamak mümkündür belirli bir değeri için . Bu, temel multinomiyal sayım değerlerinin değerlerine süreklilik düzeltmesini dahil etmeye çalışmayan temel bir yaklaşımdır. Tam doğrusal fonksiyon ile aynı ilk iki merkezi an kullanılarak normal bir yaklaşım kullanılarak elde edilir.N ( a ) aΦN(a)a


Sorununuza uygulama: Sorununuzda , ağırlıklar ve kesme değeri . Bu nedenle (altı ondalık basamağa yuvarlama) . Yukarıdaki yaklaşımı uygulayarak (altı ondalık basamağa yuvarlama):w=(0,ln2,ln3)a=ln100000μ=1θ=(12,16,13)w=(0,ln2,ln3)bir=ln100000μ=16ln2+13ln3=0.481729

P(N-(bir)25)Φ(ln100000-240.481729240.499666)=Φ(-0.019838)=0,492086.

Kesin multinom dağılımının uygulanması, gereksinimini karşılayan tüm kombinasyonların toplanmasıyla , kesin sonucun . Dolayısıyla, yaklaşımın mevcut davadaki tam cevaba oldukça yakın olduğunu görebiliriz.P ( N ( a ) 25 ) = 0.483500P(bir(24)<bir)P(N-(bir)25)=0.483500

Umarım bu cevap size özel sorunuzun cevabını verirken, aynı zamanda sorunuzu multinomial random vektörlerin doğrusal fonksiyonları için geçerli olan daha genel bir olasılıksal sonuçlar çerçevesine yerleştirir. Mevcut yöntem, karşılaştığınız genel tipteki sorunlara yaklaşık çözümler elde etmenize ve örneğinizdeki belirli sayılarda değişikliklere izin vermelidir.


0

Normal bir yaklaşım yapalım.

İlk olarak, probleminizi günlüklerde tamamen yeniden ele alalım. T = 0 zamanında 0 ile başlarsınız. Ardından, her zaman adımında şunları eklersiniz:

  • 0 olasılıkla 1/2

  • günlük(2) 1/6 olasılıkla

  • günlük(3) 1/3 olasılıkla

Toplamınız aştığında , bu noktada kaç atış yaptığınıza baktığınızda bu işlemi durdurursunuz . Bu noktaya ulaşmak için atmanız gereken atış sayısı ^Kgünlük(105)N-

Hesap makinem, artışlarınızın ortalamasının: ve varyansın olduğunu söylüyor . Referans olarak, bitiş noktası bu yüzden kabaca 24 adımda ona ulaşacağız0.25 11.510,480.2511.51

25 adım atmış olmamız şartıyla, toplamın dağılımı kabaca 12.0 merkezli ve 6.25 varyanslı bir Gauss'tur. Bu, bize bir Gauss yaklaştırması verir.p(N-25)0.5

Gauss yaklaşımının iyi olup olmadığını bilmek için N = 25'teki toplamın kümülatörlerine bakmanız gerekir. Artımların simetrik olmadığı düşünüldüğünde, yakl.


1
Benim için türetmeyi tamamlayabilir misin? Bunu görmekte zorlanıyorum. Ayrıca, bunu hesaplamanın kesin bir yolu yok mu?
Pedro Carvalho

1
Eğer log (1) ve log (2) bulunan "log (2)" ve "log (3)" demek istemiyor musunuz?
Glen_b

@GuillaumeDehaene yazdı: .... Benim hesaplama ile, iki farklı şekilde, çok farklıP ( N 25 ) = 1 - P ( N 24 ) = 1 - 1127291856633071p(N-25)0.5P(N-25)=1-P(N-24)=1-112729185663307164998372267786240,8266
wolfies

P (n \ leq24) \ yaklaşık 0.18'i nasıl alırsınız?
Guillaume Dehaene
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.