Madeni para saygısı için ciddi bir derinlemesine sorun sorunu


10

Diyelim ki 10 bin dolarlık bozuk para yapıyorum. Üst üste arka arkaya 4 veya daha fazla kafa almak için kaç döndürme olasılığını bilmek istiyorum.

Sayım aşağıdaki gibi çalışır, art arda sadece bir kafa olmak üzere bir tur döndürürsünüz (4 kafa veya daha fazla). Bir kuyruk vurur ve kafa çizgisini kırarsa, sayı bir sonraki kapaktan tekrar başlar. Bu daha sonra 10.000 döndürme için tekrarlanır.

Arka arkaya sadece 4 veya daha fazla kafa değil, 6 veya daha fazla ve 10 veya daha fazla olasılığını bilmek istiyorum. 9 kafa çizgisi elde edilip edilmediğini açıklığa kavuşturmak için, 2 ayrı çizgi değil, 1 çizgi 4 veya daha fazla (ve / veya 6 veya daha fazla) olarak bahsedilecektir. Örneğin, para THTHTHTHHHHHH /// THAHTHT .... geldiyse, sayı 13 olur ve bir sonraki kuyruklarda tekrar başlar.

Diyelim ki veriler sağda çok eğri çıkıyor; ortalama 4 veya daha fazla bir çizgi elde etmek için ortalama 40 döndürür ve dağılım u = 28'dir. Açıkça çarpıktır.

Açıklayıcı verilerden bir anlam çıkarmanın bir yolunu bulmak için elimden geleni yapıyorum, ancak şu andan itibaren hiçbir şey bulamadım.

Bundan mantıklı bir olasılık elde etmenin bir yolunu bulmak istiyorum. +/- 1 SD'nin% 68 vs. olduğu normal bir eğri gibi.Günlük normalleştirmeye baktım ve bu sadece benim amacım olmayan bir parametrik test için kullanılıyor.

Bana beta dağıtımları söylendi ama sahip olduğum her öneri oldukça kafa karıştırıcıydı. Bu soruyu bir yıl önce sordum ve bazı fikirler edindim ama maalesef hala bir cevabım yok. Fikirleri olan herkese teşekkür ederim.


Muhtemelen biraz açıklığa kavuşturmalıyım. 1) Çarpık bir veri setinden 1000 flipste (normal eğri olasılığı +/- 1 SD =% 68 gibi bir şeye benzer) 4'ün üstündeki ardışık kafa miktarının açıklayıcı verilerini anlamaya çalışıyorum. 2) Bir beta dağıtımı kullanılması önerilir, ancak başka bir öneri harika olurdu!
Dan

1
Dan, sadece örnek kafa ve kuyruk setinizde "A" olduğunu fark ettim.
Glen_b

Yaptığınız düzenleme büyük bir gelişme ancak bazı değişiklikler yapmamız gerekiyor. "Ve dağıtım u = 28" derseniz, tam olarak ne demek istiyorsunuz? Ortanca hakkında mı konuşuyorsun?
Glen_b

@Beta sadece Bayesci bir yaklaşım kullanıyor ve bir kafa olasılığını tahmin ediyor ve daha sonra bu dağılımı (ve ilişkili belirsizliğini) belirttiğiniz problemin matematiksel sonucuna uygularsanız bu soruna neden olabilir.
AdamO

Yanıtlar:


12

Doğru anladıysam, sorun veya daha fazla başın ilk çalışmasının bittiği zaman için bir olasılık dağılımı bulmaktır .n

Düzenle Olasılıklar matris çarpımı kullanılarak doğru ve hızlı bir şekilde belirlenebilir ve ortalamayı ve varyans olarak analitik olarak hesaplamak da mümkündür. burada , ancak muhtemelen dağıtımın kendisi için basit bir kapalı form yoktur. Belirli bir bozuk para sayısında, dağıtım esasen geometrik bir dağılımdır: bu formu daha büyük için kullanmak mantıklı olacaktır .σ 2 = 2 n + 2 ( μ - n - 3 ) - μ 2 + 5 μ μ = μ - + 1 tμ=2n+11σ2=2n+2(μn3)μ2+5μμ=μ+1t

Durum uzayındaki olasılık dağılımı zamanındaki evrim, durumları için bir geçiş matrisi kullanılarak modellenebilir , burada ardışık madeni paraların sayısı. Devletler aşağıdaki gibidir:n =k=n+2n=

  • Devlet , kafa yokH0
  • Devlet , kafaları, i 1 i ( n - 1 )Hii1i(n1)
  • Devlet , veya daha fazla kafa nHnn
  • Devlet , veya daha fazla kafaları kuyruk izledi nHn

durumuna girdikten sonra diğer eyaletlere geri .H

Devletlere girebilecek devlet geçiş olasılıkları aşağıdaki gibidir

  • Devlet : olasılığı gelen , , yani kendisi de dahil olmak üzere, ancak durum değil1H0 Hii=0,,n-1Hn12Hii=0,,n1Hn
  • Devlet : olasılığı gelen1Hi Hi-112Hi1
  • Devlet : olasılığı gelen ile durumundan, yani, kafaları ve kendisi1Hn Hn-1,Hnn-112Hn1,Hnn1
  • Devlet : olasılık gelen gelen ve olasılık 1 (kendisi)1H HnH12HnH

Örneğin, için bu, geçiş matrisini verirn=4

X={H0H1H2H3H4HH01212121200H11200000H20120000H30012000H400012120H0000121}

Durum için , olasılıkların ilk vektör olan . Genelde ilk vektörde p p = ( 1 , 0 , 0 , 0 , 0 , 0 ) p i = { 1 i = 0 0 i > 0n=4pp=(1,0,0,0,0,0)

pi={1i=00i>0

vektörü , belirli bir süre için uzayda olasılık dağılımıdır . Gerekli cdf zaman içinde bir cdf'dir ve en az jeton dönüşünü bitirmiş olma olasılığıdır . Bu aşağıdaki gibi ifade edilebilir Devletin ulaşmak belirterek, ardışık para döndürür ve vadede verilmesinin ardından 1 timestep. n t ( X t + 1 p ) k H pnt(Xt+1p)kH

Zaman içinde gerekli pmf olarak yazılabilir . Ancak sayısal olarak bu, çok daha küçük bir sayıyı ( ) çok küçük bir sayıdan ayırmayı içerir ve hassasiyeti kısıtlar. Bu nedenle hesaplamalarda yerine daha iyidir. Sonra ortaya çıkan matrisi için yazmak , pmf . Herhangi bir için çalışan aşağıdaki basit R programında uygulanan şey budur ,1 X k , k = 0 X X = X | X k , k = 0 ( X t + 1 p ) k n 2(Xt+1p)k(Xtp)k1Xk,k=0XX=X|Xk,k=0(Xt+1p)kn2

n=4
k=n+2
X=matrix(c(rep(1,n),0,0, # first row
           rep(c(1,rep(0,k)),n-2), # to half-way thru penultimate row
           1,rep(0,k),1,1,rep(0,k-1),1,0), # replace 0 by 2 for cdf
         byrow=T,nrow=k)/2
X

t=10000
pt=rep(0,t) # probability at time t
pv=c(1,rep(0,k-1)) # probability vector
for(i in 1:(t+1)) {
  #pvk=pv[k]; # if calculating via cdf
  pv = X %*% pv;
  #pt[i-1]=pv[k]-pvk # if calculating via cdf
  pt[i-1]=pv[k] # if calculating pmf
}

m=sum((1:t)*pt)
v=sum((1:t)^2*pt)-m^2
c(m, v)

par(mfrow=c(3,1))
plot(pt[1:100],type="l")
plot(pt[10:110],type="l")
plot(pt[1010:1110],type="l")

Üst grafik pmf'yi 0 ile 100 arasında gösterir. Alt iki grafik pmf'yi 10 ile 110 arasında ve ayrıca 1010 ile 1110 arasında gösterir, öz benzerliği ve @Glen_b'in dediği gibi dağılımın olabileceği gibi görünür çökme döneminden sonra geometrik bir dağılım ile yaklaşmıştır.

resim açıklamasını buraya girin

bir özvektör dekompozisyonu kullanılarak bu davranışı daha da araştırmak mümkündür . Bunu yapmak, yeterince büyük , , burada , denkleminin çözümü olduğunu gösterir. . Bu yaklaşım, artan ile daha iyi hale gelir ve hesaplaması için aşağıdaki günlük hatası grafiğinde gösterildiği gibi değerine bağlı olarak yaklaşık 30 ila 50 aralığında için mükemmeldir (gökkuşağı renkleri, kırmızı için solt p t + 1c ( n ) p t c ( n ) 2 n + 1 c n ( c - 1 ) + 1 = 0 n t n p 100 n = 2 tXtpt+1c(n)ptc(n)2n+1cn(c1)+1=0ntnp100n=2). (Aslında sayısal nedenlerden dolayı, daha büyük olduğunda olasılıklar için geometrik yaklaşımı kullanmak daha iyi olur .)t

resim açıklamasını buraya girin

Dağıtım için kullanılabilir kapalı bir form olabileceğinden şüpheleniyorum (ed) çünkü bunları aşağıdaki gibi hesapladığım araçlar ve varyanslar

nMeanVariance2724315144431736563339261271472072556169685112534409102310291201020474151296

(Bunu elde etmek için zaman ufkunu artırmak t=100000zorunda kaldım, ancak program hala tüm için yaklaşık 10 saniyeden daha kısa sürede koştu .) Özellikle çok açık bir örüntü izler; varyanslar daha az. Geçmişte daha basit, 3 durumlu bir geçiş sistemini çözdüm, ancak şimdiye kadar bu sisteme basit bir analitik çözümle şansım yok. Belki farkında olmadığım bazı yararlı teoriler vardır, örneğin geçiş matrisleriyle ilgili.n=2,,10

Düzenleme : çok yanlış başlar sonra ben bir yineleme formülü ile geldi. Let durum olma ihtimali olduğu süre içinde . Let halde olma olasılığı toplu olarak süre içinde, örneğin, son durum, . NBpi,tHitq,tHt

  • Verilen herhangi bir , ve , alanı üzerinde bir olasılık dağılımıdır ve hemen altında olasılıklarının 1 eklediği gerçeğini kullanıyorum.tpi,t,0inq,ti
  • p,t zaman içinde bir olasılık dağılımı oluşturur . Daha sonra bu gerçeği araç ve varyansları elde etmede kullanıyorum.t

zamanında birinci durumda olma olasılığı , yani kafa yok, zamanından dönebilen durumlardan (toplam olasılık teoremini kullanarak) geçiş olasılıkları tarafından verilir . Ancak durumundan e ulaşmak için adım alır , bu nedenle ve Bir kez daha toplam olasılık teoremi ile durumundat+1t

p0,t+1=12p0,t+12p1,t+12pn1,t=12i=0n1pi,t=12(1pn,tq,t)
H0Hn1n1pn1,t+n1=12n1p0,t
pn1,t+n=12n(1pn,tq,t)
Hnzaman olduğunu ve gerçeğini kullanarak , Bu nedenle, , t+1
pn,t+1=12pn,t+12pn1,t=12pn,t+12n+1(1pn,tnq,tn)()
q,t+1q,t=12pn,tpn,t=2q,t+12q,t
2q,t+22q,t+1=q,t+1q,t+12n+1(12q,tn+1+q,tn)
tt+n
2q,t+n+23q,t+n+1+q,t+n+12nq,t+112n+1q,t12n+1=0

Bu nüks formülü ve vakalarını kontrol eder . Örneğin için bu formülün bir grafiği kullanarak makine siparişi doğruluğu verir.n=4n=6n=6t=1:994;v=2*q[t+8]-3*q[t+7]+q[t+6]+q[t+1]/2**6-q[t]/2**7-1/2**7

resim açıklamasını buraya girin

Düzenle Bu yineleme ilişkisinden kapalı bir form bulmak için nereye gideceğini göremiyorum. Ancak, bir ortalama için kapalı bir form elde etmek mümkün.

den başlayarak ve , gelen miktarda alarak için ortalama formülü uygulamak ve çekerek olasılık dağılımını verir ()p,t+1=12pn,t

pn,t+1=12pn,t+12n+1(1pn,tnq,tn)()2n+1(2p,t+n+2p,t+n+1)+2p,t+1=1q,t
t=0E[X]=x=0(1F(x))p,t
2n+1t=0(2p,t+n+2p,t+n+1)+2t=0p,t+1=t=0(1q,t)2n+1(2(112n+1)1)+2=μ2n+1=μ
Bu, durumuna ulaşmanın ortalamasıdır ; kafaların çalışmasının sonu için ortalama bundan daha azdır.H

Düzenleme formülünü kullanarak benzer bir yaklaşımbu sorudan sapma verir. E[X2]=x=0(2x+1)(1F(x))

t=0(2t+1)(2n+1(2p,t+n+2p,t+n+1)+2p,t+1)=t=0(2t+1)(1q,t)2t=0t(2n+1(2p,t+n+2p,t+n+1)+2p,t+1)+μ=σ2+μ22n+2(2(μ(n+2)+12n+1)(μ(n+1)))+4(μ1)+μ=σ2+μ22n+2(2(μ(n+2))(μ(n+1)))+5μ=σ2+μ22n+2(μn3)+5μ=σ2+μ22n+2(μn3)μ2+5μ=σ2

Araçlar ve varyanslar programlı olarak kolayca oluşturulabilir. Örneğin, yukarıdaki tablodan ortalamaları ve sapmaları kontrol etmek için

n=2:10
m=c(0,2**(n+1))
v=2**(n+2)*(m[n]-n-3) + 5*m[n] - m[n]^2

Sonunda, yazarken ne istediğinden emin değilim

bir kuyruk vurduğunda ve kafa çizgisini kırarsa, sayı bir sonraki kapaktan tekrar başlar.

veya daha fazla başın ilk çalışmasının bittiği bir sonraki olasılık dağılımının ne olduğunu kastediyorsanız , önemli nokta @Glen_b tarafından bu yorumda yer almaktadır, bu da sürecin bir kuyruktan sonra tekrar başlamasıdır (cf hemen veya daha fazla kafa çalıştırabileceğiniz ilk sorun ).nn

Bu, örneğin, ilk olayın ortalama süresinin , ancak olaylar arasındaki ortalama sürenin her zaman olduğu anlamına gelir (varyans aynıdır). Sistem "yerleştikten" sonra bir durumda bulunma ihtimalini araştırmak için bir geçiş matrisi kullanmak da mümkündür. Uygun geçiş matrisi elde etmek için, set ve yüzden derhal durum sistem geri durumundan . Sonra bu yeni matrisin ölçekli ilk özvektörü sabit olasılıklar verir . İle , bu sabit olasılıklarμ1μ+1Xk,k,=0X1,k=1H0Hn=4

probabilityH00.48484848H10.24242424H20.12121212H30.06060606H40.06060606H0.03030303
Durumlar arasında beklenen süre, olasılığın karşılıklı değeri tarafından verilir. Dolayısıyla ziyaretler arasında beklenen süre .H=1/0.03030303=33=μ+1

Ek : Kesin olasılıklar üretmek için kullanılan Python programı n= Nfırlatmalar üzerinde ardışık kafa sayısı .

import itertools, pylab

def countinlist(n, N):
    count = [0] * N
    sub = 'h'*n+'t'
    for string in itertools.imap(''.join, itertools.product('ht', repeat=N+1)):
        f = string.find(sub)
        if (f>=0):
            f = f + n -1 # don't count t, and index in count from zero 
            count[f] = count[f] +1
            # uncomment the following line to print all matches
            # print "found at", f+1, "in", string
    return count, 1/float((2**(N+1)))

n = 4
N = 24
counts, probperevent = countinlist(n,N)
probs = [count*probperevent for count in counts]

for i in range(N):
    print '{0:2d} {1:.10f}'.format(i+1,probs[i]) 
pylab.title('Probabilities of getting {0} consecutive heads in {1} tosses'.format(n, N))
pylab.xlabel('toss')
pylab.ylabel('probability')
pylab.plot(range(1,(N+1)), probs, 'o')
pylab.show()

7

Beta'nın bu sorunla başa çıkmanın bir yolu olarak özellikle uygun olacağından emin değilim - "Şu ana kadarki oyun sayısı ..." açıkça bir sayı. Bu bir tamsayıdır ve pozitif olasılık elde ettiğiniz değerlerde üst sınır yoktur.

Buna karşılık, beta dağılımı sürekli ve sınırlı bir aralıkta, bu yüzden alışılmadık bir seçim gibi görünüyor. Ölçekli bir beta ile anında eşleşirseniz, kümülatif dağılım işlevleri dağıtımın merkezi gövdesinde çok da kötü olmayabilir. Bununla birlikte, başka bir seçeneğin her iki kuyruğa da önemli ölçüde daha iyi gelmesi muhtemeldir.

Dağılımdaki olasılıklar veya simülasyonlar için bir ifadeniz varsa (yaklaşık bir beta bulmak için muhtemelen ihtiyacınız olan), bunları doğrudan neden kullanmıyorsunuz?


Eğer ilginiz olasılıklar için ifadeler bulmak ya da gereken fırlatma sayısının olasılık dağılımını bulmaksa, muhtemelen en basit fikir olasılık üreten işlevlerle çalışmaktır. Bunlar, işlevlerin olasılıklar arasında özyinelemeli ilişkilerden türetilmesi için yararlıdır, bu da işlevler (pgf), ihtiyaç duyduğumuz tüm olasılıkları çıkarmamıza izin verir.

Cebirsel yaklaşımı iyi cevap alan, pgfs ve nüks ilişkilerini hem zorlukları hem de iyi kullanan bir yazı. "Arka arkaya iki başarı" durumunda ortalama ve varyans için belirli ifadeler vardır:

/math/73758/probability-of-n-successes-in-a-row-at-the-k-th-bernoulli-trial-geometric

Dört başarı vakası elbette çok daha zor olacak. Öte yandan, bazı şeyleri basitleştirir.p=12

-

Sadece sayısal cevaplar istiyorsanız, simülasyon nispeten basittir. Olasılık tahminleri doğrudan kullanılabilir ya da alternatif olarak simüle edilmiş olasılıkların düzeltilmesi mantıklı olacaktır.

Yaklaşık bir dağıtım kullanmanız gerekiyorsa, muhtemelen oldukça iyi olan bir şey seçebilirsiniz.

Negatif binomların bir karışımı ('başarı sayısı' sürümü yerine 'deneme sayısı' sürümü) makul olabilir. İki veya üç bileşenin, aşırı kuyruk hariç tümünde iyi bir yaklaşım sağlaması beklenmelidir.

Bir yaklaşım için tek bir sürekli dağıtım istiyorsanız, beta dağıtımından daha iyi seçenekler olabilir; araştırmak için bir şey olurdu.


Tamam, o zamandan beri küçük bir cebir yaptım, bazıları nüks ilişkileriyle, bazı simülasyonlarla ve hatta küçük bir düşünce ile oynadım.

Çok iyi bir yaklaşımla, sanırım ilk dört sıfır olmayan olasılıkları (kolay) belirtmek, bir kaç avuç değer tekrarını (aynı zamanda kolay) kullanarak hesaplamak ve daha sonra tekrarlama ilişkisi olduğunda geometrik bir kuyruk kullanmaktan kurtulabilirsiniz. başlangıçta olasılıkların daha az sorunsuz ilerlemesini düzeltti.

Geometrik kuyruğu k = 20'yi aşan çok yüksek doğrulukta kullanabileceğiniz gibi görünüyor, ancak sadece 4 rakam doğruluğu hakkında endişeleniyorsanız, daha önce getirebilirsiniz.

Bu, pdf ve cdf'yi doğru bir şekilde hesaplamanıza izin vermelidir.

Biraz endişeliyim - hesaplamalarım ortalama fırlatma sayısının 30.0 olduğunu ve standart sapmanın 27.1 olduğunu; "x" ve "u" ile ne demek istediğinizi anladıysam, savurmanızda 40 ve 28 var. 28 iyi görünüyor ama 40 ne var oldukça bir yol gibi görünüyor ... bu beni endişelendiriyor yanlış bir şey yaptım.

====

NOT: İlk karşılaştığımız ve sonraki karşılaştığımız zamanlar arasındaki karmaşıklıklar göz önüne alındığında, şimdi aynı şeyi saydığımızdan kesinlikle emin olmak istiyorum.

Burada, '4 veya daha fazla H' dizisinin uçları işaretlenmiş olan kısa bir dizi verilmiştir (son H'den hemen sonra döndürmeler arasındaki boşluğu işaret eder)

       \/                     \/
TTHHHHHHTTHTTTTTHHTTHTTHHTHHHHHT...
       /\                     /\

Bu iki işaret arasında 23 döndürme sayıyorum; yani önceki (H bu durumda 6) H dizisi biter bitmez, T'yi hemen takip eden saymaya başlarız ve sonra bir sonraki diziyi bitiren 5 H dizisinin (bu durumda) sonuna kadar sayarız. , bu durumda 23 sayısını verir.

Onları böyle mi sayıyorsunuz?


Yukarıdakilerin doğru olduğu göz önüne alındığında, en az 4 başlığın bir çalışması tamamlandıktan sonra en az 4 başlığın bir sonraki çalışması tamamlanana kadar fırlatma sayısının olasılık işlevi şöyledir:

Bozuk para probları

İlk bakışta, ilk birkaç değer için düz gibi görünüyor, sonra geometrik bir kuyruğu var, ancak bu izlenim oldukça doğru değil - etkili bir geometrik kuyruğa yerleşmek biraz zaman alıyor.

Bu süreçle ilişkili olasılıklarla ilgili sorularınızı yanıtlamak için kullanabileceğiniz uygun bir yaklaşımla çalışıyorum ve aynı zamanda mümkün olduğunca basit olan iyi bir doğrulukla çalışıyorum. Çalışması gereken oldukça iyi bir yaklaşımım var (bir milyar bozukluğun simülasyonuna karşı zaten kontrol ettim), ancak yaklaşımın aralığın bir bölümünde verdiği olasılıklarda (küçük ama tutarlı) bir önyargı var ve fazladan bir doğruluk rakamı alıp alamayacağımı görün.

Bunu yapmanın en iyi yolu, sadece olasılık dağılımının bir tablosunu ve ötesinde geometrik bir dağılımın kullanılabileceği bir noktaya cdf vermektir.

Ancak, yaklaşımı kullanmanız için ihtiyaç duyduğunuz bir dizi şey hakkında fikir verebiliyorsanız yardımcı olacaktır.


Ben pgf yaklaşımını takip etmeyi umuyorum, ancak başkalarının onlarla benden daha yetkin olması ve sadece 4 davayı değil, diğer vakaları da yapabilmesi mümkündür.


Belki işleri daha da netleştirmek için. 4 daha başarılı başlığın akışını dikkate alan simülasyonu ayarlayan veya uzlaştıran bir dağıtım ideal olacaktır. Örneğin, populatoin ortalaması arka arkaya 4 kafa için 150 döndürürse. 8. kapakta 4 veya daha fazla kafa gelirse. Başka bir 4 veya daha fazla kafanın başka bir 20 ya da daha fazla dönüşe (muhtemelen tahmin ediyorum) gelmesi ve belki de ortalamaya daha yakın olması olası değildir. Bana olası 4 ardışık kafa belirli bir fırlatma aralığında meydana gelme olasılığını verecek bir şey ŞAŞIRTICI olurdu.
Dan

Sadece 4 kafaya sahip olduğunuzda, 5. bir kafa alırsanız, bu en son 4 setini başka bir 4 set olarak yapar veya sayımı sıfırlar, böylece ilk kafadan tekrar başlarsınız (gördüğünüz anda bir)?
Glen_b

(Şimdiye kadar dört kişilik bir dizi oluşturursanız, üst üste binme
olmadığını varsayalım

4 kafa veya daha fazla, 4 kafadan sonra bir kuyruk alır almaz çizgi durur. Ardından, art arda 4 veya daha fazla kafa görene kadar sayım yeniden başlar.
Dan

4 kafa ya da daha fazla - Aslında soruda söylediği şey bu, sadece tam olarak anlayamamıştım. Yani 9 kafa iki kafa 4 kafa olarak sayılmaz. Bu yaptığım hesaplamaları tamamen değiştiriyor. Kullandığım yineleme ilişkisi yanlış. Temel kavram - geometrik bir kuyruğa sahip olması - yine de tutacak.
Glen_b -Monica

0

Geometrik dağılımı istiyorsunuz . Wikipedia'dan:

Bernoulli çalışmalarının sayısının olasılık dağılımı, {1, 2, 3, ...} setinde desteklenen bir başarı elde etmek için gerekliydi.X

H kafaları bir başarısızlık olsun ve kuyruklar T bir başarı olsun. Rastgele değişkeni , ilk kuyrukları görmek için gereken jeton çevirme sayısıdır. Örneğin, , HHHT dizisi olacaktır. İşte için olasılık dağılımı :XX=4X

P(X=x)=(1p)x1p

Ancak, sadece kafa sayısını istiyoruz. Bunun yerine kafa sayısı olarak tanımlayalım . İşte dağıtım:Y=X1

P(Y+1=x)=(1p)x1pP(Y=x1)=(1p)x1pP(Y=y)=(1p)yp

için . Adil bir para olduğunu varsayıyoruz, yapıyoruz . Bu nedenle: y=0,1,2,3...p=0.5

P(Y=y)=(0.5)y(0.5)=0.5y+1

Bu, döndürme sayısının yeterince büyük (10.000 gibi) olduğunu varsayar . Daha küçük (sonlu) için, ifadeye normalleştirme faktörü eklememiz gerekir . Basitçe söylemek gerekirse, toplam toplamın 1'e eşit olduğundan emin olmalıyız. Bunu olarak tanımlanan tüm olasılıkların toplamına bölerek bunu yapabiliriz :nnα

α=i=0n1P(Y=i)

Bu , ile gösterilen düzeltilmiş formunun şöyle olacağı anlamına gelir:YZ

P(Z=z)=1α(1p)zp=1i=0n1(1p)ip(1p)zp

Yine, , bir geomoetrik seri toplamı kullanarak bunu daha da azaltabiliriz :p=0.5

P(Z=z)=1i=0n10.5i+10.5z+1=110.5n0.5z+1=0.5z+110.5n

Ve , değiştirilmiş versiyonumuzun daha önce yaklaştığını görebiliriz.nZY


2
Sanırım kaçırmış olabileceğiniz sorunun bazı detayları var. Soruyu yanlış anlayamadıkça, bu sadece geometrik değil.
Glen_b

Sonlu n'yi işlemek için güncelledim. Ve evet, görüyorum ki tam olarak saymak yerine bir pencereyi taşımak istiyor. Benimki sadece zincirler için çalışıyor, aralarındaki zaman değil.
clintonmonk

İyi bir ilk adım @ Glen_b'nin gönderisindeki grafiğe bakmak ve bunu kopyalayıp kopyalayamayacağınızı görmek. Kesin olasılıkları kontrol etmek için yazdığım Python programını da ekledim. Bunu çalıştırabiliyorsanız, eşleşmeleri yazdıran, N5 ile 7 arasında bir yere inen çizgiyi açın ve gerekli olaylar için iyi bir fikir edineceksiniz (not pylabyalnızca çizim için gereklidir).
TooTone

Maalesef şu anda bunu test edebileceğim bir PC çevresinde değilim. Sabit sol'nun geometrik olduğunu göstermek için bir Markov işlemi kullanmaya başladım (ve E [geri dönme zamanı = = 1 / ), ama tamamen ete vaktim yoktu. πi
clintonmonk

Evet, eğer sabit bir çözümle, kuyrukta bir sabite dönüşen ardışık olasılıkların oranından bahsediyorsanız, önceki çözümlerin de söylediği gibi, sabit çözüm gerçekten geometriktir.
Glen_b
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.