Topları Kovalara Atmak, olasılığının daha düşük bir oranını tahmin etmek


14

Öyle gözükse de bu bir ödev değil. Herhangi bir referans açığız. :-)

Senaryo: Var n farklı toplar ve n farklı (1'den etiketli kutuları n soldan sağa). Her top bağımsız olarak ve muntazam çöp kutularına atılır. Let f(i) topların sayısı, i ~ inci kutusu. Let Ei aşağıdaki olay belirtir.

Her ji , kjf(k)j1

Yani, ilk j kutuları (en soldaki j kutuları) her j i için j topundan daha az içerir .ji

Soru: Tahmin i<nPr(Ei) , açısından n ? Ne zaman n sonsuz gider. Daha düşük bir sınır tercih edilir. Kolayca hesaplanan bir formülün var olduğunu düşünmüyorum.

Pr(En)=0limnPr(E1)=limn(n1n)n=1ePr(En)=0

Tahminim: Sanırım i<nPr(Ei)=lnn , n sonsuza gittiğinde. Toplamdaki ilk \ ln nlnn öğeyi düşündüm .


1
Doğum günü probleminden bir subcase gibi görünüyor ..
Gopi

@Gopi Sorumun sınırlı doğum günü sorunu olduğuna kendimi ikna edemiyorum. Açıkça açıklayabilir misiniz? Çok teşekkür ederim. Not: Kısıtlama, belirli çöp kutusundaki kutu sayısı değil , ilk kutularındaki topların toplamıdır . j
Peng Zhang

Gerçekten, benim kötü, doğum günü problemi hakkında wikipedia makalesini yeniden okuduktan sonra Doğum Günü probleminden uyarlanmış başka bir sorun düşünüyor fark ettim.
Gopi

2
Bazı yanlış fikirler ... Bir durumun nasıl kodlanacağını düşünün: Soldan sağa doğru olan kutu formunu okuyun. İlk bölmede i topları varsa, bir sıra i ve ardından bir 0 çıkın. Bunu soldan sağa doğru tüm bölmeler için yapın. Sen kodlama bu ikili dize (n sıfırlar ve n olanlar var) ilk kez sıfırlardan daha fazla içerir içerdiği şekilde en büyük i ile ilgileniyor gibi görünüyor. Şimdi, bir kader sıçraması yapalım ve 0 ve 1'i eşit olasılıkla . (Bu tam bir saçmalık olabilir). Bu sorun Katalanca sayıları ve Dyck sözcükleri ile ilgilidir. Ve...??? 1/2
Sariel Har-Peled

4
Defnition'ınızda, topların neden farklı olduğu önemli değil. Ayrıca, dize etkileşimi, kutuların farklı olduğu gerçeğini hesaba katar.
Sariel Har-Peled

Yanıtlar:


11

EDIT: (2014-08-08) Douglas Zare yorumlarda belirtildiği gibi, aşağıdaki argüman, özellikle iki olasılık arasındaki 'köprü' yanlıştır. Bunu düzeltmek için basit bir yol göremiyorum. Hala bazı sezgi sağladığına inandığım için cevabı burada bırakacağım, ancak nin genel olarak doğru olmadığını .

Pr(Em)l=1mPr(Fl)

Bu tam bir cevap olmayacak, ancak umarım sizin veya kendimden daha bilgili birinin bitirebileceğinden daha fazla içeriğe sahip olacaktır.

İlk (of ) kutularına tam olarak toplarının düşme olasılığını düşünün :l nkln

(nk)(ln)k(nln)nk

Daha az olasılığını Çağrı topları ilk düşmek kutuları :llFl

Pr(Fl)=k=0l1(nk)(ln)k(nln)nk

Olay, olasılık , yukarıda ortaya çıkar biz her görüldüğü takdirde daha azdır seferde bağımsız meydana gelen olaylar ve tüm. Bu bize ikisi arasında bir köprü veriyor:ElFl

Pr(Em)l=1mPr(Fl)=l=1m(k=1l1(nk)(lnk)(nln)nk)=l=1mF(l1;n,ln)

Burada , Binom dağılımı için ile kümülatif dağılım işlevidir . Sadece Vikipedi sayfasında aşağı birkaç satır okuyarak ve belirterek , kullanabileceğimiz Chernoff'un eşitsizliği almak için:F(l1;n,ln)p=ln(l1pn)

Pr(Em)l=1mexp[12l]=exp[12l=1m1l]=exp[12Hm]exp[12(12m+ln(m)+γ)]

Nerede olan inci' Harmonik Numarası , Euler-Mascheroni sabiti ve için eşitsizlik olduğunu sayfasını bağlantılı Wolfram'ın MathWorld'den alınır.HmmγHm

faktörü hakkında endişelenmeyin , bu nihayet bize şunları verir:e1/4m

Pr(Em)eγ/2m

Aşağıda 100,000 örnekleri arasında bir ortalama bir log-log grafiğidir bir fonksiyonu olarak fonksiyonu de referans için çizilen:n=2048meγ/2m

resim açıklamasını buraya girin

Sabitler kapalıyken, işlevin şekli doğru gibi görünür.

Aşağıda, değiştiği bir günlük kaydı grafiği , her bir nokta bir fonksiyonu olarak 100.000 örneğin ortalamasıdır :nm

resim açıklamasını buraya girin

Son olarak, sahip olduğumuzu bildiğimiz için, yanıtlamak istediğiniz orijinal soruya :Pr(Em)1m

i<nPr(Ei)n

Sayısal doğrulama olarak, aşağıda toplamın bir log-log grafiği, , örnek boyutuna karşı, . Her nokta, 100.000 örneğin toplamının ortalamasını temsil eder. işlevi referans olarak çizilmiştir:Snx1/2

resim açıklamasını buraya girin

İkisi arasında doğrudan bir bağlantı görmeme rağmen, bu sorunun püf noktaları ve son şekli, başlangıçta yorumlarda tahmin edildiği gibi Doğum Günü Sorunu ile çok fazla ortaklığa sahiptir.


4
Nasıl ? Örneğin, ,İlk bölmenin boş olduğu söylenirse, bu, ilk iki kutunun en fazla top tutması olasılığını arttırıyor mu? Daha muhtemeldir, bu yüzden bir hafife alınır. Pr(E2)Pr(F1)×Pr(F2)n=100Pr(E2)=0.267946>0.14761=Pr(F1)Pr(F2).1Pr(F1)Pr(F2)
Douglas Zare

@ DouglasZare, hesaplamalarını doğruladım, haklısın. Daha titiz olmadığım için bana hizmet ediyor.
user834

15

Cevap .Θ(n)

İlk önce, 'i hesaplayalım .En1

Diyelim ki topları kutuya atıyoruz ve bir kutunun içinde tam olarak topu olması olasılığına bakalım . Bu olasılık Poisson dağılımının gelir ve sıra gider orada tam olarak olasılığını verilen bir tenekesine topları olan .nnknk1e1k!

Şimdi, topları çöp kutularına dağıtmanın farklı bir yoluna bakalım. Poisson dağılımından seçilen her kutuya bir dizi top atıyoruz ve toplamda top olması koşuluyla . Bunun topları kutulara atmakla aynı dağılımı verdiğini iddia ediyorum . Neden? Bu bulunma olasılığı olduğunu görmek kolaydır topları inci bin orantılıdır etmektir Her iki dağıtımlarda.nnnkjjj=1n1kj!

Öyleyse her adımda, sen gitmek rastgele yürüyüş düşünelim için olasılık ile . Bu rastgele yürüyüşün adımdan sonra 0'a dönmesi koşulunu koşullandırırsanız, bu rastgele her zaman üzerinde kalma olasılığının OP'nin hesaplamak istediği olasılık olduğunu iddia ediyorum . Neden? Sonra bu rasgele yürüyüş Bu yükseklik adımlar olup eksi birinci topların sayısı bidonları.tt+1k1e1k!n0sss

Her adımda yukarı veya aşağı gitme olasılığı olan rastgele bir yürüyüş seçmiş olsaydık , bunun cevabı olan klasik oylama problemi olurdu . Bu, incelenen oy pusulasının bir çeşididir ( bu makaleye bakınız ) ve cevap hala . Bu vaka için sabitini hesaplamanın kolay bir yolu olup olmadığını bilmiyorum .12112(n1)Θ(1n)Θ(1n)

Aynı makale, rastgele yürüyüşün yüksekliğinde bitmesi şartlandığında , her zaman pozitif kalma olasılığının olduğu sürece göstermektedir . Bu gerçek, herhangi bir için tahmin sağlayacaktır .kΘ(k/n)k=O(n)Ess

Cevabımın geri kalanı için biraz el yıkama olacağım, ancak bunu yapmak için standart olasılık teknikleri kullanılabilir.

giderken , bu rastgele yürüyüşün Brownian köprüsüne, yani başlayıp bitmesi koşullu Brown hareketine yaklaştığını biliyoruz . Genel olasılık teoremlerinden, , rasgele yürüyüş kabaca ekseninden uzaktır . Durumda, yükseklik sahip , bu üzerinde kalmıştır olasılığını önce tüm süre olan . Yana olduğu muhtemel olarak , elimizdekin0ϵn<s<(1ϵ)nΘ(n)xt>00sΘ(t/s)tΘ(n)s=Θ(n)EsΘ(1/n).


4

[Edit 2014-08-13: Peter Shor'un yaptığı bir yorum sayesinde, bu serinin asimptotik büyüme oranı tahminimi değiştirdim.]

, olarak büyüyor . Kanıtım yok ama sanırım ikna edici bir argümanım var.limni<nPr(Ei)n

Let bin topların sayısı veren bir rastgele değişken . Let kutularına topları sayısını verir rastgele değişken ile dahildir.Bi=f(i)iBi,j=k=ijBkij

Artık herhangi bir . Bu amaçla ve işlevlerini .Pr(Ei)=b<jPr(EjB1,j=b)Pr(EiEjB1,j=b)j<iπgi

π(j,k,b)=Pr(Bj=kB1,j1=b)=(nbk)(1nj+1)k(njnj+1)nbk

gi(j,k,b)=Pr(EiBj,ikEj1B1,j1=b)={0k<01k>=0j>il=0jb1π(j,l,b)gi(j+1,kl,b+l)otherwise

Biz yazabilir açısından :Pr(Ei)gi

Pr(Ei)=gi(1,i1,0)

Şimdi, tanımından açıktır ogi

Pr(Ei)=(ni)ni+1nnhi(n)

burada , derece cinsinden bir polinomdur . Bu da sezgisel bir anlam ifade ediyor; en azından topları ila inci kutulardan birine yerleştirilmelidir (bunlardan ).hi(n)ni1ni+1(i+1)nni

olduğunda sadece hakkında konuştuğumuz , sadece nin baş katsayısı önemlidir; bu katsayı diyelim . SonraPr(Ei)nhi(n)ai

limnPr(Ei)=aiei

nasıl hesaplarız ? Burası biraz el yıkama yapacağım yer. İlk birkaç üzerinde , bu katsayının hesaplanmasında bir örüntünün ortaya çıktığını göreceksiniz. Olarak yazabilirsinizaiEi

ai=μi(1,i1,0)
burada
μi(j,k,b)={0k<01k>=0i>jl=0jb11l!μi(j+1,kl,b+l)otherwise

Şimdi, doğrudan kapalı form eşdeğerini türetemedim, ancak nin ilk 20 değerini :Pr(Ei)

N       a_i/e^i
1       0.367879
2       0.270671
3       0.224042
4       0.195367
5       0.175467
6       0.160623
7       0.149003
8       0.139587
9       0.131756
10      0.12511
11      0.119378
12      0.114368
13      0.10994
14      0.105989
15      0.102436
16      0.0992175
17      0.0962846
18      0.0935973
19      0.0911231
20      0.0888353

Şimdi,

Pr(Ei)=iii!ei=Pois(i;i)

burada , ortalama ile bir Poisson dağılımından çekildiğinde rastgele bir değişkeninin değerine sahip olma olasılığıdır . Böylece toplamımızı şöyle yazabiliriz:Pois(i;λ)Xiλ

limni=1nPr(Ei)=x=1xxx!ex

Wolfram Alpha bana bu dizinin ayrıştığını söylüyor . Peter Shor, Stirling'in yaklaşımının yi tahmin etmemize izin verdiğine dair bir yorumda :Pr(Ei)

limnPr(Ex)=xxx!ex12πx

İzin Vermek

ϕ(x)=12πx

Dan beri

  • limxϕ(x)ϕ(x+1)=1
  • ϕ(x) azalıyor
  • 1nϕ(x)dx ,n

serilerimiz olarak büyür (Bkz. örneğin Teorem 2 ). Yani,1nϕ(x)dx

i=1nPr(Ei)=Θ(n)

1
Wolfram Alpha yanlış. Stirling'in formülünü kullanın . Diyor ki, . xx/(x!ex)1/2πx
Peter Shor

@PeterShor Teşekkürler! Anlayışınız sayesinde sonucu güncelledim ve şimdi diğer iki yanıta katılıyorum. Bu soruna oldukça farklı 3 yaklaşım görmek benim için ilginç.
ruds

4

İlk birkaç terimi ayrıntılı olarak kontrol etmek (tüm n ^ n vakalarını inceleyerek) ve biraz arama cevabın https://oeis.org/A036276 / . Bu, yanıtın .nnn12π2

Daha doğrusu, cevap: Ve kapalı form yok Cevap.

n!2nnk=0n2nkk!

Oeis oldukça harika
Thomas Ahle
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.