Kupon toplayıcı zamanında sıkı bir alt sınır nedir?


20

Klasik bir kupon Collector problemi , iyi zaman olduğu bilinmektedir gerekli bir dizi tamamlamak için rastgele seçilmiş kuponlar tatmin , ve .TnE[T]nlnnVar(T)n2Pr(T>nlnn+cn)<ec

Bu üst sınır, kabaca olan Chebyshev eşitsizliğinin verdiği sınırdan daha iyidir .1/c2

Sorum şu: T için karşılık gelen Chebyshev'den daha iyi bir alt sınır var mı? (ör. \ Pr (T <n \ ln n - cn) <e ^ {- c} ) gibi bir şey?TPr(T<nlnncn)<ec


Açık bir alt sınır Pr(T<n)=0 , ama sanırım bunun farkındasınız ...
onestop

Yanıtlar:


14

Analiz tamamen temel olduğu ve tam olarak istenen sonucu verdiği için bunu ikinci bir cevap olarak veriyorum.

Öneri için c>0 ve n1 ,

P(T<nlogncn)<ec.

İspatın arkasındaki fikir basit:

  1. Tüm kuponların T = \ sum_ {i = 1} ^ n T_i olarak toplandığı süreyi temsil edin T=i=1nTi; burada Ti , i (Şimdiye kadar) benzersiz kuponun toplandığı zamandır . Ti ortalama süreleri ile geometrik rasgele değişkenlerdir nni+1 .
  2. Chernoff bağlı bir sürümünü uygulayın ve basitleştirin.

Kanıt

Herhangi bir ve herhangi bir , s > 0 P ( T < t ) = P ( e - s T > e - s t ) e s t E e - s Tt s>0

P(T<t)=P(esT>est)estEesT.

Bu yana ve bağımsızdır, yazabiliriz T i E e - s T = n i = 1 E e - s T iT=iTiTi

EesT=i=1nEesTi

Şimdi geometrik olduğu için, diyelim ki başarı olasılığı ile birlikte , basit bir hesaplama p i E e - s T i = p iTipi

EesTi=pies1+pi.

eden sorun için olan , , , vb Bu nedenle, p 1 =pipp1=1p 3 = 1 - 2 / n n i = 1 E e - s T i = n i = 1 i / np2=11/np3=12/n

i=1nEesTi=i=1ni/nes1+i/n.

Diyelim seçim ve bazıları için . Sonra ve , t = ns=1/nc > 0 e s t = n e - c e s = e 1 / n1 + 1 / n n i = 1 i / nt=nlogncnc>0

est=nec
es=e1/n1+1/n
i=1ni/nes1+i/ni=1nii+1=1n+1.

Bunu bir araya getirince,

P(T<nlogncn)nn+1ec<ec

istediğiniz gibi.


Bu çok güzel ve sadece doktorun emrettiği şey. Teşekkür ederim.
David

@David, sadece meraklı: Amaçlanan uygulama nedir?
kardinal

Uzun Hikaye. İlgilendiğim bir algoritmanın çalışma süresini analiz etmek için pişirdiğim bir Markov zincirinin karıştırma süresi için bir alt sınır kanıtlamaya çalışıyorum - bu da c'yi daha düşük sınırlamaya indirgiyor toplayıcı sorunu. BTW, tam olarak bu tür Chernoff tarzı bağlı bulmaya çalışıyordum, ancak bu üründen nasıl kurtulacağını anlayamadım . İyi arama :-). s = 1 / nis=1/n
David

@David, , neredeyse kesinlikle yetersiz olsa da, türetmede elde edilenle aynı terim olan verdiğinden denemek için bariz bir şey gibi görünüyordu . üst sınır. e s ts=1/nest=nec
kardinal

1
Talep : Yukarıda verdiğim kanıt benim. Sorun beni ilgilendirdiğinden, keyifle çalıştım. Ancak, yenilik hakkında hiçbir iddiada bulunmuyorum. Gerçekten de benzer bir tekniği kullanan benzer bir kanıtın literatürde zaten var olduğunu hayal edemiyorum. Bir referansı bilen biri varsa, lütfen buraya bir yorum olarak gönderin . Ben olacağını çok birinin bilmek ilgi.
kardinal

9

@Cardinal zaten tam olarak aradığım sınırı veren bir cevap vermiş olsa da, daha güçlü bir sınır verebilecek benzer bir Chernoff tarzı argüman buldum:

Önerme : (bu için daha güçlüdür )c > π 2

Pr(Tnlogncn)exp(3c2π2).
c>π23

İspat :

@ Cardinal'in cevabında olduğu gibi, başarı olasılıkları olan bağımsız geometrik rastgele değişken toplamı olduğu gerçeğini kullanabiliriz . Bundan sonra ve .T i p i = 1 - i / nTTipi=1i/n E [ T ] = n i = 1 E [ T i ] = n n i = 1 1E[Ti]=1/piE[T]=i=1nE[Ti]=ni=1n1inlogn

Şimdi yeni değişkenleri tanımlayın ve . Daha sonra S : =Si:=TiE[Ti] Pr ( T n günlüğü n - c n ) Pr ( T E [ T ] - c n ) = Pr ( S - c n ) = Pr ( exp ( - s SS:=iSi

Pr(Tnlogncn)Pr(TE[T]cn)=Pr(Scn)
=Pr(exp(sS)exp(scn))escnE[esS]

Ortalamaları hesaplarken,

E[e-sS]=ΠbenE[e-sSben]=Πbenes/pben1+1pben(es-1)e12s2Σbenpben-2
burada eşitsizlik ve ayrıca için .es-1sez1+ze12z2z0

Böylece, , yazabiliriz Σbenpben-2=n2Σben=1n-11ben2n2π2/6

Pr(Tngünlükn-cn)e112(nπs)2-scn.

üzerinde küçülme , sonunda s>0

Pr(Tngünlükn-cn)e-3c2π2

1
(+1) Modulo birkaç küçük yazım hatası, bu güzel. Yaptığınız gibi ortalamanın yakınında bir şeyi genişletmek genellikle daha iyi çalışır. Asimtotik sonuçların ışığında daha yüksek mertebe yakınsamayı gördüğüme şaşırmadım. Şimdi, benzer bir üst sınır gösterirseniz, , ölçüm konsantrasyonu ile ilgili birçok etkisi olan Vershynin terminolojisinde altsal olduğunu kanıtlar . (T-ngünlükn)/n
kardinal

1
Argüman doğrudan üst sınırda genelleşiyor gibi görünmüyor. Alma için (ve için ), bir hesaplama noktasına aynı aşamaları takip edebilir . Ancak bu noktada yapabileceğim en iyi şey , yine de ve bununla ne yapacağımı bilmiyorumc-cs-sE[esS]Πbene-s/pben1-spbene-z1-zexp(z22(1-z))
E[esS]e12s2Σbenpben2(1-s/pben)
David

2
İlginçtir ki, tüm argüman (alt sınır için) sadece kupon toplayıcı problemi için değil , sınırlı varyansa sahip özdeş olmayan, bağımsız geometrik değişkenlerin herhangi bir toplamı için işe yarıyor gibi görünüyor . Spesifik olarak: verilen , burada her , başarı olasılığı olan bağımsız bir ve burada , sonra T i p i T=ΣbenTbenTbenpbenΣbenpben-2bir<
Pr(TE[T]-bir)e-bir22bir
David

4

Önemli Not : Bu cevapta ilk verdiğim kanıtı kaldırmaya karar verdim. Daha uzun, daha hesaplıydı, daha büyük çekiçler kullandı ve verdiğim diğer kanıtlara kıyasla daha zayıf bir sonuç gösterdi. Her yerde, daha aşağı bir yaklaşım (benim görüşüme göre). Eğer ediyorsanız gerçekten ilgilenen, sana düzenlemeleri bakabilirsiniz varsayalım.

Aslen alıntıladığım ve bu cevapta hala aşağıda bulunan asimtotik sonuçlar, , tüm için geçerli olan diğer cevapta kanıtlanan sınırdan biraz daha iyi yapabileceğimizi göstermektedir .n n


Aşağıdaki asimtotik sonuçlar geçerlidir

P(T>ngünlükn+cn)1-e-e-c

ve

P(Tngünlükn-cn)e-ec.

Sabit ve limitler olarak alınır . İki sonuca ayrılsalar da, her iki durumda da negatif olması kısıtlanmadığından, hemen hemen aynı sonuç olduğunu unutmayın. n ccR,nc

Bir kanıt için bkz. Örneğin Motwani ve Raghavan, Randomize Algoritmalar , sayfa 60-63.


Ayrıca : David, bu cevabın yorumlarında belirtilen üst sınırı için bir kanıt sağlar.


Evet, her sabit için geçerlidir . (Çok basit) bir kanıt, örneğin Levin, Peres ve Wilmer'in Markov Zincirler ve Karıştırma Süreleri, Öneri 2.4 kitabında bulunabilir. Kanıt alt sınırda işe yaramıyor. n
David

1
Aslında, kanıtı burada da : " [kupon] türünün ilk kuponları arasında görünmemesi olayı olsun . İlk önce denemenin kupon olasılığı olduğundan ve denemeler bağımsız olduğundan, yukarıdaki sağ taraf yukarıda , kanıtlıyor (2.7). " birbenbenngünlükn+cnP(τ>ngünlükn+cn)=P(benbirben)ΣbenP(birben)1-n-1benΣben(1-1/n)ngünlükn+cnnexp(ngünlükn+cnn)=e-c
David

@David, bu yeterince hoş ve basit. İçerme-hariç tutma formülünü başka bir terimle genişletme ile hızlı bir şekilde oynadım, ancak hızlı bir şekilde bir yere ulaşmadım ve daha fazla bakmak için zamanım olmadı. Olay herhangi bir kupon sonra kalan durumunda eşdeğerdir denemeleri. Bununla bağlantılı bir martingale olmalı. Hoeffding'in (varsayılan) ilişkili martingale üzerindeki eşitsizliğini denediniz mi? Asimptotik sonuç, güçlü ölçüm konsantrasyonunu göstermektedir. {T<tn}tn
kardinal

@David, yukarıdaki kanıtınızda bir işaret var, ancak eminim diğer okuyucular için de açık.
kardinal

@David, lütfen sorunuza gönderilen diğer cevabımı görün. Yöntem, verdiğiniz üst sınırdan farklıdır, ancak burada verdiğim cevabın aksine, kullanılan araçlar neredeyse temeldir.
kardinal

2

Benjamin Doerr verir : a biraz basit kanıtı ( "Tesadüf Arama Buluşsal Analizi Olasılık Teorisi gelen Araçlar" bölümünde kitabında "Tesadüf Arama Heuristic'lerin Teorisi" içinde, bir online PDF için bağlantıya bakınız)

Teklif kupon toplama sürecinin durma süresi olsun . Sonra .TPr[T(1-ε)(n-1)lnn]e-nε

Bu istenen asimtotikleri (@ cardinal'in ikinci cevabından) veriyor gibi görünüyor, ancak tüm ve için doğru olma avantajı ile .nε

İşte bir kanıt taslağı.

Prova : Kuponun ilk çekilişinde toplanması olayı olsun . Böylece, . Anahtar gerçek şu ki, , , . Sezgisel olarak bu bilerek olarak, oldukça açıktır ilk oyunu bırakanların kupon daha az olası olduğunu yapacak çizer -inci kupon da ilk çekilir çizer. XbenbentPr[Xben=1]=(1-1/n)tXbenben[n]Pr[benben,Xben=1]ΠbenbenPr[Xben=1]bentjt

Bir kişi iddiayı kanıtlayabilir, ancak set her adımda 1 büyütür . Daha sonra için . Eşdeğer olarak, ortalamayı . Doerr bunun için sadece sezgisel bir argüman sunuyor. İspat için bir yol şöyledir. Bir şartına olduğunu gözlemleyebilirsiniz içinde kuponlar sonuçta çıkan kupon dan Yeni kupon çizim olasılığı olduğunu, çizildikten sonra şimdiye kadar şimdi , öncekinin yerinebenPr[benben,Xben=1|Xj=1]Pr[benben,Xben=1]jbenj I I k | I | - kPr[benben,Xben=1|Xj=0]Pr[benben,Xben=1]jbenbenk | I| -k|ben|-kn-1 jben|ben|-kn . Zaman çürüyen geometrik rasgele değişkenlerin toplamı olarak tüm kuponları toplamak için Böylece, o klima görebilirsiniz peşine -coupon daha muhtemel (daha önce kupon toplamak için başarı olasılıklarını arttırır ve böylece yalnızca onu yapar klima yapıyor stokastik egemenlik ile: her geometrik rasgele değişken stokastik egemenlik açısından şartlandırma ile arttırılır ve bu egemenlik daha sonra toplamda uygulanabilir).jben

Bu negatif korelasyon göz önüne alındığında, aşağıdaki , verir ile istenen sınır . t = ( 1 - ϵ ) ( n - 1 ) ln nPr[T(1-ε)(n-1)lnn](1-(1-1/n)t)nt=(1-ε)(n-1)lnn

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.