Ters Chernoff bağlı


31

Kuyruk olasılığının en azından bu kadar olmasını sınırlayan ters bir Chernoff sınırı var mı?

yani eğer bağımsız binom rasgele değişkenleri ve . Daha sonra ispat bir fonksiyonu .X1,X2,,Xnμ=E[i=1nXi]Pr[i=1nXi(1+δ)μ]f(μ,δ,n)f


1
çok soruyor: standart bir Chernoff sınırı ve \ Pr [| T \ cap S_2 | \ sqrt {1.1} \ leq n ^ {1/3}] en fazla \ exp (-cn ^ { 1/3}) bazıları için c . p=n2/3Pr[|TS1|1.1n1/3]Pr[|TS2|1.1n1/3]exp(cn1/3)c
Colin McQuillan

Haklısın, komşu ülkede hangi terimin kareye sahip olduğu konusunda kafam karıştı. Zayıf bir bağı yansıtmak için soruyu değiştirdim. Mevcut başvurumda bana yardımcı olacağını sanmıyorum, ancak diğer nedenlerden dolayı ilginç olabilir.
Ashwinkumar BV

Yanıtlar:


28

Burada, standart bir Chernoff sınırının, belli bir parametre aralığı için üs içindeki sabit etkenlere kadar sıkı olduğuna dair kesin bir kanıt bulunmaktadır. (Özellikle, değişkenler 0 veya 1 olduğunda ve olasılıkları 1/2 veya daha az olan 1 ve ϵ(0,1/2) olduğunda ve Chernoff üst sınırı bir sabitten daha az olduğunda.)

Bir hata bulursanız, lütfen bana bildirin.

Lemma 1. (Chernoff'un sıkılığı) X'in k bağımsız, 0/1 rasgele değişkenlerin (rv) ortalaması olsun . Herhangi bir \ epsilon \ in (0,1 / 2] ve p \ in (0,1 / 2] , \ epsilon ^ 2 pk \ ge 3 varsayımı için ,Xkϵ(0,1/2]p(0,1/2]ϵ2pk3

(i) Her rv olasılıkla en fazla p ise 1 ise p,

Pr[X(1ϵ)p]  exp(9ϵ2pk).

(ii) Her rv olasılık en az p ise 1 ise p,

Pr[X(1+ϵ)p]  exp(9ϵ2pk).

Kanıt. Aşağıdaki gözlemi kullanıyoruz:

İddia 1. Eğer , daha sonra ( k1k1(k)  1e2π(k)(kk)k

İstem 1'in kanıtı. Stirling'in yaklaşık olarak, buradaA,[1/(12i+1),1/12i].i!=2πi(i/e)ieλλ[1/(12i+1),1/12i].

Böylece, , ki bu , en az QED k!(k)k!!(k)!1

2πk(ke)k2π(e)  2π(k)(ke)kexp(112k+1112112(k))
  12π(k)(kk)ke1.

Lemma Kanıtı 1 Bölüm (i). Genelliği kaybetmeden toplamı her 0/1 rastgele değişken kabul olasılık ile 1 tam . Not , toplamına eşittir ve .p Pr [ X ( 1 - ϵ ) p ] ( 1 - ϵ ) p k i = 0 Pr [ X = i / k ] Pr [ X = i / k ] = ( kX pPr[X(1ϵ)p]i=0(1ϵ)pkPr[X=i/k]Pr[X=i/k]=(ki)pi(1p)ki

Düzeltme . Toplamdaki terimler artıyor, yani dizinindeki terimlerin her birinin değeri en az , bu nedenle toplamlarının en az toplam değeri vardır . İspatı tamamlamak için şunu gösteririz i Pr [ X = / k ] ( ϵ p k - 2 ) Pr [ X = / k ] ( ϵ p k - 2 ) Pr [ X = / k ] exp ( - 9 ϵ=(12ϵ)pk+1iPr[X=/k](ϵpk2)Pr[X=/k]

(ϵpk2)Pr[X=/k]  exp(9ϵ2pk).

Varsayımlar ve , verir , bu nedenle yukarıdaki sol taraf en azından . İstem 1 'i kullanarak, e bağlı olmak , en azından burada ve ε 1 / 2 ε p k 6 2ϵ2pk3ϵ1/2ϵpk6(k23ϵpk(k)p(1p)k A(k)A = 2AB B= ( kA=23eϵpk/2πB=(k)(kk)kp(1p)k.

Bitirmek için ve .B exp ( - 8 ε 2 p k )Aexp(ϵ2pk)Bexp(8ϵ2pk)

2. İstem Aexp(ϵ2pk)

7. İstem 2'nin Kanıtı. Varsayımlar ve (i) .ε 1 / 2 s k 12ϵ2pk3ϵ1/2pk12

Tanım olarak, . (İ) ile, . Böylece, (ii) .p k 12 pk+1pk121.1pk

(İi) sağ tarafı ikame içinde (iii) verir .A A 2AA23eϵpk/2.2π

varsayımı, (iii) ile (iv) veren anlamına gelir. .ϵ ϵ2pk3 A 2ϵpk3A23e3/2.2π0.1

Kaynaktan bu (v) aşağıdaki .exp ( - ε 2 p k ) exp ( - 3 ) 0.04ϵ2pk3exp(ϵ2pk)exp(3)0.04

(iv) ve (v) birlikte talepte bulunurlar. QED

İstem 3. .Bexp(8ϵ2pk)

İstem 3. kanıtı Fix bu şekilde . seçimi anlamına gelir , bu nedenle iddia . Bu eşitsizliğin her iki tarafını da gücüne alıp sadeleştirerek, yerine koyma ve basitleştirme, = ( 1 - δ ) p k δ 2 ε B exp ( - 2 δ 2 p k ) - 1 /δ=(1δ)pk
δ2ϵBexp(2δ2pk)1/=(1-δ)pk(1-δ)(1+δp

pk(k(1p)k)k/1  exp(2δ2pk).
=(1δ)pkln(1+z)z-δ
(1δ)(1+δp1p)1(1δ)p1  exp(2δ21δ).
Her iki tarafın logaritmasını alarak ve iki kez kullanarak , Yukarıdaki sol tarafta ya , çünkü dan azdır, çünkü . QEDln(1+z)zδ2/
δ+δp1p(1(1δ)p1)  2δ21δ.
2 δ 2 / ( 1 - δ ) p 1 / 2δ2/(1p)(1δ)2δ2/(1δ)p1/2

İstem 2 ve 3, . Bu, lemin parçasını (i) ifade eder.ABexp(ϵ2pk)exp(8ϵ2pk)

Lemma Kanıtı 1 Kısım (ii). Genellik kaybı olmadan, her rastgele değişkenin olasılıkla tam olarak olduğu olduğunu kabul edin .p1p

Not . Düzeltme . = ( 1 + 2 ε ) p k - 1Pr[X(1+ϵ)p]=i=(1ϵ)pknPr[X=i/k]^=(1+2ϵ)pk1

En son toplamı en az , en azından . (Bunun kanıtı, yerine yerine ve yerine yerine , hariç, (i) ile aynıdır. .) QED( ε p K - 2 ) Pr [ X = / k ] exp (ϵpk(ϵpk2)Pr[X=^/k] ö - ö = ( 1 +exp(9ϵ2pk)^δδ^^=(1+δ^)pk


Birkaç [matematik işlem hatası] s - bunları düzeltme şansınız var mı?
Aryeh

Bu matematik ifadeleri sadece iyi göstermek için kullanılır. Bazı nedenlerden dolayı \ select komutu mathjax'ta çalışmıyor. İkisi de \ binom. Örneğin, $ a \ select b $ verir . Muhtemelen bu, mathjax konfigürasyonunda bir hatadır. Umarım yakında düzeltilecektir. Bu arada, arxiv.org/pdf/cs/0205046v2.pdf veya cs.ucr.edu/~neal/Klein15Number ekinde Lemma 5.2'ye bakınız . (ab)
Neal Young,

22

Berry-Esseen teoremi da daha yüksek olduğu sürece, kuyruk olasılığı alt sınır verebilir .n1/2

Kullanabileceğiniz bir diğer araç Paley-Zygmund eşitsizliği . Bu, herhangi bir tamsayı ve herhangi bir gerçek değerli rastgele değişkeni için ,XkX

Pr[|X|>=12(E[Xk])1/k]E[Xk]24E[X2k]

Birlikte multinomial teoremi ile, için bir toplamı rademacher rastgele değişkenlerin Paley-Zygmund size oldukça güçlü alt sınır alabilirsiniz. Ayrıca sınırlı bağımsızlık rasgele değişkenleri ile çalışır. Örneğin, 4-bilge bağımsız rasgele değişkenlerinin toplamının, sabit olasılıkla olduğunu kolayca alırsınız .n n ± 1 Ω ( Xnn±1Ω(n)


14

Eğer gerçekten Bernoulli denemelerinin sınırlayıcı toplamlarına uyuyorsanız (ve sınırlı rastgele değişkenleri söylemezseniz), aşağıdakiler oldukça sıkıdır.

Slud Eşitsizliği *. Let istatistiksel bağımsız bir Bernoulli rv çizer olmak ve izin tamsayıdır verilebilir. (A) ve veya (b) , burada standart bir normalin cdf'sidir. E ( X 1 ) = p k{Xi}i=1nE(X1)=pp 1 / 4 , n p k , n s k N ( 1 - p ) Pr [ Σ i X ik ]1 - Φ ( k - n pknp1/4npknpkn(1p)Φ

Pr[iXik]1Φ(knpnp(1p)),
Φ

(Argümanı standart normalin dönüştürülmesi olarak olarak kabul etmek, bu CLT'nin size söylediklerini tam olarak kabul eder; aslında, teorem koşullarını sağlayan Binomların üst kuyruklarda karşılık gelen Gauss'larına hükmedeceğini söyler.)Φ

Buradan, daha güzel bir şey elde etmek için üzerindeki sınırları kullanabilirsiniz . Örneğin, Feller'in ilk kitabında, Gaussian'lar bölümünde, her için burada standart bir normalin yoğunluğudur. "Q-function" için Wikipedia makalesinde de benzer sınırlar var.Φz>0φ

z1+z2φ(z)<1Φ(z)<1zφ(z),
φ

Bunun dışında ve diğer insanların söylediklerini de, belki de bazı Stirling'lerle doğrudan Binomial'ı kullanmayı deneyebilirsiniz.

(*) Slud'un eşitsizliğinin yeni ifadeleri bu koşullardan bazılarını dışlar; Slud'un kağıdındaki yazıyı çoğalttım.


7

De Moivre-Laplace Teoremi,uygun şekilde normalleştirildikten ve belirli koşullar altında olduktan sonra, dağılımda normal dağılıma dönüşecektir. Eğer sürekli daha düşük sınırlar istiyorsanız bu yeterli.|TS1|

gibi daha düşük sınırlar için biraz daha ince bir araca ihtiyacınız vardır. İşte bildiğim bir referans (ancak sadece kazayla - böyle bir eşitsizliği kendim kullanma fırsatı bulamadım). Binom dağılımları kuyruk olasılıkları Bazı açık alt sınır Teorem 1.5 olarak verilmiştir kitap Rastgele grafikleri daha da referanslar verilmektedir Béla Bollobás, Cambridge, 2. baskı, tarafından olasılık ve onun uygulamalarına bir giriş Feller tarafından ve Olasılık Vakıflar Renyi tarafından.nc


4

Genelleştirilmiş Littlewood-Offord Teoremi tam olarak istediğiniz şey değildir, ancak rastgele değişkenlerin toplamının belirli bir değerin etrafındaki küçük bir aralığa düşme ihtimalinin düşük olduğunu göstererek, "ters Chernoff" olarak düşündüğümü verir. beklenti). Belki de faydalı olacaktır.

Resmen, teorem aşağıdaki gibidir.

Genelleştirilmiş Littlewood-Offord Teoremi : ve gibi gerçek sayılar olsun için ve izin değerleri sıfır ve bir sahiptir bağımsız rastgele değişkenler. İçin , varsayalım tüm . Sonra, herhangi bir , sadece bağlı bir sabittir .a1,,ans>0|ai|s1inX1,,Xn0<p12pPr[Xi=0]1p1inrR

Pr[ri=1naiXi<r+s]cpn
cpp

3
Bu tür bir sonucun "küçük top eşitsizliği" olarak da bilindiğini ve Nguyen ve Vu'nun müthiş bir anketi olduğunu bilmek başkalarına yardımcı olabilir. Math.osu.edu/nguyen.1261/cikk/LO-survey.pdf . Buradaki bakış açım sizinkinden biraz farklı. Ben küçük bir topun olasılık kütlesinin daha düşük bir tahminini vermek gibi bir "ters Chernoff" olduğunu düşünüyorum. Küçük top olasılığının topun 0 ile maksimize olduğunu söyleyerek nitel olarak küçük top eşitsizliği olduğunu düşünüyorum. anlamda tersine Chernoff sınırlarının küçük top eşitsizliklerinden daha kolay anlaşılır olması gerekir.
Sasho Nikolov

3

Standart Chernoff'ta belirtilen, Wikipedia'da belirtildiği gibi bağlı olan 0/1 değerli rastgele değişkenler için sıkıdır. Let ve izin bağımsız rastgele değişken bir dizisi, örneğin bu her , ve . Sonra her , 0<p<1X1,X2,iPr[Xi=1]=pPr[Xi=0]=1pε>0

2D(p+εp)nn+1Pr[i=1nXi(p+ε)n]2D(p+εp)n.

Burada, , yani Bernoulli rasgele arasındaki Kullback-Leibler sapması ve parametreli değişkenler .D(xy)=xlog2(x/y)+(1x)log2((1x)/(1y))xy

Belirtildiği gibi, yukarıdaki eşitsizlikteki üst sınır, "Chernoff-Hoeffding Teoremi, katkı formu" adı altında Wikipedia'da ( https://en.wikipedia.org/wiki/Chernoff_bound ) ispatlanmıştır . Alt sınır örneğin "tip metotlar" kullanılarak kanıtlanabilir. [1] deki Lemma II.2'ye bakınız. Ayrıca, bu klasik ders kitabında Cover ve Thomas tarafından bilgi teorisi üzerine yazılmıştır.

[1] Imre Csiszár: Türler Yöntemi. IEEE Bilişim Teorisi İşlemleri (1998). http://dx.doi.org/10.1109/18.720546


Ayrıca, ve ortak durum için olduğuna dikkat etmek gerekir. o . Bu, zaman tipik sınırının keskin olduğunu gösterir. (Ve ne zaman için ). D(p+δpp)=p22pδ2+O(δ3)p=1/2δ=O(n-1/3)E-δ2δ=O(n-1/4)p=1/212δ2+O(δ4)δ=O(n1/3)eCδ2δ=O(n1/4)p=1/2
Thomas Ahle,
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.