Düzgün ve yanlı madeni para arasındaki istatistiksel mesafe


9

İzin Vermek U üzerinde eşit dağılım n bit ve izin D dağıtım olmak n bitlerin bağımsız olduğu ve her bitin bit olduğu 1 olasılıkla 1/2ϵ. Arasındaki istatistiksel mesafeninD ve U dır-dir Ω(ϵn), ne zaman n1/ϵ2?


2
Evet. Arasındaki istatistiksel mesafeU ve V en azından PrU(xi>n/2)PrD(xi>n/2), hangisi Ω(εn); Örneğin, buradaki matus cevabına bakınız: cstheory.stackexchange.com/questions/14471/…
Yury

2
Teşekkürler. Belki bunu kabul edebileceğim bir cevapta yazılanlardan nasıl alacağımı açıklayabilirim?
Manu


1
Matus'un cevabı ile ilgili olarak, Slud eşitsizliğinden daha iyisini yapabilirsiniz; bkz. (2.13,2.14), arxiv.org/abs/1606.08920
Aryeh

Yanıtlar:


7

Tarafından rastgele bitleri göster x1,,xn. Tanım olarak, arasındaki istatistiksel mesafeU ve D en azından PrU(xit)PrD(xit) herkes için t. Biz seciyoruzt=n/2+n.

Bunu not et PrU(xit)c1 bazı mutlak sabitler için c1>0. EğerPrD(xit)c1/2, o zaman istatistiksel mesafe en azından c1/2ve işimiz bitti. Bu yüzden aşağıda varsayıyoruzPrD(xit)c1/2.

İzin Vermek f(s)=Pr(xit) iid Bernoulli rastgele değişkenler için x1,,xn ile Pr(xi=1)=1/2s. Amacımız bunu kanıtlamakf(0)f(ε)=Ω(εn). Ortalama değer teoremi ile,

f(0)f(ε)=εf(ξ),
bazı ξ(0,ε). Şimdi bunu kanıtlayacağızf(ξ)Ω(n); istenen istatistiksel mesafenin en azındanΩ(nε), gereğince, gerektiği gibi.

Yazmak,

f(ξ)=kt(nk)(12ξ)k(12+ξ)nk,
ve
f(ξ)=kt(nk)(k(12ξ)k1(12+ξ)nk+(nk)(12ξ)k(12+ξ)nk1)=kt(nk)(12ξ)k(12+ξ)nkk/2+kξ(nk)/2+(nk)ξ(1/2ξ)(1/2+ξ).
Bunu not et
k/2+kξ(nk)/2+(nk)ξ(1/2ξ)(1/2+ξ)=(2kn)/2+nξ(1/2ξ)(1/2+ξ)2(2tn)=4n.
Böylece,
f(ξ)4nkt(nk)(12ξ)k(12+ξ)nk=4nf(ξ)4nf(ε)4n(c1/2).
Here, we used the assumption that f(ε)=PrD(x1++xnt)c1/2. We showed that f(ξ)=Ω(n).

5

A somewhat more elementary, and slightly messier proof (or at least it feels so to me).

For convenience, write ε=γn, with γ[0,1) by assumption.

We explicitly lower bound the expression of dTV(P,U):

2dTV(P,U)=x{0,1}n|(12+γn)|x|(12γn)n|x|12n|=12nk=0n(nk)|(1+2γn)k(12γn)nk1|12nk=n2+nn2+2n(nk)|(1+2γn)k(12γn)nk1|Cnk=n2+nn2+2n|(1+2γn)k(12γn)nk1|
where C>0 is an absolute constant. We lower bound each summand separately: fixing k, and writing =kn2[n,2n],
(1+2γn)k(12γn)nk=(14γ2n)n/2(1+2γn12γn)(14γ2n)n/2(1+2γn12γn)nne4γ2γ2
so that each summand is lower bounded by a quantity that converges (when n) to e4γ2γ21>4γ2γ2>2γ; implying that each is Ω(γ). Summing up, this yields
2dTV(P,U)Cnk=n2+nn2+2nΩ(γ)=Ω(γ)=Ω(εn)
as claimed.

(Using Hellinger as a proxy because of its nice properties wrt product distributions is tempting, and would be much faster, but there would be a loss by a quadratic factor in the end lower bound.)
Clement C.

1
Nice! I like the elementary approach. We should be able to make it non-asymptotic in n too.... one way is to use (1+z1z)n(1+2z)n, then use the nice inequality 1+weww2/2. A bit messier.
usul
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.