Toplar ve Bölmeleri analizi


23

mnmnXiiXmaxXminXsecmaxXiXjN(0,2m/n)|XiXj|=Θ(m/n) i,jXmaxXmin=O(mlogn/n)n/2 ayrık kutu çifti. Bu (formel olan) bağımsız değişken açar bize beklemek arasındaki boşluk Xmax ve Xmin olduğunu Θ(mlogn/n) yüksek bir olasılıkla.

Xmax ve X _ {\ mathrm {sec-max}} arasındaki boşlukla ilgileniyorum Xsecmax. Yukarıda ana hatlarıyla verilen argüman , yüksek olasılıkla XmaxXsecmax=O(mlogn/n) yüksek olasılıkla gösteriyor, ancak logn faktörü gereksiz görünüyor . X_ \ max - X _ {\ mathrm {sec-max}} dağılımı hakkında bilinen bir şey var mı XmaxXsecmax?

Daha genel olarak, her topun her kutu için negatif olmayan bir skorla ilişkili olduğunu ve m toplarını attıktan sonra her kutunun toplam puanıyla ilgilendiğimizi varsayalım . Genel senaryo, formun puanlarına karşılık gelir (0,,0,1,0,,0) . Puanların olasılık dağılımının kutuların müsaadesi altında değişmez olduğunu varsayalım (olağan senaryoda, bu tüm kutuların denkleştirilebilir olduğu anlamına gelir). Puanların dağılımı göz önüne alındığında, X _ {\ max} - X _ {\ min} üzerinde iyi bir sınır elde etmek için ilk paragrafın yöntemini kullanabiliriz XmaxXmin. Bağlama \ sqrt {\ log n} faktörünü içerecektirlognbu sınır bağlı bir sendikadan geliyor (normal bir değişkenin kuyruk olasılıkları aracılığıyla). X _ {\ max} - X _ {\ mathrm {sec-max}} sınırlamasıyla ilgileniyorsak, bu faktör azaltılabilir XmaxXsecmaxmi?


Her skor [0,1] de mi?
Neal Young,

Gerçekten önemli değil, her zaman [0,1] de olacak şekilde ölçeklendirebilirsiniz [0,1].
Yuval Filmus

Yanıtlar:


21

Cevap: Θ(mnlogn) .

Merkezi Limit Teoreminin çok boyutlu bir versiyonunu uygulayarak, vektörün asimptotik olarak çok değişkenli Gauss dağılımına sahip olduğunu ve Biz bunun altında üstlenecek olan bir Gauss vektörü (ve sadece yaklaşık bir Gauss vektör). Bizim bir Gauss rastgele değişken ilave edelim varyansı ile tüm ( her bağımsızdır ). Bu, izin V , bir R [ X- i ] = m ( 1(X1,,Xn)Cı-oV(Xi,xj)=-m/n2. X

Var[Xi]=m(1n1n2),
Cov(Xi,Xj)=m/n2.
X m / n 2 x i , Z , X i ( Y 1 , Y 2Y , n ) = ( x 1 + Z X 2 + Z X , n + Z ) .Zm/n2XiZXi
(Y1Y2Yn)=(X1+ZX2+ZXn+Z).
Gauss vektörü elde ediyoruz . Şimdi her varyansı : ve tümü bağımsızdır: Y, I m / n V bir r [ Y i ] = V , bir r [ X- i ] + 2 ° C o v ( x i , Z ) =(Y1,,Yn)Yim/nY,IOv(Ei,Y,j)=Cov(xi,xj)+O v ( x i , Z ) + O v ( X, j , Z ) =
Var[Yi]=Var[Xi]+2Cov(Xi,Z)=0+Var[Z]=m/n,
Yi
Cov(Yi,Yj)=Cov(Xi,Xj)+Cov(Xi,Z)+Cov(Xj,Z)=0+Cov(Z,Z)=0.

Not o . Dolayısıyla bizim asıl sorunumuz, bulma problemine eşdeğerdir . İlk önce basitliği analiz edelim, tüm varyansı olduğunda durumu analiz edin .-Y m bir x - Y, s e c - m bir X -Y i 1YiYj=XiXjYmaxYsecmaxYi1

Sorun. Biz verilmiştir bağımsız Gauss rv ile ortalama ve varyans . beklentisini tahmin edin .γ 1 , , γ n μ 1 γ m a x - γ s e c - m a xnγ1,,γnμ1γmaxγsecmax

Cevap: .Θ(1logn)

Resmi olmayan Kanıt İşte bu soruna gayri resmi bir çözüm (resmi hale getirmek zor değil). Cevap ortalamaya bağlı olmadığından, olduğunu varsayıyoruz . Let , burada . Biz (orta derecede büyük ), ˉ Φ ( t ) = Pr [ γ > t ] γ N ( 0 , 1 ) t ˉ Φ ( t ) 1μ=0Φ¯(t)=Pr[γ>t]γN(0,1)t

Φ¯(t)12πte12t2.

Bunu not et

  • Φ(γi) de düzgün ve bağımsız bir şekilde dağılmış ,[0,1]

  • Φ(γmax) arasında en küçüğüdür ,Φ(γi)

  • Φ(γsecmax) , arasında en küçük olanıdır .Φ(γi)

Bu nedenle yakın ve yakın (konsantrasyon yok ama yapmazsak) Sabitleri önemsemek bu tahminler yeterince iyidir, gerçekte sabitleri önemsersek daha iyi olurlar - ama bu bir gerekçe gerektirir). Formülünü kullanarak , olsun 1 / n- Φ ( γ m bir x ) 2 / n ˉ Φ ( t ) 2 ˉ Φ ( γ s e c - m bir x ) / ˉ Φ ( γ m bir X )E 1Φ(γmax)1/nΦ(γmax)2/nΦ¯(t)

2Φ¯(γsecmax)/Φ¯(γmax)e12(γmax2γsecmax2).

Böylece olduğu WHP Not bu . Biz sahip Θ ( 1 ) γ m a xγ s e c - m a x = Θ ( γmax2γsecmax2Θ(1)γmaxγsecmax=Θ(logn)

γmaxγsecmaxΘ(1)γmax+γsecmaxΘ(1)logn.

QED

O almak

E[XmaxXsecmax]=E[YmaxYsecmax]=Var[Yi]×E[γmaxγsecmax]=Θ(mnlogn).

Aynı argüman keyfi puanlarımız olduğunda da devam eder. Bu göstermektedir

E[XmaxXsecmax]=cE[XmaxXmin]/logn.

2
Teşekkürler! Bir dahaki sefere çok değişkenli Gauss yaklaşımını denemeyi hatırlayacağım.
Yuval Filmus,

5
Yury, bizi bir Gauss vektör ekleyelim" yazdı varyans ile herkese . Biz Gauss vektörü olsun Şimdi her. varyans sahiptir ve tüm değildir ilişkili ... Not . " Bu kısmı genişletebilir misiniz? Mı ? Eğer bağımlıysa ve bağımsız ise (veya aynı şekilde), nasıl bağımsız olabilir? (Temiz bir numara gibi görünüyor ama ben anlamıyorum.) Teşekkürler. Zm/n2Xi(Y1,,Yn)Yim/nYiYiYj=XiXjZi=ZjXiZiYi
Neal Young

1
@NealYoung, evet, değişkenler varsa negatif İkili korelasyon ile ve tüm eşdeğişkileri olan eşit , o zaman ekleyebilir tek yeni rastgele değişken herkese böyle toplamlar bağımsızdır. Ayrıca, değişkenlerin pozitif korelasyonu varsa ve yine tüm kovaryanslar eşitse o zaman tüm farklılıkların bağımsız olması için hepsinden tek bir rv çıkarabiliriz; fakat şimdi , bağımsız değildir, fakat den bağımsızdırX1,,XnCov(Xi,Xj)ZXiCov(Xi,Xj)ZZXiZ=α(X1++Xn)bazı ölçeklendirme parametreleri için . α
Yury

1
Ah, anlıyorum. En azından cebirsel olarak, üzerinde durduğu tek şey, Z ve her bir ikili bağımsızlığıdır . çok havalı. Xi
Suresh Venkat

1
Bu argüman şimdi bir EC'14 makalesinde (atıf ile) ortaya çıkıyor: dl.acm.org/citation.cfm?id=2602829 .
Yuval Filmus

13

XmaxXsec-max

o(mnlog2lognlogn).
o(m/n)

X1n/2X2n/2

|X1X2|XmaxXsecmax|X1X2|=XmaxXsecmaxXmaxXsecmax|X1X2|

|X1X2|m/2±O(m)n/2n/2X1X2m=m/2±o(m)n=n/2

mnlog3nX1X1X2XmaxXmaxsec en fazla bu kadar farklı.

tPr[|X1X2|t]3/4Pr[XmaxXsec-maxt]

Pr[|X1X2|t  XmaxXsec-max=|X1X2|]
1(1/4)(1/2)=1/4.XmaxXsec-max

O((m/n)loglogn)O((m/n)logn)

ϵ>01o(1)
mn+2mlognn1(1±ϵ)loglogn2logn.
1δ=1O(δ)±ϵ
O(ϵ)mlognn loglognlogn = O(ϵ)mn log2lognlogn.

Ah - Sanırım haklısın. Karekökün içine çıkardım ve bu şekilde figürümü elde ettim.
Yuval Filmus,
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.