Rademacher rasgele değişkenlerin Ürünlerinin Toplamı


9

İzin Vermek x1xa,y1yb değerleri alan bağımsız rasgele değişkenler olmak +1 veya 1her biri 0,5 olasılıkla. Toplamı düşününS=i,jxi×yj. Olasılığı üst sınırlandırmak istiyorumP(|S|>t). Şu an sahip olduğum en iyi sınır2ectmax(a,b)burada evrensel bir sabittir. Bu, basit Chernoff sınırlarının uygulanmasıyla ve olasılığını daha düşük sınırlayarak elde edilir . Bu sınırdan önemli ölçüde daha iyi bir şey almayı umabilir miyim? Yeni başlayanlar için en azından . Muhtemelen en iyi olacak alt gaussian kuyrukları alabilirsem ama bunu bekleyebilir miyiz (sanmıyorum ama bir argüman düşünemiyorum)?cPr(|x1++xn|<t)Pr(|y1++yn|<t)ectab


Chernoff'u doğrudan bağlı uygulamayı düşündünüz mü ? Sen bir şey yapmak mümkün olabilirS
E[exp(λS]=E[λijXiYj]=E[λ(iXi)(jYj)]
Dilip Sarwate

T \ gt ab için sınırınızda belirgin bir iyileşme var t>ab, çünkü o zaman olasılık sıfır olmalıdır. Bana öyle geliyor ki bu bir "alt Gauss" kuyruğu :-). Bağlantınız da yanlış görünüyor: sürekli 1 olan değişkenler 1bu sorunun koşullarını karşılar. İçin a=b ve t=a21 olasılığı 1 ancak bağlandığı asimptotik 2exp(ca)0 olarak a büyük büyür.
whuber

Tüm değişkenlerin 1 olma olasılığı katlanarak azalır. Yorumunu anladığımı sanmıyorum. İçin ve belirtilen bağlı bir daha büyüktür toplamının olasılığı oldukça trivially doğrudur olana=bt=a21t212(a1)eln(2)c(a1/a)
kullanıcı1189053

1
Bir hatam için gerçekten üzgünüm. Yukarıda üniform olarak bahsettiğimi sanıyordum. Yani p = 1/2 ve eşitsizliğin tutması için (gerekirse) a ve b'yi daha büyük alabiliriz
user1189053

2
Gözlerim beni aldatmadığı sürece, bir meblağ ürünü değil bir meblağ ürünü düşünürsünüz. :-)
kardinal

Yanıtlar:


7

Cebirsel ilişki

S=i,jxiyj=ixijyj

, iki bağımsız toplamın ürünü olarak gösterir . Çünkü ve olarak bağımsız Bernoulli dağılımı özellikleri, bir binom olan üzerine değişken iki katına çıktı ve değişti. Bu nedenle onun ortalamasıdır ve varyans olan . Benzer şekilde ortalaması ve varyansı vardır . Şimdi bunları tanımlayarak standardize edelimS(xi+1)/2(yj+1)/2(1/2)X=i=1axi(a,1/2)0aY=j=1byj0b

Xa=1ai=1axi,

nereden

S=abXaXb=abZab.

Yüksek bir doğruluk (ve ölçülebilir) bir dereceye kadar, olarak büyür büyük standart normal dağılıma yaklaşır. Bize nedenle yaklaşık Let olarak iki standart normaller kere ürünü.aXaSab

Bir sonraki adım,

Zab=XaXb=12((Xa+Xb2)2(XaXb2)2)=12(U2V2).

"Bağımsız değişkenler", ve bağımsız standartlarının karelerinin farkının bir katıdır . nin dağılımı analitik olarak hesaplanabilir ( karakteristik fonksiyon ters çevrilerek ): pdf sıfırı, olan Bessel fonksiyonu ile orantılıdır . Bu fonksiyonun üstel kuyrukları olduğu için, büyük ve ve sabit , için soruda belirtilenden daha iyi bir yaklaşım olmadığı sonucuna varıyoruz .UVZabK0(|z|)/πabtPra,b(S>t)

ve biri (en azından) büyük olmadığında veya kuyruğundaki yakın noktalarda iyileşme için biraz yer kalır . doğrudan hesaplanması, den çok daha büyük noktalarda , kabaca ötesinde kuyruk olasılıklarından eğik bir incelme göstermektedir . Ait CDF'nin Bu log-lineer araziler çeşitli değerleri için (başlıklarında verilen) ve (aynı değerler üzerinde kabaca değişen , her bir parsel renk ile ayırt,) neler olduğunu göstermektedir. Referans olarak, sınırlayıcı grafiğiabS±abSababmax(a,b)SabaK0dağıtım siyah renkte gösterilmiştir. (Dolayı simetrik civarındadır , , negatif kuyruk bakmak yeterlidir, böylece.)S0Pr(S>t)=Pr(S<t)

Rakamlar

De büyüdükçe, CDF referans hattına yakın büyür.b

Bu eğriliği karakterize etmek ve ölçmek, Binom değişkenlerine Normal yaklaşımın daha iyi bir analizini gerektirecektir.

Bessel işlevi yaklaşımının kalitesi, bu büyütülmüş kısımlarda (her çizimin sağ üst köşesinde) daha net hale gelir. Zaten kuyruklara oldukça uzaktayız. Logaritmik dikey ölçek önemli farklılıklar gizleyebilirsiniz rağmen, açıkça zaman ulaşmıştır yaklaştırma iyi gelir .a500|S|<ab

insets


Dağılımını Hesaplamak İçin R KoduS

Aşağıdakilerin yürütülmesi birkaç saniye sürecektir. (Bu 36 kombinasyonları için birkaç milyon olasılıklarını hesaplar ve .) Yavaş makinelerde, daha büyük bir ya da iki değerlerine ihmal ve ve daha düşük çizim sınırını arttırmak etrafında .abab1030010160

s <- function(a, b) {
  # Returns the distribution of S as a vector indexed by its support.
  products <- factor(as.vector(outer(seq(-a, a, by=2), seq(-b, b, by=2))))
  probs <- as.vector(outer(dbinom(0:a, a, 1/2), dbinom(0:b, b, 1/2)))
  tapply(probs, products, sum)
}

par(mfrow=c(2,3))
b.vec <- c(51, 101, 149, 201, 299, 501)
cols <- terrain.colors(length(b.vec)+1)
for (a in c(50, 100, 150, 200, 300, 500)) {
  plot(c(-sqrt(a*max(b.vec)),0), c(10^(-300), 1), type="n", log="y", 
       xlab="S/sqrt(ab)", ylab="CDF", main=paste(a))
  curve(besselK(abs(x), 0)/pi, lwd=2, add=TRUE)
  for (j in 1:length(b.vec)) {
    b <- b.vec[j]
    x <- s(a,b)
    n <- as.numeric(names(x))
    k <- n <= 0
    y <- cumsum(x[k])
    lines(n[k]/sqrt(a*b), y, col=cols[j], lwd=2)
  }
}

1
çok iyi yapmışsın! Negatif kuyruk için, 2 standart Normalin ürününün cdf'si için kesin bir form elde edilebilir 1/2 (1 + y BesselK[0,-y] StruveL[-1, y] - y BesselK[1,-y] StruveL[0, y]). Aşağıdakilerin nasıl yapıldığını görmek ilginç olacaktır: (a) OP'nin bağlılığı ve (b) Normal yaklaşımınız, yukarıda baktığımız durum için, yani tam pmf ayrık çözüm kullanılarak türetilmiş . a=5,b=7
Nisan'ta Wolfies

1
Evet @wolfies, ben de o ifadeyi elde: o kuyruğu bütünleştirir . Kesin dağılım, aşırı kuyruklarda ayrıldığı için, bu integralin analizini daha fazla taşımakta fayda görmüyordu. Bir sonraki mantıksal adım kuyrukların daha belirgin bir analizidir, yani Normal yaklaşımın ötesine geçmektedir. K0
whuber

3

Yorum: Bu soruda ne tür RV'lerin dikkate alındığını daha iyi yansıtmak amacıyla başlığı düzenledim. Herkes yeniden düzenleme yapmaktan çekinmeyin.

Motivasyon: Sanırımnin dağılımını elde edebilirsek, bir üst sınır için. ( GÜNCELLEME : Biz olamaz Whuber adlı ve cevap görüşürüz).|Sab|

Göstermek . Doğrulamak için kolaydır 'nin aynı dağılımına sahip S ve' 'in. Moment üreten fonksiyonZk=XiYj,k=1,...,abZXY

MZ(t)=E[ezt]=12et+12et=cosh(t)

Ayrıca 'ler, çiftler halinde bağımsız ile başlamak: değişken (endeksler elbette herhangi biri olabilir), desteğe sahip olasılıkları karşılık gelen . Moment üreten işleviZW=Z1+Z2{2,0,2}{1/4,1/2,1/4}

MW(t)=E[e(z1+z2)t]=14e2t+12+14e2t==14(e2t+1)+14(e2t+1)=142etcosh(t)+142etcosh(t)=cosh(t)cosh(t)=MZ1(t)MZ2(t)

Tam bağımsızlığın aşağıdaki gibi olduğundan şüphelenmeye çalışacağım (bilge olanlar için açık mı?): Bu kısım için . Sonra zincir kuralı Zij=XiYj

P[Zab,...,Z11]=P[ZabZa,b1,...,Z11]...P[Z13Z12,Z11]P[Z12Z11]P[Z11]

İkili bağımsızlık ile . düşünün . ve bağımsız koşullu Elimizdeki böylece çift ​​bağımsızlık bakımından ikinci eşitlik. Ancak bu,P[Z12Z11]=P[Z12]
P[Z13,Z12Z11]Z13Z12Z11

P[Z13Z12,Z11]=P[Z13Z11]=P[Z13]

P[Z13Z12,Z11]P[Z12Z11]P[Z11]=P[Z13,Z12,Z11]=P[Z13]P[Z12]P[Z11]

Vb (sanırım). ( GÜNCELLEME : Yanlış düşünüyorum . Bağımsızlık muhtemelen herhangi bir üçlü için geçerlidir, ancak bütün grup için değil. Bu yüzden, basit bir rastgele yürüyüşün dağılımının türetilmesi ve soruya doğru bir cevap değil - bkz. Wolfies ve Whuber'ın cevapları).

Tam bağımsızlık gerçekten geçerliyse, iid dichotomous toplamının dağılımını elde etme

Sab=k=1abZk

basit bir rastgele yürüyüşe benziyor , ancak ikincisinin bir dizi olarak net bir şekilde yorumlanmasına rağmen.

Eğer destek bile tamsayılar olacaktır , sıfır dahil ederken eğer destek garip tamsayılar olacaktır , sıfır olmadan. ab=evenS[ab,...,ab]ab=oddS[ab,...,ab]

davasını ele alıyoruz . Göstermek sayısı olduğu değerinin alınması sitesindeki . Daha sonra desteği şeklinde yazılabilir . Herhangi bir için, için benzersiz bir değer elde ederiz . Üstelik nedeniyle simetrik olasılıklar ve bağımsızlık (ya da sadece exchangeability?), Tüm olası eklem gerçekleşmelerine -değişkenleri equiprobable bulunmaktadır. Böylece sayarız ve olasılık kütle fonksiyonunun ,ab=odd
mZ1SS{ab2m;mZ+{0};mab}mSZ{Z1=z1,...,Zab=zab}S

P(S=ab2m)=(abm)12ab,0mab

İnşaat ile ve tek sayı ve desteğinin tipik unsuru tanımlayarak ,sab2mS

P(S=s)=(ababs2)12ab

Taşımakçünkü , dağılımı olasılık kütlesini sıfıra ayırmadan sıfır etrafında simetriktir ve bu nedenleyoğunluk grafiğini dikey eksen etrafında "katlayarak", esas olarak pozitif değerler için olasılıkları ikiye katlayarak elde edilir,|S|ab=oddS|S|

P(|S|=|s|)=(ababs2)12ab1

Sonra dağıtım işlevi

P(|S||s|)=12ab11is,iodd(ababi2)

Bu nedenle, herhangi bir gerçek , için gerekli olasılığı t1t<ab

P(|S|>t)=1P(|S|t)=112ab11it,iodd(ababi2)

göstergesinin toplamın yalnızca desteğine dahil edilen değerlere kadar çalışacağını garanti ettiğini unutmayın. - örneğin, set halinde hala kadar çalışacaktır bir tamsayıdır üstüne, tek olduğu kısıtlı olduğundan,.i=odd|S|t=10.5i9


Negatif değerlerin sayısı olmalıdır , hatta . Bu nedenle bu dört rastgele değişkenler (bakıyorum da dört olduğunu varsayıyorum s - notasyonu belirsizdir) bağımsız değildir. (X1Y1,X1Y2,X2Y1,X2Y2)Z
whuber

@whuber Teşekkürler. Sorun (benim sorunum, yani), çalıştığım herhangi bir örnekte bağımsızlık kazanmaya devam etmem. Yazdığınız dört değişken üzerinde çalışacağım.
Alecos Papadopoulos

Farklı Evet, çünkü çok çetrefilli ler İkili bağımsızdır ve (sanırım) herhangi üç farklı ler de bağımsızdır. (Soruna yaratıcı saldırısı nedeniyle cevabınızı onayladım ve umarım bağımsızlık eksikliğini değerlendirmemde yanılıyorum!)ZZ
whuber

@whuber Tekrar teşekkürler whuber, bu gerçekten destekleyici. Bence, dağılımının türetilmesinin geçerli olması için ihtiyacımız olan şey, tüm olayların eşlenebilir olmasıdır. Ortak bağımsızlık başarısız olsa da, böyle bir mülkün elde edilmesi mümkün müdür? Demek istediğim, ortak bağımsızlığın olması için ortak bağımsızlık yeterli, ama aynı zamanda gerekli mi? S{k=1abZk}
Alecos Papadopoulos

Korkarım, rastgele değişkenlerin kesiştiği anlamına gelen gösterimlerinizi anlamıyorum (ne anlama gelirse gelsin).
whuber

3

Bir cevap değil, Alecos'un yorum kutusuna sığmayacak kadar uzun olan ilginç cevabı hakkında bir yorum.

Let bağımsız Rademacher rastgele değişkenler ve let bağımsız Rademacher rastgele değişkenler. Alecos şunları kaydediyor:(X1,...,Xa)(Y1,...,Yb)

Sab=k=1abZkwhereZk=XiYj

“… Basit bir rastgele yürüyüşe benziyor ”. Basit bir rastgele yürüyüş gibi olsaydı , dağılımı 0 civarında simetrik 'çan şeklindeki unimodal' olurdu.S

Basit bir rastgele yürüyüş olmadığını göstermek için , burada hızlı bir Monte Carlo karşılaştırması:

  • üçgen noktalar: PMF Monte Carlo simülasyonu verilen veSa=5b=7
  • yuvarlak noktalar: adımla basit bir rastgele yürüyüşün Monte Carlo simülasyonun=35

resim açıklamasını buraya girin

Açıkçası, basit bir rastgele yürüyüş değildir; ayrıca S'nin çift ​​(veya tek) tamsayılara dağıtılmadığına dikkat edin .S

Monte Carlo

ve verildiğinde toplamının tek bir yinelemesini oluşturmak için kullanılan kod ( Mathematica'da ) :Sab

 SumAB[a_, b_] :=  Outer[Times, RandomChoice[{-1, 1}, a], RandomChoice[{-1, 1}, b]] 
                         // Flatten // Total 

Ardından, 500.000 bu yol, ve olduğunda aşağıdakilerle oluşturulabilir:a=5b=7

 data57 = Table[SumAB[5, 7], {500000}];

Bu ve kombinasyonu için destek alanı :ab

{-35, -25, -21, -15, -9, -7, -5, -3, -1, 1, 3, 5, 7, 9, 15, 21, 25, 35}

1
+1 Daha fazla analiz için bize referans vermek için uzun zamandır bir simülasyona (veya somut bir örneğe) ihtiyaç duyulmuştur. Simülasyonunuz, faktörlerinin olduğunu belirterek çok daha verimli (yaklaşık 25 kat daha hızlı . Bu, üçgen grafiğinizde neden yeterince büyük asal değerlerin görünmeyeceğini hemen açıklar ve zorla "rastgele bir yürüyüş" (ölçekli Binomial) dağılımına sahip olamayacağını gösterir. S(ixi)(jyj)S
whuber

1
Simüle etmek yerine, hemen deneyin (örneğin, 1000'den az ave bher ikisi için ) ve hemen rademacher[a_] := Transpose[{Range[-a, a, 2], Array[Binomial[a, #] &, a + 1, 0] /2^a}]; s[a_, b_] := {#[[1, 1]], Total[#[[;; , 2]]]} & /@ GatherBy[Flatten[Outer[Times, rademacher[a], rademacher[b], 1], 1], First]; ListLogPlot[s[5, 7]]deneyin s[100,211].
whuber

@whuber yeniden ilk yorum - sizin çarpanlara ayırma süper temiz! :) Mac bilgisayarımda: ......... WHuberSumAB[a_, b_] := Total[RandomChoice[{-1, 1}, a]] * Total[RandomChoice[{-1, 1}, b]]... kullanarak Outeryaklaşımın iki katı daha hızlıdır . Hangi kodu kullandığınızı mı merak ediyorsunuz? [Her iki yaklaşım da, elbette ParallelTable, vb kullanarak kullanarak daha hızlı yapılabilir ]
wolfies

Bu deneyin: sum[n_, a_, b_] := Block[{w, p}, w[x_] := Array[Binomial[x, #] &, x + 1, 0] /2^x; p[x_] := RandomChoice[w[x] -> Range[-x, x, 2], n]; p[a] p[b]]. Sonra zaman Tally[sum[500000, 5, 7]]. İçin Raficianodos, şu aynı şeyi yapar ve daha uzun yalnızca% 50'sini alır Mathematica : s <- function(n, a, b) (2 * rbinom(n, a, 1/2) - a)*(2 * rbinom(n, b, 1/2) - b); system.time(x <- table(s(5*10^5, 5, 7))); plot(log(x), col="#00000020").
whuber

@whuber - yeniden yorum2 - tam pmf: böylece Rademacher'in her bir toplamının bir Binom olduğu var ve bu yüzden 2 Binom ürünü. Bunu neden cevap olarak yazmıyorsunuz? - güzel, temiz, zarif ve kullanışlı ...S=(iXi)(jYj)
wolfies
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.