veya


40

Bir süredir bunu merak ediyorum; Ne kadar beklenmedik bir şekilde olduğunu garip buluyorum. Temel olarak, neden olduğu gibi için sadece üç forma ihtiyacımız var? Düzeltme neden bu kadar çabuk oluyor?Zn

Z2 :

2

Z3 :

3

(utanmadan John D. Cook'un blogundan çalınan görüntüler: http://www.johndcook.com/blog/2009/02/12/sums-of-uniform-random-values/ )

Neden dört üniforma almıyor? Veya beş? Veya...?


11
peki, kolay olacağı kadar basit olmak, çünkü 3 üniformanın toplamı pf'sinde kuadratik kesimlere sahiptir ve iki veya daha fazla üniforma elde ettiğinizde ortada bir zirve yaparsınız. O kadar, 1 ve 2 altındadır Bir kuadratik zirve "pürüzsüz" olduğunu ... ve kuadratik parçaları arasında katılır edemez 1.5'te bükmeyin; aynı sonuca
varmanın

Yanıtlar:


71

Herhangi biri bazılarına sezgisel, başkalarına sezgisel görünmeyecek gibi görünen bu konuya çeşitli yaklaşımlar uygulayabiliriz. Bu tür bir değişime uyum sağlamak için, bu cevap matematiksel düşünce - analiz (sonsuz ve sonsuz), geometri / topoloji (mekansal ilişkiler) ve cebirin (sembolik manipülasyonun resmi kalıpları) ana bölümlerini kapsayan, bu tür birkaç yaklaşımı araştırır. Olasılığın kendisi gibi. Dört yaklaşımı da birleştiren, burada cevaplanması gereken gerçek bir soru olduğunu gösteren ve sorunun tam olarak ne olduğunu gösteren bir gözlemle sonuçlanır. Her yaklaşım, kendi yolunda, bağımsız tekdüze değişkenlerin toplamlarının olasılık dağılım fonksiyonlarının şekillerinin doğası hakkında daha derin bir içgörü sağlar.


Arka fon

Üniforma dağıtımı[0,1] birkaç temel açıklamaları vardır. Zaman bir dağılımına sahiptir,X

  1. ölçülebilir bir kümesinde yatma şansı , sadece ölçüsünün (uzunluğu) yazılıdır.A A [ 0 , 1 ] | A [ 0 , 1 ] |XAA[0,1]|A[0,1]|

  2. Bundan, kümülatif dağılım fonksiyonunun (CDF) olduğu hemen görülür.

    FX(x)=Pr(Xx)=|(,x][0,1]|=|[0,min(x,1)]|={0x<0x0x11x>1.

    CDF

  3. CDF türevi olasılık yoğunluk fonksiyonu (PDF), bir için ve , aksi. ( ve tanımsızdır .)0 x 1 f X ( x ) = 0 0 1fX(x)=10x1fX(x)=001

    PDF


Karakteristik Fonksiyonlardan Sezgi (Analiz)

Karakteristik fonksiyonu rastgele bir değişken bölgesinin (CF) beklentisi olan (burada hayali birimidir, ). Tekdüze bir dağılımın PDF'sini kullanarak hesaplayabilirizexp ( ı t x ) i i 2 = - 1Xexp(itX)ii2=1

ϕX(t)=exp(itx)fX(x)dx=01exp(itx)dx=exp(itx)it|x=0x=1=exp(it)1it.

CF, PDF'nin Fourier dönüşümünün bir sürümüdür, . Fourier dönüşümleri ile ilgili en temel teoremler şunlardır:ϕ(t)=f^(t)

  • bağımsız değişkenlerinin toplamının CF değeri, CF'lerinin ürünüdür .X+Y

  • Orijinal PDF sürekli olduğunda ve sınırlandırıldığında, , Fourier dönüşümünün yakından ilişkili bir versiyonu ile CF geri kazanılabilir ,X f ϕfXfϕ

f(x)=ϕˇ(x)=12πexp(ixt)ϕ(t)dt.
  • Tüm ayırt edilebilirdir, türevi İntegral altında hesaplanır:f

    f(x)=ddx12πexp(ixt)ϕ(t)dt=i2πtexp(ixt)ϕ(t)dt.

    Bunun iyi tanımlanması için, son integralin kesinlikle birleşmesi gerekir; yani,

    |texp(ixt)ϕ(t)|dt=|t||ϕ(t)|dt

    sonlu bir değere yakınsamalıdır. Tersine, birleştiğinde, türev bu inversiyon formüllerinden dolayı her yerde var olur.

Artık tekdüze değişkenlerin toplamı için PDF'nin tam olarak ne kadar farklılaştığı açıktır : birinci mermiden, iid değişkenlerinin toplamının CF değeri, gücüne yükseltilmiş onlardan birinin CF değeridir. burada eşittir . Payda iken pay sınırlıdır (sinüs dalgalarından oluşur . Böyle bir integrali ile çarpabiliriz ve olduğunda kesinlikle bir araya gelip olduğunda koşullu olarak birleşir . Böylece, üçüncü merminin tekrarlanan uygulanması, tekdüze değişkenlerin toplamı için PDF'nin sürekli olacağını gösterir.n th ( exp ( i t ) - 1 ) n / ( i t ) n O ( t n ) t s s < n - 1 s = n - 1 n n - 2 n - 1nnth(exp(it)1)n/(it)nO(tn)tss<n1s=n1nn2farklılaştırılabilir zamanlar ve çoğu yerde farklılaşabilirlik olacaktır.n1

N = 10 için CF

Mavi gölgeli eğri, iid üniform değişkenlerin toplamının CF'sinin gerçek bölümünün mutlak değerinin bir log-log grafiğidir . Kesik kırmızı çizgi bir asimptottur; eğimi, PDF'nin kat farklı olduğunu gösteren . Başvuru için, gri eğri, benzer şekilde şekillendirilmiş bir Gauss işlevi için CF'nin gerçek kısmını çizer (normal bir PDF).- 10 10 - 2 = 8n=1010102=8


Olasılıktan Sezgi

ve bir Uniform dağılımına sahip olduğu bağımsız rastgele değişkenler olmasına izin verin . Dar bir aralığı göz önünde Bu şansı ayrışırlar. Bu tesadüfen içine şans bu aralık kez yeterli derecede yakın olan doğru boyut yere bu aralıkta, yani verilen yakın yeterlidir:YXX[0,1](t,t+dt]X+Y(t,t+dt]YXX+YY

fX+Y(t)dt=Pr(X+Y(t,t+dt])=Pr(X+Y(t,t+dt]|Y(t1,t+dt])Pr(Y(t1,t+dt])=Pr(X(tY,tY+dt]|Y(t1,t+dt])(FY(t+dt)FY(t1))=1dt(FY(t+dt)FY(t1)).

Son eşitlik, PDF'sinin ifadesinden geliyor . Her iki tarafı bölündüğünde gibi limitini alarak verirXdtdt0

fX+Y(t)=FY(t)FY(t1).

Diğer bir deyişle, bir Uniform ilave değişken için bir değişken PDF değiştirir bir farkı alınmış CDF içine . PDF, CDF'nin türevi olduğundan, bu, bağımsız bir tek biçimli değişken eklediğimizde sonuçta ortaya çıkan PDF'nin öncekinden bir kez daha farklı olduğu anlamına gelir.[0,1]XYfYFY(t)FY(t1)Y

Hadi bu içgörüyü uygulayalım, değişken bir değişkenle başlayarak . Orijinal PDF ya da ayırt edilemez : orada süreksiz. PDF'si , veya ayırt edilemez , ancak bu noktalarda sürekli olması gerekir, çünkü PDF'sinin integrallerinin farkıdır . Başka bir bağımsız tek tip değişken ekleme : PDF olan en türevlenebilir , , , ve mutlaka bulunmamaktadır --Ama ikinciY01Y+X012YX2Y+X+X2 0123bu noktalardaki türevler. Ve bunun gibi.


Geometriden Sezgi

CDF bir toplamının iid üniform dağılımı özellikleri birim hiperküp hacmini eşit yarı-uzay içinde bulunan . değişken için durum burada gösterilmektedir, , ve daha sonra ayarlanmıştır .tn[0,1]nx1+x2++xntn=3t1/23/25/2

3D küp

Şöyle gelen gelişmeler ile , hiper çaprazlamalar köşe de , . Her seferinde kesitin şekli değişir: Şekilde önce bir üçgen ( simpleks), sonra bir altıgen, sonra tekrar bir üçgendir. Neden PDF bu değerlerinde keskin bükülmeler yapmadığından ?t0nHn(t):x1+x2++xn=tt=0t=1,,t=n2t

Bunu anlamak için, öncelikle küçük değerlerini düşünün . Burada, hiper bir simpleksini keser. Simpleksin tüm boyutları ile doğru orantılıdır , bu nedenle "alanı" ile orantılıdır . Bunun için bazı gösterimler daha sonra kullanışlı olacaktır. Let "birim basamak fonksiyonu" olaraktHn(t)n1n1ttn1θ

θ(x)={0x<01x0.

Hiper küpün diğer köşelerinin varlığı olmasaydı, bu ölçeklendirme süresiz olarak devam ederdi. simpleks alanının bir grafiği, aşağıdaki kesintisiz mavi eğriye benzeyecektir: negatif değerlerde sıfırdır ve değerine eşittirOlumlu olanda, uygun bir şekilde yazılmış. Orjinalinde düzeninin "dolandırıcığı" vardır, yani düzenindeki tüm türevlerin var olduğu ve sürekli olduğu, ancak düzenindeki sol ve sağ türevlerin var olduğu ancak o zaman aynı fikirde olmadığı .n1tn1/(n1)!θ(t)tn1/(n1)!n2n3n2

(Bu şekilde gösterilen diğer eğriler (Kırmızı), (Altın) ve (Siyah) durumundaki rolleri aşağıda daha ayrıntılı olarak ele alınmıştır.)3θ(t1)(t1)2/2!3θ(t2)(t2)2/2!θ(t3)(t3)2/2!n=3

Basit alan grafiği

Ne olur anlamak için haçlar , en ayrıntılı olarak davayı inceleyelim tüm geometri bir düzlemde gerçekleşir. "Küp" birimini (şimdi sadece bir kare) , burada gösterildiği gibi , kadranların doğrusal bir kombinasyonu olarak görebiliriz:t1n=2

Çeyrekte

İlk kadran sol alt panelde gri renkte görünür. Değeri olan beş panel gösterilmiştir diyagonal hat belirlenmesi. CDF sağda gösterilen sarı alana eşittir. Bu sarı alan şunlardan oluşur:t1.5

  1. Sol alt paneldeki üçgen gri alan,

  2. Sol üst paneldeki üçgen yeşil alan eksi ,

  3. Düşük orta paneldeki üçgen kırmızı alanı eksi ,

  4. Ayrıca üst orta panelde görülebilecek herhangi bir mavi alan (ancak böyle bir alanı değil, ne kadar olacaktır aşan ).t2

Bu alanın her biri bir üçgenin alanıdır. Gibi ilk terazi , sonraki iki sıfır ve aksi gibi ölçek ve son sıfır olan ve aksi takdirde gibi ölçeklenir . Bu geometrik analiz CDF'nin ile orantılı olduğunu göstermiştir. = ; eşdeğerde, PDF, üç fonksiyonun toplamıyla orantılıdır: , ve2n=4tn=t2t<1(t1)n=(t1)2t<2(t2)nθ(t)t2θ(t1)(t1)2θ(t1)(t1)2+θ(t2)(t2)2θ(t)t22θ(t1)(t1)2+θ(t2)(t2)2θ(t)t2θ(t1)(t1)θ(t2)(t2)( olduğunda her biri doğrusal olarak ölçeklenir ). Bu şeklin sol paneli grafiklerini gösterir: açıkça, hepsi orijinal grafiğin versiyonlarıdır , fakat (a) , ve birimin sağa kaydırılması ve (b) yeniden ölçeklendirilmesi , Sırasıyla ve .n=2θ(t)t012121

N = 2 için grafikler

Sağ panel, bu grafiklerin toplamını gösterir (birim alana sahip olacak şekilde normalize edilmiş siyah katı eğri: bu, asıl soruda gösterilen açısal görünümlü PDF'dir).

Şimdi herhangi bir iid üniforma değişkeninin PDF'sindeki "bükülmeler" in yapısını anlayabiliriz. Hepsi tam olarak "kıvrım" de oluşur gibi fonksiyonu , muhtemelen yeniden olçeklendirilmiş ve tamsayılar kaymıştır burada hiper tekabül , köşelerini geçiyor. İçin , bu yönde görünür bir değişiklik: sağ türevi de ise sol türevi ise . İçin , bu bir sürekli0θ(t)tn11,2,,nHn(t)n=2θ(t)t001n=3yön değişikliği, ancak ikinci türevde ani (süreksiz) bir değişiklik. Genel , sırasına göre sürekli türevler olacak ancak türevinde bir süreksizlik olacaktır .nn2n1st


Cebirsel Manipülasyondan Sezgi

KF'yi hesaplamak için entegrasyon, olasılık analizindeki koşullu olasılık şekli ve hiper küpün, kadranların doğrusal bir kombinasyonu olarak sentezlenmesi, hepsinin orijinal tekdüze dağılımına geri dönmesini ve daha basit şeylerin doğrusal bir kombinasyonu olarak yeniden ifade edilmesini önerir. . Nitekim, PDF yazılabilir

fX(x)=θ(x)θ(x1).

Shift operatörünü tanıtalım : grafiğini bir üniteyi sağa kaydırarak herhangi bir işlevine etki eder :Δf

(Δf)(x)=f(x1).

Resmen, o zaman, bir değişkeninin PDF'si için yazabiliriz.X

fX=(1Δ)θ.

Bir miktar PDF IID üniforma konvolüsyon olan kendisi ile kere. Bu, rastgele değişkenlerin toplamının tanımından sonra gelir: ve iki fonksiyonunun evrişimi , fonksiyondur.nfXnfg

(fg)(x)=f(xy)g(y)dy.

Evrişimin ile işlediğini doğrulamak kolaydır . Sadece entegrasyon değişkenini ile :Δyy+1

(f(Δg))=f(xy)(Δg)(y)dy=f(xy)g(y1)dy=f((x1)y)g(y)dy=(Δ(fg))(x).

Toplamının PDF için istatistiksel bağımsız üniforma, şimdi yazma için cebirsel devam edebilirn

f=fXn=((1Δ)θ)n=(1Δ)nθn

( "güç", tekrarlayan evrişimi ifade eder, noktadan çarpma yapmaz!). Şimdi direk, temel bir entegrasyondur;nθn

θn(x)=θ(x)xn1n1!.

Gerisi cebirdir, çünkü Binom Teoremi geçerlidir (gerçekler üzerindeki herhangi bir değişmeli cebirde olduğu gibi):

f=(1Δ)nθn=i=0n(1)i(ni)Δiθn.

Çünkü sadece tarafından argüman geçer , bu sergiler PDF kaydırılmış versiyonlarının bir lineer bir kombinasyonu olarak , tam olarak geometrik çıkarılabilir olarak:Δiifθ(x)xn1

f(x)=1(n1)!i=0n(1)i(ni)(xi)n1θ(xi).

(John Cook, bu formülü daha sonra blog gönderiminde, için notasyonu kullanarak yazar .) ( x - i ) n - 1 θ ( x - i )(xi)+n1(xi)n1θ(xi)

Buna göre, her yerde pürüzsüz bir işlev olduğu için, PDF'nin herhangi bir tekil davranışı yalnızca in tekil olduğu yerlerde (açıkçası sadece ) ve sağa kaydırılan yerlerde gerçekleşir. . Bu tekil davranışın doğası - pürüzsüzlük derecesi - bu nedenle konumlarının hepsinde aynı olacaktır . θ ( x ) 0 1 , 2 , , n n + 1xn1θ(x)01,2,,nn+1

Bunu göstermek, için olan resimdir (sol panelde) toplamın içindeki bireysel terimleri ve (sağ panelde) toplamın kendisiyle sonuçlanan kısmi toplamları (koyu siyah eğri) gösterir:n=8

N = 8 için arsa


Yorumları Kapatma

Son yaklaşım nihayet toplamının PDF hesaplamak için kompakt, pratik ifadesini vermiştir ettiğini nota yararlıdır istatistiksel bağımsız tekdüze değişkenleri. (CDF için bir formül benzer şekilde elde edilmiştir.)n

Merkezi Sınır Teoremi'nin burada söyleyecek çok şeyi yok. Sonuçta, bir iid Binom değişkeninin toplamı Normal dağılıma yaklaşır, ancak bu toplam her zaman ayrıktır: hiçbir zaman bir PDF bile içermez ! Bir "kinks" ya da bir PDF'nin CLT'den gelebilecek farklılaşabilirlik ölçütleri hakkında herhangi bir sezgiyi ummamalıyız.


12
(+1) Harika! Şimdi, bunların hepsini bir araya getirmeniz ne kadar sürdü ?!
kardinal

13
@Cardinal Bu, geçen pazartesi günü güç kaybetmeden önce okuduğum son soruydu. Takip eden hafta boyunca, uzun karanlık akşamlar :-) bunu düşünmeyi ve eğlence için çok sayıda cevap geliştirmeyi düşündü. Geçen hafta sonu güç yenilendikten sonra, sadece çizimleri yapmak ve hepsini yazmak için biraz zaman bulmak meselesiydi (beklenenden daha uzun sürdü, itiraf ediyorum). Umarım bu konunun bir kısmı rastgele değişkenlerin toplamı ile ilgili gelecek sorulara referans olarak hizmet edebilir.
whuber

1
Vay. Keşke bu cevabı 'favori' yapabilseydim .
Ravent

2
whuber, bu kesinlikle harika. Böyle basit bir sorunun ne kadar derin olabileceğini asla anlamadım. Cevabınızı almak biraz zaman alacak ama şimdilik, çok teşekkür ederim!
tetragrammaton

6
SE politikasını ihlal edeceğim, (biz crossvalidate.com'un hepsinin) elektriği daha sık kesmesi için şirkete rüşvet vermemiz gerektiğini söyleyerek :)
mpiktas

1

Düzgün bir rastgele değişkenin olasılık yoğunluk fonksiyonunun sonlu olduğunu iddia edebilir,

bu yüzden integral tek tip rastgele bir değişkenin kümülatif yoğunluk fonksiyonu süreklidir,

bu nedenle iki düzgün rastgele değişkenin toplamının olasılık yoğunluk fonksiyonu süreklidir,

Bu yüzden onun integrali iki düzgün rastgele değişkenin toplamının kümülatif yoğunluk fonksiyonu düzgündür (sürekli olarak ayırt edilebilir),

bu yüzden üç üniform rastgele değişkenin toplamının olasılık yoğunluğu işlevi düzgündür.


1

Bence daha şaşırtıcı olan şey, için keskin bir zirve elde etmeniz . n=2

Merkez Sınırı Teoremi, yeterince büyük örneklem büyüklükleri için ortalamanın dağılımının (ve toplamın sadece ortalama zamanlar , her grafik için sabit bir sabit olduğunu) yaklaşık olarak normal olacağını söyler. Üniforma dağılımının CLT'ye göre (simetrik, ağır kuyruklar (pek fazla kuyruk değil), aykırı olasılık yok) gerçekten iyi davrandığı, bu nedenle üniforma için, örneklem büyüklüğünün yeterince büyük olması gerektiği ortaya çıktı. "çok büyük değil (iyi bir yaklaşım için yaklaşık 5 veya 6 civarında), zaten Tamam yaklaşımını görüyorsunuz .n = 3nn=3

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.