Herhangi biri bazılarına sezgisel, başkalarına sezgisel görünmeyecek gibi görünen bu konuya çeşitli yaklaşımlar uygulayabiliriz. Bu tür bir değişime uyum sağlamak için, bu cevap matematiksel düşünce - analiz (sonsuz ve sonsuz), geometri / topoloji (mekansal ilişkiler) ve cebirin (sembolik manipülasyonun resmi kalıpları) ana bölümlerini kapsayan, bu tür birkaç yaklaşımı araştırır. Olasılığın kendisi gibi. Dört yaklaşımı da birleştiren, burada cevaplanması gereken gerçek bir soru olduğunu gösteren ve sorunun tam olarak ne olduğunu gösteren bir gözlemle sonuçlanır. Her yaklaşım, kendi yolunda, bağımsız tekdüze değişkenlerin toplamlarının olasılık dağılım fonksiyonlarının şekillerinin doğası hakkında daha derin bir içgörü sağlar.
Arka fon
Üniforma dağıtımı[0,1] birkaç temel açıklamaları vardır. Zaman bir dağılımına sahiptir,X
ölçülebilir bir kümesinde yatma şansı , sadece ölçüsünün (uzunluğu) yazılıdır.A A ∩ [ 0 , 1 ] | A ∩ [ 0 , 1 ] |XAA∩[0,1]|A∩[0,1]|
Bundan, kümülatif dağılım fonksiyonunun (CDF) olduğu hemen görülür.
FX(x)=Pr(X≤x)=|(−∞,x]∩[0,1]|=|[0,min(x,1)]|=⎧⎩⎨⎪⎪0x1x<00≤x≤1x>1.
CDF türevi olasılık yoğunluk fonksiyonu (PDF), bir için ve , aksi. ( ve tanımsızdır .)0 ≤ x ≤ 1 f X ( x ) = 0 0 1fX(x)=10≤x≤1fX(x)=001
Karakteristik Fonksiyonlardan Sezgi (Analiz)
Karakteristik fonksiyonu rastgele bir değişken bölgesinin (CF) beklentisi olan (burada hayali birimidir, ). Tekdüze bir dağılımın PDF'sini kullanarak hesaplayabilirizexp ( ı t x ) i i 2 = - 1Xexp(itX)ii2=−1
ϕX(t)=∫∞−∞exp(itx)fX(x)dx=∫10exp(itx)dx=exp(itx)it∣∣∣x=1x=0=exp(it)−1it.
CF, PDF'nin Fourier dönüşümünün bir sürümüdür, . Fourier dönüşümleri ile ilgili en temel teoremler şunlardır:ϕ(t)=f^(t)
bağımsız değişkenlerinin toplamının CF değeri, CF'lerinin ürünüdür .X+Y
Orijinal PDF sürekli olduğunda ve sınırlandırıldığında, , Fourier dönüşümünün yakından ilişkili bir versiyonu ile CF geri kazanılabilir ,X f ϕfXfϕ
f(x)=ϕˇ(x)=12π∫∞−∞exp(−ixt)ϕ(t)dt.
Tüm ayırt edilebilirdir, türevi İntegral altında hesaplanır:f
f′(x)=ddx12π∫∞−∞exp(−ixt)ϕ(t)dt=−i2π∫∞−∞texp(−ixt)ϕ(t)dt.
Bunun iyi tanımlanması için, son integralin kesinlikle birleşmesi gerekir; yani,
∫∞−∞|texp(−ixt)ϕ(t)|dt=∫∞−∞|t||ϕ(t)|dt
sonlu bir değere yakınsamalıdır. Tersine, birleştiğinde, türev bu inversiyon formüllerinden dolayı her yerde var olur.
Artık tekdüze değişkenlerin toplamı için PDF'nin tam olarak ne kadar farklılaştığı açıktır : birinci mermiden, iid değişkenlerinin toplamının CF değeri, gücüne yükseltilmiş onlardan birinin CF değeridir. burada eşittir . Payda iken pay sınırlıdır (sinüs dalgalarından oluşur . Böyle bir integrali ile çarpabiliriz ve olduğunda kesinlikle bir araya gelip olduğunda koşullu olarak birleşir . Böylece, üçüncü merminin tekrarlanan uygulanması, tekdüze değişkenlerin toplamı için PDF'nin sürekli olacağını gösterir.n th ( exp ( i t ) - 1 ) n / ( i t ) n O ( t n ) t s s < n - 1 s = n - 1 n n - 2 n - 1nnth(exp(it)−1)n/(it)nO(tn)tss<n−1s=n−1nn−2farklılaştırılabilir zamanlar ve çoğu yerde farklılaşabilirlik olacaktır.n−1
Mavi gölgeli eğri, iid üniform değişkenlerin toplamının CF'sinin gerçek bölümünün mutlak değerinin bir log-log grafiğidir . Kesik kırmızı çizgi bir asimptottur; eğimi, PDF'nin kat farklı olduğunu gösteren . Başvuru için, gri eğri, benzer şekilde şekillendirilmiş bir Gauss işlevi için CF'nin gerçek kısmını çizer (normal bir PDF).- 10 10 - 2 = 8n=10−1010−2=8
Olasılıktan Sezgi
ve bir Uniform dağılımına sahip olduğu bağımsız rastgele değişkenler olmasına izin verin . Dar bir aralığı göz önünde Bu şansı ayrışırlar. Bu tesadüfen içine şans bu aralık kez yeterli derecede yakın olan doğru boyut yere bu aralıkta, yani verilen yakın yeterlidir:YXX[0,1](t,t+dt]X+Y∈(t,t+dt]YXX+YY
fX+Y(t)dt=Pr(X+Y∈(t,t+dt])=Pr(X+Y∈(t,t+dt]|Y∈(t−1,t+dt])Pr(Y∈(t−1,t+dt])=Pr(X∈(t−Y,t−Y+dt]|Y∈(t−1,t+dt])(FY(t+dt)−FY(t−1))=1dt(FY(t+dt)−FY(t−1)).
Son eşitlik, PDF'sinin ifadesinden geliyor . Her iki tarafı bölündüğünde gibi limitini alarak verirXdtdt→0
fX+Y(t)=FY(t)−FY(t−1).
Diğer bir deyişle, bir Uniform ilave değişken için bir değişken PDF değiştirir bir farkı alınmış CDF içine . PDF, CDF'nin türevi olduğundan, bu, bağımsız bir tek biçimli değişken eklediğimizde sonuçta ortaya çıkan PDF'nin öncekinden bir kez daha farklı olduğu anlamına gelir.[0,1]XYfYFY(t)−FY(t−1)Y
Hadi bu içgörüyü uygulayalım, değişken bir değişkenle başlayarak . Orijinal PDF ya da ayırt edilemez : orada süreksiz. PDF'si , veya ayırt edilemez , ancak bu noktalarda sürekli olması gerekir, çünkü PDF'sinin integrallerinin farkıdır . Başka bir bağımsız tek tip değişken ekleme : PDF olan en türevlenebilir , , , ve mutlaka bulunmamaktadır --Ama ikinciY01Y+X012YX2Y+X+X2 0123bu noktalardaki türevler. Ve bunun gibi.
Geometriden Sezgi
CDF bir toplamının iid üniform dağılımı özellikleri birim hiperküp hacmini eşit yarı-uzay içinde bulunan . değişken için durum burada gösterilmektedir, , ve daha sonra ayarlanmıştır .tn[0,1]nx1+x2+⋯+xn≤tn=3t1/23/25/2
Şöyle gelen gelişmeler ile , hiper çaprazlamalar köşe de , . Her seferinde kesitin şekli değişir: Şekilde önce bir üçgen ( simpleks), sonra bir altıgen, sonra tekrar bir üçgendir. Neden PDF bu değerlerinde keskin bükülmeler yapmadığından ?t0nHn(t):x1+x2+⋯+xn=tt=0t=1,…,t=n2t
Bunu anlamak için, öncelikle küçük değerlerini düşünün . Burada, hiper bir simpleksini keser. Simpleksin tüm boyutları ile doğru orantılıdır , bu nedenle "alanı" ile orantılıdır . Bunun için bazı gösterimler daha sonra kullanışlı olacaktır. Let "birim basamak fonksiyonu" olaraktHn(t)n−1n−1ttn−1θ
θ(x)={01x<0x≥0.
Hiper küpün diğer köşelerinin varlığı olmasaydı, bu ölçeklendirme süresiz olarak devam ederdi. simpleks alanının bir grafiği, aşağıdaki kesintisiz mavi eğriye benzeyecektir: negatif değerlerde sıfırdır ve değerine eşittirOlumlu olanda, uygun bir şekilde yazılmış. Orjinalinde düzeninin "dolandırıcığı" vardır, yani düzenindeki tüm türevlerin var olduğu ve sürekli olduğu, ancak düzenindeki sol ve sağ türevlerin var olduğu ancak o zaman aynı fikirde olmadığı .n−1tn−1/(n−1)!θ(t)tn−1/(n−1)!n−2n−3n−2
(Bu şekilde gösterilen diğer eğriler (Kırmızı), (Altın) ve (Siyah) durumundaki rolleri aşağıda daha ayrıntılı olarak ele alınmıştır.)−3θ(t−1)(t−1)2/2!3θ(t−2)(t−2)2/2!−θ(t−3)(t−3)2/2!n=3
Ne olur anlamak için haçlar , en ayrıntılı olarak davayı inceleyelim tüm geometri bir düzlemde gerçekleşir. "Küp" birimini (şimdi sadece bir kare) , burada gösterildiği gibi , kadranların doğrusal bir kombinasyonu olarak görebiliriz:t1n=2
İlk kadran sol alt panelde gri renkte görünür. Değeri olan beş panel gösterilmiştir diyagonal hat belirlenmesi. CDF sağda gösterilen sarı alana eşittir. Bu sarı alan şunlardan oluşur:t1.5
Sol alt paneldeki üçgen gri alan,
Sol üst paneldeki üçgen yeşil alan eksi ,
Düşük orta paneldeki üçgen kırmızı alanı eksi ,
Ayrıca üst orta panelde görülebilecek herhangi bir mavi alan (ancak böyle bir alanı değil, ne kadar olacaktır aşan ).t2
Bu alanın her biri bir üçgenin alanıdır. Gibi ilk terazi , sonraki iki sıfır ve aksi gibi ölçek ve son sıfır olan ve aksi takdirde gibi ölçeklenir . Bu geometrik analiz CDF'nin ile orantılı olduğunu göstermiştir. = ; eşdeğerde, PDF, üç fonksiyonun toplamıyla orantılıdır: , ve2n=4tn=t2t<1(t−1)n=(t−1)2t<2(t−2)nθ(t)t2−θ(t−1)(t−1)2−θ(t−1)(t−1)2+θ(t−2)(t−2)2θ(t)t2−2θ(t−1)(t−1)2+θ(t−2)(t−2)2θ(t)t−2θ(t−1)(t−1)θ(t−2)(t−2)( olduğunda her biri doğrusal olarak ölçeklenir ). Bu şeklin sol paneli grafiklerini gösterir: açıkça, hepsi orijinal grafiğin versiyonlarıdır , fakat (a) , ve birimin sağa kaydırılması ve (b) yeniden ölçeklendirilmesi , Sırasıyla ve .n=2θ(t)t0121−21
Sağ panel, bu grafiklerin toplamını gösterir (birim alana sahip olacak şekilde normalize edilmiş siyah katı eğri: bu, asıl soruda gösterilen açısal görünümlü PDF'dir).
Şimdi herhangi bir iid üniforma değişkeninin PDF'sindeki "bükülmeler" in yapısını anlayabiliriz. Hepsi tam olarak "kıvrım" de oluşur gibi fonksiyonu , muhtemelen yeniden olçeklendirilmiş ve tamsayılar kaymıştır burada hiper tekabül , köşelerini geçiyor. İçin , bu yönde görünür bir değişiklik: sağ türevi de ise sol türevi ise . İçin , bu bir sürekli0θ(t)tn−11,2,…,nHn(t)n=2θ(t)t001n=3yön değişikliği, ancak ikinci türevde ani (süreksiz) bir değişiklik. Genel , sırasına göre sürekli türevler olacak ancak türevinde bir süreksizlik olacaktır .nn−2n−1st
Cebirsel Manipülasyondan Sezgi
KF'yi hesaplamak için entegrasyon, olasılık analizindeki koşullu olasılık şekli ve hiper küpün, kadranların doğrusal bir kombinasyonu olarak sentezlenmesi, hepsinin orijinal tekdüze dağılımına geri dönmesini ve daha basit şeylerin doğrusal bir kombinasyonu olarak yeniden ifade edilmesini önerir. . Nitekim, PDF yazılabilir
fX(x)=θ(x)−θ(x−1).
Shift operatörünü tanıtalım : grafiğini bir üniteyi sağa kaydırarak herhangi bir işlevine etki eder :Δf
(Δf)(x)=f(x−1).
Resmen, o zaman, bir değişkeninin PDF'si için yazabiliriz.X
fX=(1−Δ)θ.
Bir miktar PDF IID üniforma konvolüsyon olan kendisi ile kere. Bu, rastgele değişkenlerin toplamının tanımından sonra gelir: ve iki fonksiyonunun evrişimi , fonksiyondur.nfXnfg
(f⋆g)(x)=∫∞−∞f(x−y)g(y)dy.
Evrişimin ile işlediğini doğrulamak kolaydır . Sadece entegrasyon değişkenini ile :Δyy+1
(f⋆(Δg))=∫∞−∞f(x−y)(Δg)(y)dy=∫∞−∞f(x−y)g(y−1)dy=∫∞−∞f((x−1)−y)g(y)dy=(Δ(f⋆g))(x).
Toplamının PDF için istatistiksel bağımsız üniforma, şimdi yazma için cebirsel devam edebilirn
f=f⋆nX=((1−Δ)θ)⋆n=(1−Δ)nθ⋆n
( "güç", tekrarlayan evrişimi ifade eder, noktadan çarpma yapmaz!). Şimdi direk, temel bir entegrasyondur;⋆nθ⋆n
θ⋆n(x)=θ(x)xn−1n−1!.
Gerisi cebirdir, çünkü Binom Teoremi geçerlidir (gerçekler üzerindeki herhangi bir değişmeli cebirde olduğu gibi):
f=(1−Δ)nθ⋆n=∑i=0n(−1)i(ni)Δiθ⋆n.
Çünkü sadece tarafından argüman geçer , bu sergiler PDF kaydırılmış versiyonlarının bir lineer bir kombinasyonu olarak , tam olarak geometrik çıkarılabilir olarak:Δiifθ(x)xn−1
f(x)=1(n−1)!∑i=0n(−1)i(ni)(x−i)n−1θ(x−i).
(John Cook, bu formülü daha sonra blog gönderiminde, için notasyonu kullanarak yazar .) ( x - i ) n - 1 θ ( x - i )(x−i)n−1+(x−i)n−1θ(x−i)
Buna göre, her yerde pürüzsüz bir işlev olduğu için, PDF'nin herhangi bir tekil davranışı yalnızca in tekil olduğu yerlerde (açıkçası sadece ) ve sağa kaydırılan yerlerde gerçekleşir. . Bu tekil davranışın doğası - pürüzsüzlük derecesi - bu nedenle konumlarının hepsinde aynı olacaktır . θ ( x ) 0 1 , 2 , … , n n + 1xn−1θ(x)01,2,…,nn+1
Bunu göstermek, için olan resimdir (sol panelde) toplamın içindeki bireysel terimleri ve (sağ panelde) toplamın kendisiyle sonuçlanan kısmi toplamları (koyu siyah eğri) gösterir:n=8
Yorumları Kapatma
Son yaklaşım nihayet toplamının PDF hesaplamak için kompakt, pratik ifadesini vermiştir ettiğini nota yararlıdır istatistiksel bağımsız tekdüze değişkenleri. (CDF için bir formül benzer şekilde elde edilmiştir.)n
Merkezi Sınır Teoremi'nin burada söyleyecek çok şeyi yok. Sonuçta, bir iid Binom değişkeninin toplamı Normal dağılıma yaklaşır, ancak bu toplam her zaman ayrıktır: hiçbir zaman bir PDF bile içermez ! Bir "kinks" ya da bir PDF'nin CLT'den gelebilecek farklılaşabilirlik ölçütleri hakkında herhangi bir sezgiyi ummamalıyız.