Poisson rasgele değişkenlerinin yuvarlanmış ortalamasının dağılımı nedir?


20

Poisson rasgele değişkenlerim varsa , (yani ortalamanın tamsayı katı)?λ 1 , λ 2 , , λ n Y = n i = 1 X iX1,X2,,Xnλ1,λ2,,λnY=i=1nXin

Poissons'ın toplamı da Poisson'dur, ancak yukarıdaki durum için aynı olup olmadığını belirlemek için istatistiklerden yeterince emin değilim.


@amoeba Başlığı düzenlemenizi geri aldım çünkü bu aslında "yuvarlama" değil. Cardinal'in önceki düzenlemesi, tam olarak kesin olmasa da, doğru olduğu için tercih edilir.
whuber

@whuber Tamam. Ben bu düzenleme yaparken tereddüt ediyordum, ama şu anda başlık burada ana zorluk ipucu değil (ve böylece bir şekilde yanıltıcı) çünkü "yuvarlama" kelimesini dahil etmeye karar verdi. Uygun terim "aşağı yuvarlama" olmalıdır, belki " Yuvarlatılmış ortalama Poisson rastgele değişkenlerinin dağılımı nedir ?" - itiraf etmeme rağmen biraz hantal geliyor.
amip diyor Reinstate Monica

@amoeba Diğer düzenlemeler elbette hoş geldiniz!
whuber

Yanıtlar:


27

Söz bir genelleme dağılımı sorar dağılımı zaman bilinen ve doğal sayılar desteklenir. ( , ve parametresinin Poisson dağılımına sahiptir .)X X λ = λ 1 + λ 2 + + λ n m = nY=X/mXXλ=λ1+λ2++λnm=n

Dağılımı Y kolay dağılımı tarafından belirlenir mY olasılık üreten fonksiyonu (PGF) PGF açısından belirlenebilir, X . İşte türetmenin bir özeti.


p(x)=p0+p1x++pnxn+Xpn=Pr(X=n)X qmYXq

q(x)=(p0+p1++pm1)+(pm+pm+1++p2m1)xm++(pnm+pnm+1++p(n+1)m1)xnm+.

Çünkü bu kesinlikle , terimleri formun toplamına yeniden düzenleyebiliriz|x|1

Dm,tp(x)=pt+pt+mxm++pt+nmxnm+

için . Fonksiyonları gücü dizisi , her oluşur dizisinin terimi başlayarak bu bazen bir adlandırılır: seyreltme ve . Google aramaları şu anda kararlar hakkında çok yararlı bilgiler vermiyor, bu nedenle tamlık için bir formülün türevi.x t D m , t p m th p t th pt=0,1,,m1xtDm,tpmthptthp

Let bir ilkel birlik kök; örneğin, . Sonra izler ve olduğum th ω = exp ( 2 i π / m ) ω m = 1 m - 1 j = 0 ω j = 0ωmthω=exp(2iπ/m)ωm=1j=0m1ωj=0

xtDm,tp(x)=1mj=0m1ωtjp(x/ωj).

Bunu görmek için, operatörünün doğrusal olduğunu unutmayın, bu nedenle formülü temelinde kontrol etmek yeterlidir. . Sağdaki tarafını uygulanması verir { 1 , x , x 2 , , x n , } x nxtDm,t{1,x,x2,,xn,}xn

xtDm,t[xn]=1mj=0m1ωtjxnωnj=xnmj=0m1ω(tn)j.

Tüm ve bir çoklu ile farklılık , toplamı, her bir terimin eşittir ve elde . Aksi takdirde, terimler yetkileri arasında geçiş yapar ve bunlar sıfıra eşitlenir. Bu operatörün modulo uygun tüm güçlerini koruduğu ve diğerlerinin hepsini öldürdüğü: tam olarak istenen projeksiyon.n m 1 x n ω t - n xtnm1xnωtnxmtm

için bir formül , toplama sırasını değiştirerek ve toplamlardan birini geometrik olarak tanıyarak ve ardından kapalı biçimde yazarak kolayca takip eder:q

q(x)=t=0m1(Dm,t[p])(x)=t=0m1xt1mj=0m1ωtjp(ωjx)=1mj=0m1p(ωjx)t=0m1(ωj/x)t=x(1xm)mj=0m1p(ωjx)xωj.

Örneğin parametre bir Poisson dağılımının PGF olduğu . İle , ve PGF olacakp ( x ) = exp ( λ ( x - 1 ) ) m = 2 ω = - 1 2 Yλp(x)=exp(λ(x1))m=2ω=12Y

q(x)=x(1x2)2j=021p((1)jx)x(1)j=x1/x2(exp(λ(x1))x1+exp(λ(x1))x+1)=exp(λ)(sinh(λx)x+cosh(λx)).

Bu yaklaşımın bir kullanımı ve momentlerini hesaplamaktır . Değeri değerlendirilen PGF türevi olduğu faktörlü an. an ilk doğrusal bir kombinasyonudur faktöryel anlar. Bir Poisson dağıtılan, örneğin, sürekli olarak bu gözlemleri kullanılarak , (birinci faktoryel an olan) eşit olan ortalama , ortalama eşit ve eşittirXk inci x = 1 k inci k inci k x λ 2 ( x / 2 ) λ - 1mYkthx=1kthkthkXλ2(X/2)3(X/3)λ-1+E-3λ/2(sin ( λ12+12e2λ3(X/3)λ1+e3λ/2(sin(3λ2)3+cos(3λ2)) :

Anlamına geliyor

için araçlar sırasıyla : asimptotik olarak işlevler olarak mavi, kırmızı ve sarı renklerle gösterilmiştir, ortalama orijinal Poisson ortalamasına kıyasla düşer .λ ( m - 1 ) / 2m=1,2,3λ(m1)/2

Varyanslar için benzer formüller elde edilebilir. ( yükseldikçe dağınık hale gelirler ve bu yüzden atlanırlar. Kesin olarak belirledikleri bir şey, olduğunda , katının hiçbiri Poisson değildir: ortalama ve varyansın karakteristik eşitliğine sahip değildir) İşte varyansların bir grafiği için bir fonksiyonu olarak :m > 1 Y λ m = 1 , 2 , 3mm>1Yλm=1,2,3

Sapmalar

Daha büyük değerleri için varyansların artması ilginçtir . Sezgisel olarak, bu iki rakip fenomenden kaynaklanır: zemin fonksiyonu, başlangıçta farklı olan değer gruplarını etkili bir şekilde gruplandırır; bu varyansın azalmasına neden olmalıdır . Aynı zamanda, gördüğümüz gibi, araçlar da değişiyor (çünkü her kutu en küçük değeriyle temsil ediliyor); bu, geri eklenecek araç farkının karesine eşit bir terime neden olmalıdır. Büyük için varyans artışı daha büyük değerleri ile artar .λ mλλm

ile varyansının davranışı şaşırtıcı derecede karmaşıktır. Neler yapabileceğini gösteren hızlı bir simülasyonla (in ) bitirelim. Plotlar aşağıda belirtilen maddelerin varyans arasındaki farkı gösteren ve varyans Poisson dağıtılmış için çeşitli değerlerle kadar ile . Her durumda parseller sağda asimptotik değerlerine ulaşmış gibi görünmektedir.m m X / m X X λ 1 5000mYmRmX/mXXλ15000

set.seed(17)
par(mfrow=c(3,4))
temp <- sapply(c(1,2,5,10,20,50,100,200,500,1000,2000,5000), function(lambda) {
  x <- rpois(20000, lambda)
  v <- sapply(1:floor(lambda + 4*sqrt(lambda)), 
              function(m) var(floor(x/m)*m) - var(x))
  plot(v, type="l", xlab="", ylab="Increased variance", 
       main=toString(lambda), cex.main=.85, col="Blue", lwd=2)
})

Arsalar


1
Bu harika bir cevap! Muhtemelen sindirmem biraz zaman alacak :)
Lubo Antonov

1
"Zemin fonksiyonunu kullanmak ... daha karmaşık bir şekilde olsa da varyansı biraz etkiliyor" dedim.
Henry

1
+1 Ayrıntılı cevap için teşekkürler. Zemin fonksiyonunun varyansı etkilediği karmaşık yollar kesinlikle vardır.
Dilip Sarwate

1
R kodunda simülasyon için +1 --- bu sapply()simülasyon için kullanımın çok güzel bir örneğidir . Teşekkürler.
Esad Ebrahim

1
@Roberto Teşekkürler. Ancak, tamamen bir gösterim meselesi olan " " ve " " arasındaki ayrım , tamamen önemsizdir ve hiçbir matematiksel veya istatistiksel içe aktarma yoktur. sxs
whuber

12

Michael Chernick'in dediği gibi, bireysel rastgele değişkenler bağımsızsa, toplam (ortalama ve varyans) parametresi ile Poisson olur diyebilirsiniz . λi=1nλiλ

İle bölünmesi, için ortalama azaltır ve varyans varyans az eşdeğer Poisson dağılımına daha olacak şekilde. Michael'ın dediği gibi, tüm değerler tamsayı değildir.λ / n λ / n 2nλ/nλ/n2

Zemin fonksiyonunun kullanılması ortalamayı yaklaşık azaltır ve daha karmaşık olsa da sapmayı da biraz etkiler. Tamsayı değerleriniz olmasına rağmen, varyans hala ortalamadan önemli ölçüde daha az olacaktır ve bu nedenle Poisson'dan daha dar bir dağılımınız olacaktır.1212n


teşekkürler, kullanabileceğim bir sonuç değil, ama en azından şimdi biliyorum :)
Lubo Antonov

Lamdaların hepsi eşit değilse, sonuç bir Poisson'dan daha negatif bir binom gibi olmamalı mı (şu an için tamsayı olmayan kısmı görmezden gelmek)? Burada ne eksik?
gung - Monica'yı eski durumuna döndürün

2
@gung: Bireyin sadece toplamları ve kaç tane üzerinden dağılımı etkilediği noktasını kaçırıyorsunuz . Hangi belirli değerleri aldıkları önemli değil: aynı sonucu verecektir . λiλ1=1,λ2=2,λ3=9λ1=4,λ2=4,λ3=4
Henry

10

bağımsız Poisson rassal değişkeninin ortalamasının olasılık kütle fonksiyonu açıkça yazılabilir, ancak cevap size çok yardımcı olmayabilir. Michael Chernick'in kendi cevabındaki yorumlarda belirttiği gibi , bağımsız parametrelerle bağımsız Poisson rastgele değişkenlerinin toplamı parametresine sahip bir Poisson rastgele değişkendir . Bu nedenle, Böylece, olasılıkla değerini alan rastgele bir değişkendirn iXiXiλiλ=iλi

P{i=1nXi=k}=exp(λ)λkk!,  k=0,1,2,,
Y^=n1i=1nXik/nexp(λ)λkk! . Bu Not olduğu değildir (bu eşit aralıklı rasyonel değerleri almak rağmen) bir tam sayı değerli rastgele değişken. Kolayca, aşağıdaki değeri ile bir tamsayıdır değerli rastgele değişken alma olduğunu olasılığı ile Bu değilY^Y=Y^mλn
P{Y=m}=P{1ni=1nXi=m}=exp(λ)i=0n1λmn+i(mn+i)!,  m=0,1,2,,
Poisson rasgele değişkeninin olasılık kütle fonksiyonu. Ortalama ve varyans için formüller bu olasılık kütle fonksiyonu kullanılarak yazılabilir, ancak ve açısından güzel basit cevaplara yol açmazlar . Henry tarafından belirtildiği gibi yaklaşık değerler elde edilebilir.λn

+1 Yine de anları için kapalı formüller var . Y
whuber

Titiz formülasyon için teşekkürler! Ortalama ve varyans için formüllere bir çatlama yapmak için herhangi bir şansınız var mı?
Lubo Antonov

2
Belki de @whuber, anlar için kapalı formlu formüllerin bulunabileceği bir bağlantı (veya bir kitap veya dergi makalesi alıntısı) yayınlayacak veya ayrıntılı bir türev ile veya olmadan formüllerin kendilerini veren bir cevap yazacaktır.
Dilip Sarwate

@Dilip Kapalı formüller hakkındaki iddiam yayınlanan herhangi bir şeye dayanmıyordu, bu yüzden aklımda ne olduğunu ve bu durumu anlamak için nasıl kullanılabileceğini gösteren ayrı bir cevap yayınladım.
whuber

3

Y Poisson olmayacak. Poisson rasgele değişkenlerinin negatif olmayan tamsayı değerlerini aldığını unutmayın. Bir sabite bölündüğünüzde, tamsayı olmayan değerlere sahip olabilen rastgele bir değişken oluşturursunuz. Yine de Poisson şeklindedir. Sadece ayrık olasılıklar tamsayı olmayan noktalarda meydana gelebilir.


Bu mantıklı, ama aslında ayrıksa, örneğin ortalamanın zemini? Bu Poisson yapar mı? Y
Lubo Antonov

@ lucas1024 Sanmıyorum ama emin değilim.
Michael R.Chickick

Toplam toplamının şekli kesinlikle Poisson, değil mi? ortalama ve varyansları aynıdır. Ölçekli bir Poisson gibi bir şey yok mu? Y sadece ile ölçeklendirilmiş bir poisson değişkeni (toplam)n - 1Xin1
JDav

@JDav Toplam, Poisson oranıdır ve rate parametresi, bireysel oran parametrelerinin toplamına eşittir. Ancak OP 1 / n ölçeklendirir ve Y'nin hemen altındaki tamsayıyı kısaltmak ister. Bunun dağıtım için tam olarak ne yaptığını bilmiyorum.
Michael R.Chickick

Önceki yorumum bağımsızlığını üstlendi.
Michael R.Chickick
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.