Poisson dağılımının neden binom dağılımının sınırlayıcı vakası olduğunu sezgisel olarak anlayın


14

DS Sivia'nın "Veri Analizi" nde Poisson dağılımının binom dağılımından bir türevi vardır.

olduğunda Poisson dağılımının binom dağılımının sınırlayıcı vakası olduğunu iddia ederler; burada , deneme sayısıdır.MM

Soru 1: Bu argüman sezgisel olarak nasıl anlaşılabilir?

Soru 2: Büyük sınırı neden eşittir Burada , başarı sayısıdır. denemeler? (Bu adım türetmede kullanılır.)MM!N!(MN)!MNN!NM


Yanıtlar:


5

Basit bir sezgisel açıklama deneyeceğim. Binom rastgele değişken için beklentimizin ve varyansın olduğunu kaydedin . Şimdi , her biri çok küçük bir olasılık sahip çok sayıda numaralı denemedeki olay sayısını kaydettiğini düşünelim, böylece çok yakınız (gerçekten ). Sonra demek ve , bu nedenle ortalama ve varyansın her ikisi de eşittirn p n p ( 1 - p ) X n p 1 - p = 1 n p = λ n p ( 1 - p ) n p 1 = λ λXBin(n,p)npnp(1p)Xnp1p=1np=λnp(1p)np1=λλ. O zaman bir poisson dağıtılmış rastgele değişken için her zaman ortalama ve varyans eşittir! Bu en azından poisson yaklaşımı için bir akla yatkınlık argümanıdır, ancak bir kanıt değildir.

Sonra başka bir bakış açısından bakalım , gerçek noktadaki poisson noktası işlemi https://en.wikipedia.org/wiki/Poisson_point_process . Bu, rastgele noktalar kurallara göre ortaya çıkarsa, aldığımız çizgi üzerindeki rastgele noktaların dağılımıdır:

  1. ayrık aralıklardaki noktalar bağımsızdır
  2. çok kısa bir aralıkta rastgele bir noktanın olasılığı aralığın uzunluğu ile orantılıdır
  3. çok kısa bir aralıkta iki veya daha fazla noktanın olasılığı esasen sıfırdır.

Daha sonra, belirli bir aralıktaki nokta sayısının dağılımı (mutlaka kısa olmamalı) Poisson'dur ( parametresi uzunluk ile orantılıdır). Şimdi, bu aralığı çok, eşit derecede çok kısa alt aralıklara ( n ) bölersek, belirli bir alt aralıkta iki veya daha fazla noktanın olasılığı esasen sıfırdır, böylece bu sayı çok iyi bir yaklaşımla bir bernolli dağılımına sahip olacaktır, yani, Bin ( 1 , p ) , bu yüzden tüm bunların toplamı Bin ( n , p ) olacaktır , bu nedenle bu (uzun) aralıktaki nokta sayısının poisson dağılımına iyi bir yaklaşım.λnBin(1,p)Bin(n,p)

Düzenleme @Ytsen de Boer (OP) den: 2. sorusuna tatmin edici Łukasz Grad @ tarafından cevaplanır.


6

Alternatif bir buluşsal yöntem sunayım. Poisson sürecine binom olarak nasıl yaklaşacağımı göstereceğim (ve düşük olasılıklı birçok denemede yaklaşıklamanın daha iyi olduğunu savunacağım). Bu nedenle binom dağılımı Poisson dağılımına eğilimli olmalıdır.

Diyelim ki olaylar zaman içinde sabit bir hızla gerçekleşiyor. Beklenen olay sayısının λ olduğunu bilerek, bir günde kaç olayın gerçekleştiğinin dağılımını bilmek istiyoruz .

Saat başına beklenen olay sayısı λ/24 . Bunun, belirli bir saatte gerçekleşen bir olayın olasılığının λ/24 olduğu anlamına geldiğini varsayalım . [tam olarak doğru değildir, ancak λ/241 temelde aynı saat içinde birden fazla olayın gerçekleşmediğini varsayabilirsek iyi bir yaklaşımdır ]. Daha sonra , her biri başarı olasılığı λ / 24 olan M=24 denemeleri ile bir binom olarak olay sayısının dağılımını yaklaşık olarak tahmin edebiliriz .λ/24

Aralığımızı dakikalara çevirerek yaklaşımı iyileştiririz. Sonra M = 1440 deneme ile p=λ/1440 . Eğer λ , 10 diyelim, hiçbir dakikanın iki etkinliği olmadığından oldukça emin olabiliriz.M=1440λ

Tabii ki saniyeye geçersek daha iyi olur. Şimdi her biri küçük olasılıkla λ / 86400 olan M=86400 olaylarına bakıyoruz . λ/86400

Senin ne kadar büyük olursa olsun λ olduğunu, sonunda yeterince küçük bir seçebilir Δt çok büyük olasılıkla hiçbir iki olay aynı aralıkta meydana budur, öyle ki. Sonra karşılık gelen binom dağılımı Δt gerçek Poisson dağılımının için mükemmel bir maç olacak.

Tam olarak aynı olmamalarının tek nedeni, iki olayın aynı zaman aralığında meydana gelme olasılığının sıfır olmamasıdır. Ama orada sadece etrafında verilen λ olaylar ve onlar çok daha kutuları bazı sayıya dağıtılır λ , bunlardan herhangi iki aynı tenekesine yalan düşüktür.

Başka bir deyişle, başarı olasılığı p = λ / M ise binom dağılımı Poisson dağılımına M olarak eğilim gösterir .p=λ/M


5

Soru 1

Binom dağılımının tanımını hatırlayın:

her birinde aynı başarı olasılığı bulunan belirli sayıda denemedeki olası başarılı sonuçların sıklık dağılımı .

Bunu Poisson dağılımının tanımı ile karşılaştırın:

sabit bir zamanda meydana gelen bir dizi bağımsız olayın olasılığını veren ayrı bir frekans dağılımı .

İkisi arasındaki önemli fark binomda denemede, Poisson bir süre boyunca t'dir . Sınır nasıl sezgisel olarak ortaya çıkabilir?nt

Diyelim ki sonsuzluk için Bernoulli duruşmalarına devam etmek zorundasınız. Üstelik dakikada koşuyorsunuz . Dakikada her başarıyı sayıyorsunuz. Yani tüm sonsuzluk için her dakika bir B i n ( p , 30 ) işlemi yürütüyorsunuz . 24 saatin üzerinde bir B i n ( p , 43200 ) var .n=30Bin(p,30)Bin(p,43200)

Yoruldukça "18:00 ile 19:00 arasında kaç başarı gerçekleşti?" Cevabınız , yani ortalama başarıları bir saat içinde sağlarsınız. Bu bana Poisson parametresi λ gibi geliyor.3060pλ


5

Soru 2)

M!N!(MN)!MNN!=M(M1)(MN+1)MN=1(11M)(1N1M)

Sabit N için limiti almakN

limMM!N!(MN)!MNN!=limM1(11M)(1N1M)=1

+1. Stirling'in yaklaşımına bakarak başladım, ama daireler çizmeye başladım. Yaklaşımınız çok daha basit.

Ben OP sezgisel bulacaksınız ne olduğunu sanmıyorum ...
kjetil b halvorsen

MMMkk<<M

1
@kjetilbhalvorsen Q1'e (türetme adımı) bir yanıt, Q1'e değil (sezgisel açıklama)
Ben Bolker

@TemplateRex Hmm ama sanırım noktaya yakınsaklığı kanıtlarken , sabitliğe giderken her sabit için bunu kanıtlamam gerekiyor , değil mi? BuNMωΩlimmXm(ω)X(ω)
Łukasz Grad

5

Sorun, Poisson'u binom dağılımını sınırlayan bir vaka olarak nitelemenizin belirtildiği gibi doğru olmamasıdır .

Poisson şu durumlarda binom için sınırlayıcı bir durumdur: İkinci bölüm önemlidir. Eğer kalıntıları sabit, ilk şart oranı da bağlı olmaksızın artacağını ima eder.

MandMpλ.
p

Poisson dağılımının varsaydığı şey, olayların nadir olduğudur . "Nadir" ile kastettiğimiz, olayların oranının düşük olması değildir - aslında, bir Poisson süreci çok yüksek bir yoğunluğa sahip olabilir ama bunun yerine, herhangi bir zamanda meydana gelen bir olayın olasılığı yok denecek kadar küçük. Bu olasılık bir binom modeli aksine bulunmaktadır bir olayın (örneğin, "başarı") verilen herhangi bir deneme için sabittir.λ[t,t+dt)p

Örnek vermek gerekirse, her biri başarı olasılığı olan bir dizi bağımsız Bernoulli çalışmasını modellediğimizi ve sayısının olarak dağılımının ne olduğuna baktığımızı varsayalım . İstediğimiz kadar büyük olan herhangi bir için ve ne kadar küçük olursa olsun , beklenen başarı sayısı için . Başka bir deyişle, başarı olasılığı ne kadar düşük olursa olsun, sonuçta yeterince deneme yaparsanız, istediğiniz kadar ortalama başarı elde edebilirsiniz. Yani, (ya da sadece " "MpXMNpE[X]=Mp>NM>N/pMMbüyüktür ") için bir Poisson modelini haklı göstermek için yeterli değildir .X

sınırlayıcı olarak cebirsel olarak kurmak zor değil örneği ayarlayarak ve . Buradaki diğer cevaplar bu ilişkinin arkasındaki sezgiye hitap etti ve aynı zamanda hesaplama rehberliği sağladı. Ancak olması önemlidir . Bunu görmezden gelemezsin.

Pr[X=x]=eλλxx!,x=0,1,2,
p = λ / M M p = λ / M
Pr[X=x]=(Mx)px(1p)Mx,x=0,1,2,,M
p=λ/MMp=λ/M

0

Sadece kısmi bir cevap girişiminde bulunabiliyorum ve bu, Soru 2'nin sezgisi ile ilgili.

Binom katsayısı size boyutu örneklerinin sayısını verir arasından, değiştirmeksizin ve düzen olmadan.MNM

Burada o kadar büyür ki, senaryoyu değiştirme ile örnekleme olarak tahmin edebilirsiniz, bu durumda siparişli örnekler alırsınız . Seçilen nesnelerinin sırasını umursamıyorsanız, bu düşerçünkü bu nesneleri sipariş edilebiliryolları.M N N M N / N ! N N !MMNNMN/N!NN!


-2

Mandal katmanları düşen topları

Bence bu, binom dağılımının çok sayıda topla nasıl normale döndüğünü sezgisel olarak açıklayan en iyi örnek. Burada, her topun her katmanda pimin her iki tarafına eşit düşme olasılığı vardır ve tüm toplar aynı sayıda mandalla yüzleşmek zorundadır. Topların sayısı çok arttıkça, farklı bölümlerdeki topların dağılımının normal dağılım gibi olacağı kolayca görülebilir.

2. soruya cevabım Lukasz tarafından verilen cevapla aynı.


2
Bu gerçekten soruyu cevaplamıyor, başka bir soruya cevap veriyor ...
kjetil b halvorsen

1. soruda sorulan soruları sezgisel olarak açıklamaya çalıştım. Bunun neden bir cevap olmadığını düşündüğünüzü lütfen açıklar mısınız?
samwise_the_wise

1
Üzgünüm, şimdi anladım. Tamamen farklı bir soruya cevap verdim. Benim hatam.
samwise_the_wise

1
Bir binom dağılımının oldukça ayrık bir versiyonunu görüyorum. Neden bu quincunx'in altındaki topların dağılımının normal olması gerektiği açık olmalıdır? Bu makineden kaç top attığınıza bakılmaksızın, hala 13 kutuda sayım dağılımı elde edeceksiniz: bu muhtemelen normal olamaz!
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.