Poisson dağılımına normal yaklaşım


12

İşte Wikipedia şöyle der:

Yeterince büyük λ değerleri için (örneğin λ>1000 ), ortalama λ ve varyans λ (standart sapma λ ) ile normal dağılım , Poisson dağılımına mükemmel bir yaklaşımdır. Eğer λ 10 ° C'den daha yüksektir, uygun bir süreklilik düzeltmesi, yani gerçekleştirilir, daha sonra normal dağılım iyi bir yaklaşımdır P(Xx), (alt-durum), burada x , negatif olmayan bir tamsayıdır ile değiştirildiği, P(Xx+0.5).

FPoisson(x;λ)Fnormal(x;μ=λ,σ2=λ)

Maalesef bu belirtilmedi. Bunu biraz titizlikle göstermek / kanıtlamak istiyorum. Nasıl gerçekten yapabilen söylemek zaman normal dağılım iyi bir yaklaşımdır λ>1000 , bu 'mükemmel' yaklaşımını ölçmek yapmak nasıl, ne tedbirler kullanıldı?

Bununla ilgili en uzak nokta , John'un Berry-Esseen teoremini kullanmaktan bahsettiği ve iki CDF'deki hatayı yaklaşık olarak tahmin ettiği yerdir. λ1000 herhangi bir değerini denemiyor .


6
Sen olamaz kanıtlamak 'iyi' tanımlayan olmadan. (Asimptotik bir sonuç kanıtlayabilirsiniz, ancak ölçütlerinizi tanımlamadan belirli bir örnek boyutta 'iyi' olduğunu ilan edemezsiniz.) Davranışını doğrudan örnekle gösterebilirsiniz (insanların ne kadar iyi 'iyi' görebildiğini görebilirsiniz) kendi ışıklarıyla). İnsanların kullanma eğiliminde olduğu tipik kriterler için , kuyruğun derinliklerine gitmediğiniz sürece için bir süreklilik düzeltmesi iyi sonuç verir . λ>10
Glen_b

1
(Daha açık olmak gerekirse, ölçütünüz mutlak bir
hataysa

Yanıtlar:


7

parametresi ile Poisson olduğunu ve ortalama ve varyans ile normal olduğunu varsayalım . Bana göre uygun karşılaştırmanın ve . Burada basitlik için yazıyorum , yani ortalamadan standart sapmalarına karşılık geldiğinde ilgileniyoruz .XλYλPr(X=n)Pr(Y[n12,n+12])n=λ+αλnα

Bu yüzden hile yaptım. Mathematica kullandım. Her ikisi de ve asimptotik olarak olarak . Ancak fark, asimptotik bir Eğer Bunu işlevi olarak , http://www.johndcook.com/blog/normal_approx_to_poisson/ adresinde ikinci ile sonuncu rakamda gösterilen eğri ile aynı olur .Pr(X=n)Pr(Y[n12,n+12])

12πλeα2/2
λ
α(α23)eα2/262πλ
α

İşte kullandığım komutlar:

  n = lambda + alpha Sqrt[lambda];
  p1 = Exp[-lambda] lambda^n/n!;
  p2 = Integrate[1/Sqrt[2 Pi]/Sqrt[lambda] Exp[-(x-lambda)^2/2/lambda], {x, n-1/2, n+1/2}];
  Series[p1, {lambda, Infinity, 1}]
  Series[p2, {lambda, Infinity, 1}]

Ayrıca, deney bir parça, bunun için daha iyi bir asimptotik yaklaşımı gibi geliyor olduğu . Sonra hata yaklaşık kat daha küçüktür.Pr(X=n)Pr(Y[nα2/6,n+1α2/6])

(5α49α26)eα2/2722πλ3/2
λ

2

Glen_b doğrudur ki "iyi uyum" çok öznel bir kavramdır. Bununla birlikte, poisson dağılımınızın makul derecede normal olduğunu doğrulamak isterseniz, varsayımsal bir Kolmorgov-Smirnov testi kullanarak sıfır hipotezi CDF, dağılımından geldiğini varsayar. numuneniz bir poisson ( ) ' dan gelecektir . Bir numuneyi gerçekten test etmediğinizden, ancak bir dağılımı diğerine karşı test ettiğiniz için, bu varsayımsal test için varsaydığınız örnek büyüklüğü ve önem seviyesi hakkında dikkatlice düşünmeniz gerekir (KS testini tipik şekilde kullanmıyoruz). Yani:H0:N(λ,λ)λ

  • Temsili, varsayımsal bir örneklem büyüklüğü, n seçin ve testin önem derecesini tipik bir değere, örneğin% 5'e ayarlayın.

Şimdi, verilerinizin gerçekten bir poisson ( ) ' dan geldiğini varsayarak, bu test için Tip II hata oranını hesaplayın . Normal bir dağılım ile uyum dereceniz, bu tip II hata oranı olacaktır, çünkü belirli poisson dağılımınızdan n boyutundaki numuneler, seçtiğiniz bir KS normallik testi tarafından ortalama olarak zamanın% % 'si olarak kabul edilecektir . önem düzeyi.λβ

Her neyse, "uyum iyiliği" duygusu edinmenin bir yolu bu. Ancak, hepsi kendiniz için tanımlamanız gereken bazı öznel "iyilik" kavramlarına güvenir.


2

Binom dağılımından türetme size bir fikir verebilir.

Binom rasgele bir değişkenimiz var;

p(x)=(nx)px(1p)nx

Bu alternatif olarak özyinelemeli olarak hesaplanabilir;

p(x)=(nx+1)px(1p)p(x1)

Başlangıç ​​koşulunu korursanız;

p(0)=(1p)n

Şimdi büyük ve küçük olduğunu ancak in ortalama başarısının sabit olduğunu varsayalım . Sonra aşağıdakileri yapabiliriz;npp(x)(np=λ)

P(X=i)=(ni)px(1p)nx

Bunu .p=λ/n

P(X=i)=n!(ni)!i!(λn)i(1λn)ni

Bazı değişkenleri değiştirip değerlendiririz;

P(X=i)=n(n1)(n2)(ni+1)niλii!(1λn)n(1λn)i

Matematikten olduğunu biliyoruz . Ayrıca biliyoruz ki çünkü hem üst hem de alt derece polinomlarıdır .limn(1+x/n)n=ex[n(n1)(n2)(ni+1)]/ni1i

Bu, olarak şu sonuca götürür :n

P(X=i)eλλii!

Daha sonra ve tanımını kullanarak doğrulayabilirsiniz . Binom dağılımının , sürekliliği düzelttiğiniz sürece De Moivre-Laplace Teoremi koşulları altında normale yaklaştığını biliyoruz , bu yüzden yerine .E(X)=λVar(X)=λP(Xx)P(Xx+0.5)

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.