Poisson dağılımı için güven düzeyi nasıl hesaplanır?


32

ne kadar kendime güvenebileceğimi bilmek istiyorum . Poisson dağıtımında üst ve alt güven seviyelerini belirleme yöntemini bilen var mı?λ

  • Gözlemler ( ) = 88n
  • Örnek ortalama ( ) = 47.18182λ

% 95 güven bunun için nasıl görünür?


Ayrıca tahminlerinizi önyüklemeyi düşünebilirsiniz. İşte bootstrapping hakkında kısa bir eğitim.
Mark T Patterson,

Yanıtlar:


27

Poisson için ortalama ve varyansın her ikisi de . Eğer lambda etrafındaki güven aralığını istiyorsanız, standart hatayı olarak hesaplayabilirsiniz .λλ/n

Yüzde 95'lik güven aralığı .λ^±1.96λ^/n


26
büyük olduğunda bu iyidir , o zaman Poisson'a bir Normal dağılım tarafından uygun şekilde yaklaşılır. Ufacık değerler veya daha yüksek güven için, daha iyi aralıklar vardır. Bkz math.mcmaster.ca/peter/s743/poissonalpha.html gerçek kapsamının bir analizi ile birlikte ikisi için. (Burada, "kesin" aralık "Pearson" aralığı) (45,7683, 48,639 olan) (45,7575, 48,6392, ve normal yaklaşım) 45,7467, 48,617 (verir: çünkü çok düşük bu kadar biraz, ama yeterince yakın n λ = 4.152 ).nλnλ=4152
whuber

4
Benim gibi kafası karışmış diğerleri için: işte 1.96'nın nereden geldiğine dair bir açıklama.
mjibson

2
Whuber tarafından verilen web sitesinde yer alan bilgiler ışığında, bu problemin tam aralığını nasıl hesapladınız? Takip edemedim, çünkü bu site yalnızca bir örneğiniz olduğunda nasıl devam edeceğinizi gösteriyor gibi görünüyor. Belki basit bir şey anlamıyorum ama dağılımım çok küçük bir lambda (n) değerine sahip, bu yüzden normal yaklaşımı kullanamıyorum ve tam değeri nasıl hesaplayacağımı bilmiyorum. Herhangi bir yardım çok takdir edilecektir. Teşekkürler!

Burada ortalama hakkın standart sapmasını kullanıyorlar? Öyle SE = sig/sqrt(N) = sqrt(lam/N)mi? Bu, tek değerlerin standart sapması sigbize Poisson dağılımından rastgele örnekler çekme olasılığını anlattığından , mantıklı olacaktır ; oysa, SEyukarıda tanımlandığı gibi, lamonu tahmin etmek için kullandığımız örnek sayısı göz önüne alındığında bize olan güvenimizi anlatır .
AlexG

17

Bu yazıda, Poisson dağılımının ortalaması için bir güven aralığı hesaplamak için 19 farklı yöntem tartışılmaktadır.

http://www.ine.pt/revstat/pdf/rs120203.pdf


2
Modun buradaki bildirimine rağmen, bu cevabı olduğu gibi seviyorum, çünkü ölçülen bir Poisson sisteminin nasıl değerlendirileceği konusunda genel bir fikir birliğinden daha az olduğuna işaret ediyor.
Carl Witthoft

7

Başkalarının vermiş olduğu cevaplara ek olarak, bu soruna başka bir yaklaşım model tabanlı bir yaklaşımla ulaşılmaktadır. Merkezi limit teoremi yaklaşımı kesinlikle geçerlidir ve önyüklenmiş tahminler, küçük örnek ve mod belirsizliği sorunlarından çok fazla koruma sağlar.

Tam verimlilik için regresyon modeli tabanlı bir yaklaşım kullanarak için daha iyi bir güven aralığı elde edebilirsiniz . Türevlerden geçmeye gerek yok, ancak R'de basit bir hesaplama şöyle devam ediyor:λ

x <- rpois(100, 14)
exp(confint(glm(x ~ 1, family=poisson)))

Bu simetrik olmayan bir aralık tahminidir, unutmayın, çünkü poisson glm'nin doğal parametresi log nispi oranıdır! Bu bir avantajdır çünkü sayma verilerinin sağa eğilme eğilimi vardır.

Yukarıdaki yaklaşımın bir formülü vardır ve bu:

exp(logλ^±1nλ^)

Bu güven aralığı, Poisson verileri için doğal parametre (log) ölçeğindeki maksimum olasılık tahmininden geldiği anlamında "verimli" olup, nominal% 95 kapsamını korurken, sayı ölçeğine dayanan değerden daha sıkı bir güven aralığı sağlar. .


+1 Verimlilikten farklı bir sıfat kullanacağımı düşünüyorum (ya da hesaplamalı ya da kod golf etkinliği demek yerine daha açıkçası). whuber'in yorumu kesin aralıklar veren bir kaynağa işaret ediyor ve glm yaklaşımı da asimptotik sonuçlara dayanıyor. (Yine de daha genel, bu yüzden de bu yaklaşımı tavsiye etmeyi seviyorum.)
Andy W

Aslında bunu biraz daha düşünerek, veriye bakmadan sadece belirlediğinizde (bence) tam kapsama alanı uygulanabilir . Hızlı bir simülasyona bakın, gözlenen değere göre hesaplanan kapsam (yeni gözlemler için) çok daha düşük. Burada hızlı simülasyon . μ
Andy W,

1
Bu formül için sizin yetkiniz nedir? Bir alıntı yapabilir miyiz?
pauljohn32

@AndyW: bağlantınız hızlı simülasyon için geçerli değil
pauljohn32 22

1
@ Pauljohn32 Casella Berger'in özellikle üstel ailedeki metnine göz attığında log hızı doğal parametredir.
AdamO

5

Poisson dağılımından bir gözlem verildiğinde ,

  • sayılan olay sayısı n'dir.
  • ortalama ( ) ve varyans ( σ 2 ) eşittir.λσ2

Adım adım,

  • λ^=nλ
  • n>20σ

stderr=σ=λn

Şimdi, % 95 güven aralığı ise,

I=λ^±1.96 stderr=n±1.96 n

[Düzenlendi] Soru verilerine dayanan bazı hesaplamalar,

  • λ

    Bu varsayımı, asıl soru deney ya da verinin nasıl elde edildiğine dair herhangi bir bağlam sağlamadığı için yapıyorum (istatistiksel verileri işlerken çok önemlidir).

  • % 95 güven aralığı, özel durum için

I=λ±1.96 stderr=λ±1.96 λ=47.18182±1.96 47.18182[33.72,60.64]

Dolayısıyla, ölçüm (n = 88 olay) % 95 güven aralığı dışında olduğu için,

  1. Süreç Poisson sürecini takip etmiyorsa, veya

  2. λ


λ/n


1
λnλ

2
Teşekkürler! Şimdi bazı hesaplamaları içeren cevabı değiştirdim. Soru nasıl açıklayamıyorλve n elde edildi, bu yüzden eğitimli bir tahmin yaptım. Dediğiniz gibi, n çok farklıysaλModelin Poisson olamayacağına ya da ölçümün doğru yapılmayacağına dair ilk ipucu. Bunu kontrol etmenin bir yolu, bu durumda n'nin aralık dışında olduğunu gösteren% 95 güven aralığını kesin olarak hesaplamaktır.
jose.angel.jimenez

2
Yukarıdaki jose.angel.jiminez'ın verdiği cevabın yanlış olduğuna ve orijinal sorunun yanlış okunmasından kaynaklandığına inanıyorum. Orijinal poster "Gözlemler (n) = 88" olarak ifade edildi - bu, gözlemlenen zaman aralıklarının toplamı ya da aralık başına gözlemlenen olayların sayısı değildi. 88 gözlem aralığı örneği üzerinden aralık başına ortalama olay sayısı, orijinal poster tarafından verilen lambdadır. (Bunu Jose'nin gönderisine bir yorum olarak dahil etmiştim, ancak yorumda
bulunamayacak kadar yeniyim

@ user44436, bir yorum yapması gereken bir cevap ekledi. Bunu bir yorum olarak tekrarlıyorum, böylece onu görebiliyorsunuz ve cevaplamadığı için kaldırılabiliyor çünkü: ------- Yukarıdaki jose tarafından verilen cevabın yanlış olduğuna ve orijinal sorunun yanlış okunmasından kaynaklandığına inanıyorum. Orijinal posterde Belirtilen Gözlemler (n) = 88 - bu, gözlenen zaman aralıklarının toplamı ya da aralık başına gözlemlenen olayların sayısı değildi. 88 gözlem aralığının numunesi üzerinden aralık başına ortalama olay sayısı, orijinal poster tarafından verilen lambdadır.
Mörre
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.