Poisson, Gama-Poisson neye göre üsteldir?


16

Poisson dağılımı birim zaman başına olayları ölçebilir ve parametre . Üstel dağılım, parametresi ile bir sonraki olaya kadar geçen süreyi ölçer . Olayları veya zamanları modellemenin daha kolay olmasına bağlı olarak, bir dağıtım diğerine dönüştürülebilir.λ1λ

Şimdi, bir gama-poisson, daha büyük bir varyansa sahip "gerilmiş" bir zehirdir. Weibull dağılımı, daha büyük bir varyansa sahip "gerilmiş" bir üsteldir. Ancak bu ikisi kolayca birbirine dönüştürülebilir, aynı şekilde Poisson üstel hale getirilebilir mi?

Yoksa gamma-poisson dağılımı ile birlikte kullanılması daha uygun başka bir dağıtım var mı?

Gama-poisson, negatif binom dağılımı veya NBD olarak da bilinir.

Yanıtlar:


14

Bu oldukça basit bir sorundur. Her ne kadar Poisson ve Negatif Binom dağılımları arasında bir bağlantı olsa da, insanları olumsuz binom süreçlerini düşünmeye teşvik ettiği için bunun özel sorunuz için yararlı olmadığını düşünüyorum. Temel olarak, bir dizi Poisson süreciniz var:

Yi(ti)|λiPoisson(λiti)

Nerede Yi süreçtir ve ti bunu gözlemlemek zamanıdır ve i birey sayısını ifade etmektedir. Ve oranları bir dağıtım ile birbirine bağlayarak bu süreçlerin "benzer" olduğunu söylüyorsunuz:

λiGamma(α,β)

üzerinden entegrasyon / mxixing yaparken λi:

Yi(ti)|αβNegBin(α,pi)wherepi=titi+β

Bunun bir pmf değeri vardır:

Pr(Yi(ti)=yi|αβ)=Γ(α+yi)Γ(α)yi!piyi(1pi)α

Bekleme süresi dağılımını elde etmek için şunu not ediyoruz:

= 1 - ( 1 - p i ) α = 1 - ( 1 +

Pr(Titi|αβ)=1Pr(Ti>ti|αβ)=1Pr(Yi(ti)=0|αβ)
=1(1pi)α=1(1+tiβ)α

Bunu ayırt edin ve PDF'ye sahip olun:

pTi(ti|αβ)=αβ(1+tiβ)(α+1)

Bu tip II genelleştirilmiş Pareto dağılımlarının bir üyesidir. Bunu bekleme süresi dağılımınız olarak kullanırdım.

Poisson dağılımı ile bağlantıyı görmek için , böyleceβ=αayarlarsakαβ=E(λi|αβ) ve sonraαlimitinialıyoruz:β=αλα

limααβ(1+tiβ)(α+1)=limαλ(1+λtiα)(α+1)=λexp(λti)

Bu yorumlayabileceğiniz anlamına gelir aşırı dağılım parametresi olarak.1α


1
Bekleme süresi dağılımının kabaca konuşursak, bir Gamma rasgele oran parametresi ile üstel dağılım olduğunu ve kesinlikle konuşursak, bir Gamma rasgele oran parametresine sahip herhangi bir Gama dağılımı için olduğu gibi, ikinci tür bir Beta dağılımı olduğunu da not edebilirsiniz.
Stéphane Laurent

@Probabilityislogic'i temel alarak, NBD ve Pareto arasındaki ilişki hakkında daha fazla ayrıntı sağlayan aşağıdaki makaleyi buldum: Gupta, Sunil ve Donald G. Morrison. Heterojenitin Tüketici Satın Alma Oranlarında Tahmini. Pazarlama Bilimi, 1991, 10 (3), 264-269. Bu soruyu yanıtlamama yardımcı olan herkese teşekkürler.
zbicyclist

+ 1, ı, bu hoş analitik formu mevcut artık olabilir tahmin , burada C , bir sabittir. Poisson(λiti+c)c
Randel

1
@randel - bu rv not ederek bir "güzel-ish" formu alabilir iki bağımsız RV toplamıdır ... , Y ı , yukarıdaki ile aynı olan X- ı ~ p o i s s o n ( c ) . Olarak X I bağımlı değildir λ i ya da Y i pdf Z i evrişim negatif binom pdf ve bir Poisson pdf üzerinde. Bekleme süresi dağılımını elde etmek için sadece P r ile çarpınZi=Yi+XiYiXipoisson(c)XiλiYiZi yukarıdaki cevapta P r ( X i = 0 ) = e - c . Daha sonra bekleme süresi 1 - e - c ( 1 + t iPr(Yi=0)Pr(Xi=0)=ecvee-cα'nın pdf'si1ec(1+tiβ)α. ecαβ(1+tiβ)(α+1)
olasılık

1
Bu karıştırma dağılımı açısından işe yaramaz, çünkü (aksi takdirde poisson ortalaması negatiftir). Gama karıştırma dağılımının kesilmesi gerekir (ayrıca önceki cevabımda c > 0 olduğunu varsaydım ). Bu nb dağılımı olmadığı anlamına gelir. λi<cti1c>0
olasılık

4

Bir olasılık: Poisson, Negatif-Binomial olduğu için Üstel'dir ... Üstel!

Negatif Binom Süreci adı verilen saf sıçrama artan Lévy süreci vardır, öyle ki zamanında değer negatif binom dağılımına sahiptir. Poisson sürecinin aksine, atlamalar neredeyse kesin olarak değil 1 . Bunun yerine logaritmik bir dağılım izlerler . By toplam varyansın hukuk , varyans bazı (atlar ortalama boyutuna göre ölçekli) engellerin sayısı gelir ve varyans bazı atlar boyutlarda gelir ve bunu kontrol için kullanabilir aşırı dağılmıştır.t1

Başka faydalı açıklamalar olabilir. Bkz . "DNA dizilemesi için negatif binom dağılımını çerçeveleme".


Yukarıda açıklanan Negatif Binom Sürecinin nasıl oluşturulacağı konusunda daha açık konuşalım.

  • p<1

  • X1,X2,X3,...P(xi=k)=1log(1p)pkk.

  • Nlog(1p), so N(t)=Pois(tlog(1p)).

  • Let NBP be the process so that

NBP(t)=i=1N(t)Xi.

NBP is a pure jump process with logarithmically distributed jumps. The gaps between jumps follow an exponential distribution with rate log(1p).

I don't think it is obvious from this description that NBP(t) has a negative binomial NB(t,p) distribution, but there is a short proof using probability generating functions on Wikipedia, and Fisher also proved this when he introduced the logarithmic distribution to analyze the relative frequencies of species.


1
No, any compound Poisson process has an exponential waiting time. This means you add Pois(λt) IID random variables with some distribution.
Douglas Zare

No, that is not what is meant by a compound Poisson process. en.wikipedia.org/wiki/Compound_Poisson_process " The jumps arrive randomly according to a Poisson process and the size of the jumps is also random, with a specified probability distribution." I did not say IID Poisson variables. You take the Nth partial sum of IID logarithmic random variables where N is the value of a Poisson process.
Douglas Zare

If you multiply a Poisson process by 2, this is not a Poisson process and the waiting times remain exponential.
Douglas Zare


0

I am not able to comment yet so I apologize is this isn't a definitive solution.

You are asking for the appropriate distribution to use with an NB but appropriate isn't entirely defined. If an appropriate distribution means appropriate for explaining data and you are starting with an overdispersed Poisson then you may have to look further into the cause of the overdispersion. The NB doesn't distinguish between a Poisson with heterogeneous means or a positive occurrence dependence (that one event occurring increases the probability of another occurring). In continuous time there is also duration dependence, eg positive duration dependence means the passage of time increases the probability of an occurrence. It was also shown that negative duration dependence asymptotically causes an overdispersed Poisson[1]. This adds to the list of what might be the appropriate waiting time model.


1
cause of the overdispersion: This is consumer purchase data. Individual consumers are poisson, each with a rate of purchase lambda. But not every consumer has the same lambda -- that's the cause of the overdispersion. The lambda purchasing rates are considered to be distributed as gamma. This is a common model (traces back to A.S.C. Ehrenberg), but I haven't found anything in his writing that answers this question.
zbicyclist
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.