Negatif Binom Dağılımı kullanmak için Poisson Dağılımı Kullanarak Bir İşlemi Modelleme'den Geçiş?


24

bir süre zarfında T zamanında birden fazla kez gerçekleşmeyebilecek rastgele bir sürecimiz var T. 0 \ leq t <T döneminde meydana gelen bir dizi olay olasılığını sağlayan, bu sürecin önceden var olan bir modelinden gelen bir veri beslemesine sahibiz 0t<T. Bu mevcut model eski ve tahmin hataları için feed-data üzerinde canlı kontroller yapmamız gerekiyor. Veri-besleme (olasılığını sağlayan edildiği üretim eski model n zaman kalan meydana gelen olaylar t ) yaklaşık Poisson dağıtılır.

Yani anomaliler / hatalarını kontrol etmek, biz izin t kalan zaman ve Xt toplam etkinlik sayısı kalan süre içinde gerçekleşmesi olmak t . Eski model, \ P (X_t \ leq c) tahminlerini ifade eder P(Xtc). Bu nedenle, X_t \ sim \ operatorname {Poisson} (\ lambda_ {t}) varsayımına göre bizdeXtPoisson(λt) :

P(Xtc)=eλk=0cλtkk!.
Olay oranımızı λt eski modelin çıktısından türetmek için (gözlem yt ), bir durum uzayı yaklaşımı kullanıyoruz ve durum ilişkisini şu şekilde modelliyoruz :
yt=λt+εt(εtN(0,Ht)).
Filtrelenmiş durumu E (\ lambda_t | Y_t) elde etmek için \ lambda_t evrimi için bir durum [sabit hız çürüme] modeli kullanarak eski modelden gözlemleri λtfiltrelendiriyor ve tahmini olay frekansında bir anormallik / hatayı E(λt|Yt) . E (\ lambda_t | Y_t) <y_t ise, besleme verileri E(λt|Yt)<yt.

Bu yaklaşım, tahmin edilen olaydaki hataların toplanmasında fevkalade iyi çalışır , T süresi boyunca sayılır T, ancak başka bir süre için de aynı şeyi yapmak istiyorsak, 0t<σ burada σ<23T . Bunu aşmak için, şimdi Negatif Binom dağılımını kullanmaya geçmek istediğimize karar verdik, böylece şimdi X_t \ sim NB (r, p) varsayıyoruz XtNB(r,p)ve bizde:

P(Xtc)=prΣk=0c(1-p)k(k+r-1r-1),
burada \ lambda parametresi λşimdi r ve p ile değiştirilirp. Uygulaması basit olmalı, ancak yorumlama konusunda bazı zorluklar yaşıyorum ve bu nedenle size yardımcı olmak istediğim bazı sorular var:

1. Negatif binom dağılımında sadece p = \ lambda değerini ayarlayabilir miyiz p=λ? Değilse neden olmasın?

2. biz ayarlayabilirsiniz varsayarsak p=f(λ) nerede f bazı fonksiyonudur, nasıl doğru ayarlanmış olabilir r (biz uygun gerekiyor r geçmiş veri kümelerini kullanarak)?

3. Is r Verilen bir süreçte gerçekleşmesini beklemek olayların sayısına bağlı?


r (ve p ) için tahminleri çıkarmaya yönelik ek :

Aslında bu sorunun tersine çevrilmiş olsaydı ve her işlem için olay sayımımız olsaydı, ve için maksimum olasılık tahmincisini benimseyebileceğimizin farkındayım . Elbette, maksimum olabilirlik tahmincisi yalnızca, örnek varyansının örneklem ortalamasından daha büyük olduğu örnekler için mevcuttur, ancak eğer bağımsız aynı dağılımlı gözlemler için olabilirlik işlevini ayarlayabiliriz as: log-olabilirlik fonksiyonunu şöyle yazabiliriz: s , N k 1 , k, 2 , ... , k , N , L ( R , s ) = , N tt i = 1 , P ( k i ; r , s ) ,rpN-k1,k2,,kN

L(r,p)=i=1NP(ki;r,p),
l(r,p)=i=1Nln(Γ(ki+r))i=1Nln(ki!)Nln(Γ(r))+i=1Nkiln(p)+Nrln(1p).
Maksimum değeri bulmak için ve göre kısmi türevleri alıyoruz ve bunları sıfıra : Ayar ve ayarı şunu buluruz: s r l ( R , srprl(R,s)=pl(R,s)=0p=
rl(r,p)=i=1Nψ(ki+r)Nψ(r)+Nln(1p),pl(r,p)=i=1Nki1pNr11p.
rl(r,p)=pl(r,p)=0rl(R,s)=, NΣi=1ψ(ki+r)-Nψ(r)+Nln(rp=i=1Nki(Nr+i=1Nki),
rl(r,p)=Σi=1N-ψ(kben+r)-N-ψ(r)+N-ln(rr+Σben=1N-kbenN-)=0.
Bu denklem Newton veya hatta EM kullanılarak kapalı formda r için çözülemez. Ancak, bu durumda durum böyle değil. Biz rağmen olabilir statik almak için geçmiş verileri kullanmak ve bu gerçekten bizim süreci için herhangi kullanım değildir, biz Poisson kullanarak yokmuş gibi, zaman içinde bu parametreleri uyarlamak gerekir. prp

1
Neden verilerinizi Poisson veya Negative Binomial regresyon modeline eklemiyorsunuz?
StatsStudent

1
Ben gerektiğini hissetmiyorum sahip kullanılacak. Poisson'un Negatif Binomial'ın sınırlayıcı bir davası olduğunu akılda bulundurarak, Poisson için yaptığım gibi bu sorunu parametreleştirmenin bir yolu olmalı. Ek olarak, bu süreç binlerce fark süreci için eşzamanlı olarak gerçekleşir ve aynı "olay oranına" sahip değildir, bu parametreler için regresyon analizi tüm canlı işlemler için her yeni gözlemde yapılmalıdır. Bu mümkün değil. Sorularımı ve yorumlarımı okumak için zaman ayırdığınız için çok teşekkür ederiz, çok memnun
oldum

1
NB için poisson bağlayan açısından varsa dağılım değişkeni üzerinde gizlenmiş olan böylece ve . Bu, üzerine marjinal bir NB dağılımı . Bunu yardım etmek için kullanabilirsin. (Xt|λt,rt,gt)Pois(λtgt)(gt|rt)Gamma(rt,rt)E(gt)=1var(gt)=rt1gt
Olasılıksal

Bu harika bir yardım, ancak bunu biraz daha fazla çözebiliyor ve bazı açık ayrıntılar sağlayabiliyor musunuz? Zaman ayırdığınız için çok teşekkürler ...
MoonKnight

1
Negatif binom yerine binom kullanmaktan ne haber? Bunu yapmak daha kolay olabilir. Anscombe FJ. Poisson, binom ve negatif-binom verilerinin dönüşümü. Biometrika. 1948; 35: 246-54.
Carl

Yanıtlar:


1

Negatif binom dağılımı, binom olasılık modeline çok benzer. Aşağıdaki varsayımlar (koşullar) iyi tutulduğunda uygulanabilir. 1) Sabit sayıda başarıya kadar herhangi bir deney yapılır, örneğin C elde edilir, 2) Her deneyin sonucu iki kategoriden birine ayrılabilir , başarı ya da başarısızlık 3) Başarı olasılığı P her deney için aynıdır 40 Her bir deney diğerlerinden bağımsızdır. İlk koşul, binom ve negatif binom arasındaki tek önemli fark faktörüdür.


0

Poisson dağılımı 1) gibi belirli şartlar altında binomun makul bir yaklaşımı olabilir. Her deneme için başarı olasılığı çok düşüktür. P -> 0 2) np = m (diyelim) sonlu İstatistikçiler tarafından en çok kullanılan kural, poisson'un, n'nin 20'ye eşit veya daha büyük olduğu ve p'nin 5'e eşit veya daha az olduğu, binomun iyi bir yaklaşımı olmasıdır. %

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.