bir süre zarfında T zamanında birden fazla kez gerçekleşmeyebilecek rastgele bir sürecimiz var T. 0 \ leq t <T döneminde meydana gelen bir dizi olay olasılığını sağlayan, bu sürecin önceden var olan bir modelinden gelen bir veri beslemesine sahibiz 0≤t<T. Bu mevcut model eski ve tahmin hataları için feed-data üzerinde canlı kontroller yapmamız gerekiyor. Veri-besleme (olasılığını sağlayan edildiği üretim eski model n zaman kalan meydana gelen olaylar t ) yaklaşık Poisson dağıtılır.
Yani anomaliler / hatalarını kontrol etmek, biz izin t kalan zaman ve Xt toplam etkinlik sayısı kalan süre içinde gerçekleşmesi olmak t . Eski model, \ P (X_t \ leq c) tahminlerini ifade eder P(Xt≤c). Bu nedenle, X_t \ sim \ operatorname {Poisson} (\ lambda_ {t}) varsayımına göre bizdeXt∼Poisson(λt) :
P(Xt≤c)=e−λ∑k=0cλktk!.
Olay oranımızı
λt eski modelin çıktısından türetmek için (gözlem
yt ), bir durum uzayı yaklaşımı kullanıyoruz ve durum ilişkisini şu şekilde
modelliyoruz :
yt=λt+εt(εt∼N(0,Ht)).
Filtrelenmiş durumu
E (\ lambda_t | Y_t) elde etmek için
\ lambda_t
evrimi için bir durum [sabit hız çürüme] modeli kullanarak eski modelden gözlemleri
λtfiltrelendiriyor ve tahmini olay frekansında bir anormallik / hatayı
E(λt|Yt) .
E (\ lambda_t | Y_t) <y_t ise, besleme verileri
E(λt|Yt)<yt.
Bu yaklaşım, tahmin edilen olaydaki hataların toplanmasında fevkalade iyi çalışır , T süresi boyunca sayılır T, ancak başka bir süre için de aynı şeyi yapmak istiyorsak, 0≤t<σ burada σ<23T . Bunu aşmak için, şimdi Negatif Binom dağılımını kullanmaya geçmek istediğimize karar verdik, böylece şimdi X_t \ sim NB (r, p) varsayıyoruz Xt∼NB(r,p)ve bizde:
P ( Xt≤ c ) = prΣk = 0c( 1 - p )k( k+r-1r - 1) ,
burada
\ lambda parametresi
λşimdi
r ve
p ile değiştirilir
p. Uygulaması basit olmalı, ancak yorumlama konusunda bazı zorluklar yaşıyorum ve bu nedenle size yardımcı olmak istediğim bazı sorular var:
1. Negatif binom dağılımında sadece p = \ lambda değerini ayarlayabilir miyiz p = λ? Değilse neden olmasın?
2. biz ayarlayabilirsiniz varsayarsak p=f( λ ) nerede f bazı fonksiyonudur, nasıl doğru ayarlanmış olabilir r (biz uygun gerekiyor r geçmiş veri kümelerini kullanarak)?
3. Is r Verilen bir süreçte gerçekleşmesini beklemek olayların sayısına bağlı?
r (ve p ) için tahminleri çıkarmaya yönelik ek :
Aslında bu sorunun tersine çevrilmiş olsaydı ve her işlem için olay sayımımız olsaydı, ve için maksimum olasılık tahmincisini benimseyebileceğimizin farkındayım . Elbette, maksimum olabilirlik tahmincisi yalnızca, örnek varyansının örneklem ortalamasından daha büyük olduğu örnekler için mevcuttur, ancak eğer bağımsız aynı dağılımlı gözlemler için olabilirlik işlevini ayarlayabiliriz as:
log-olabilirlik fonksiyonunu şöyle yazabiliriz:
s , N k 1 , k, 2 , ... , k , N , L ( R , s ) = , N tt i = 1 , P ( k i ; r , s ) ,rpN-k1,k2,…,kN
L(r,p)=∏i=1NP(ki;r,p),
l(r,p)=∑i=1Nln(Γ(ki+r))−∑i=1Nln(ki!)−Nln( Γ ( r ) ) +∑i =1N-kiln( p ) +Nrln(1−p).
Maksimum değeri bulmak için ve göre kısmi türevleri alıyoruz ve bunları sıfıra :
Ayar ve ayarı şunu buluruz:
s ∂ r l ( R , srp∂rl(R,s)=∂pl(R,s)=0p=∂rl(r,p)∂pl(r,p)=∑i=1Nψ(ki+r)−Nψ(r)+Nln(1−p),=∑i=1Nki1p−Nr11−p.
∂rl(r,p)=∂pl(r,p)=0∂rl(R,s)=, NΣi=1ψ(ki+r)-Nψ(r)+Nln(rp=∑i=1Nki(Nr+∑Ni=1ki),∂rl(r,p)=∑i=1Nψ(ki+r)−Nψ(r)+Nln(rr+∑Ni=1kiN-)=0.
Bu denklem Newton veya hatta EM kullanılarak kapalı formda r için çözülemez. Ancak, bu durumda durum böyle değil. Biz rağmen
olabilir statik almak için geçmiş verileri kullanmak ve bu gerçekten bizim süreci için herhangi kullanım değildir, biz Poisson kullanarak yokmuş gibi, zaman içinde bu parametreleri uyarlamak gerekir.
prp