Kullanabileceğiniz sayım verileri için birkaç uygun ve kesinlikle uygun puanlama kuralı vardır. Puanlama kuralları cezalar ile sunulan prediktif dağılımı ve olmak gözlenen değer. Öncelikle, gerçek olasılıklara daha yakın olan bir tahminin daima daha az ceza alacağı ve (benzersiz) en iyi tahminin olacağı ve öngörülen olasılığın gerçek olasılık ile çakıştığı zaman olduğu düşünülen birçok arzu edilen özelliğe sahiptir. Böylece beklentisini en aza indirgemek, gerçek olasılıkları bildirmek anlamına gelir. Ayrıca bakınız Vikipedi .P y s ( y , P )s ( y, P)Pys ( y, P)
Genellikle, tahmin edilen değerlerin üzerinde olanların ortalaması,
S= 1nΣni = 1s ( y( i ), P( i ))
Hangi kuralın uygulanacağı hedefinize bağlıdır, ancak her biri kullanım için uygun olduğunda kaba bir karakterizasyon vereceğim.
Bundan sonra, yordayıcı olasılık kütle fonksiyonu ve yordayıcı kümülatif dağılım fonksiyonu için kullanın . Bir , sayım dağılımının tüm desteğini (örneğin, ) geçer. bir gösterge işlevi belirtmektedir. ve , tahmine dayalı dağılımın ortalama ve standart sapmasıdır (genellikle sayı veri modellerinde doğrudan tahmin edilen miktarlardır). Pr ( Y = y ) I μ σf( y)Pr ( Y= y)∑ k 0 , 1 , … , ∞F( y)Σk0 , 1 , … , ∞benμσ
Kesinlikle uygun puanlama kuralları
- Brier Score : (kategorik tahminlerde boyut dengesizliği için kararlı)s ( y, P) = - 2 f( y) + ∑kf2( k )
- Dawid-Sebastiani skoru : (genel prediktif model seçimi için iyi; kategorik prediktörlerde boyut dengesizliği için kararlı)s ( y, P) = ( y- μσ)2+ 2 logσ
- Sapma skoru : ( , sadece bağlı bir normalleştirme terimidir, Poisson modellerinde genellikle doymuş sapma olarak alınır; bir ML çerçevesi)g y ys ( y, P) = - 2 günlükf( y) + gygyy
- Logaritmik puan : (çok kolay hesaplanır; kategorik yordayıcılarda boyut dengesizliği için kararlı)s ( y, P) = - günlükf( y)
- olasılık skoru : (çok yüksek sayıların farklı tahminlerini zıt ; kategorik tahminlerde boyut dengesizliğine duyarlıdır)s ( y, P) = ∑k{ F( k ) - Ben( y≤ k ) }2
- Küresel puan : (kategorik yordayıcılarda boyut dengesizliği için kararlı)s ( y, P) = f( y)Σkf2( k )√
Diğer puanlama kuralları (çok uygun değil ancak sık kullanılan)
- Mutlak hata puanı :(uygun değil)s ( y, P) = | y- μ |
- Kare hata skoru : (kesinlikle uygun değil; aykırı değerlere duyarlı; kategorik yordayıcılarda boyut dengesizliğine duyarlı)s ( y, P) = ( y- μ )2
- Pearson normalleştirilmiş kare hata skoru : (kesinlikle uygun değil; aykırı değerlere duyarlı; model puanının ortalama puan olup olmadığını kontrol etmek için kullanılabilir. 1'den çok farklıdır; kategorik yordayıcılarda boyut dengesizliği için kararlıdır.s ( y, P) = ( y- μσ)2
Kesinlikle uygun kurallar için örnek R kodu:
library(vcdExtra)
m1 <- glm(Freq ~ mental, family=poisson, data=Mental)
# scores for the first observation
mu <- predict(m1, type="response")[1]
x <- Mental$Freq[1]
# logarithmic (equivalent to deviance score up to a constant)
-log(dpois(x, lambda=mu))
# quadratic (brier)
-2*dpois(x,lambda=mu) + sapply(mu, function(x){ sum(dpois(1:1000,lambda=x)^2) })
# spherical
- dpois(x,mu) / sqrt(sapply(mu, function(x){ sum(dpois(1:1000,lambda=x)^2) }))
# ranked probability score
sum(ppois((-1):(x-1), mu)^2) + sum((ppois(x:10000,mu)-1)^2)
# Dawid Sebastiani
(x-mu)^2/mu + log(mu)