Kesikli aralık kapsamı nasıl hesaplanır?
Ne yapacağımı bildiğim:
Sürekli bir modelim olsaydı, tahmin edilen değerlerimin her biri için% 95'lik bir güven aralığı tanımlayabilirim ve sonra gerçek değerlerin güven aralığında ne sıklıkta olduğunu görebilirim. Zamanın sadece% 88'inin% 95 güven aralığımın gerçek değerleri kapsadığını görebilirim.
Nasıl yapılacağını bilmiyorum:
Bunu poisson veya gamma-poisson gibi ayrı bir model için nasıl yapabilirim? Bu model için sahip olduğum şey tek bir gözlem alarak (100.000'den fazla oluşturmayı planlıyorum :)
Gözlem #: (keyfi)
Tahmini değer: 1.5
Öngörülen olasılık 0: .223
Tahmin edilen 1: .335 olasılığı
Öngörülen olasılık 2: .251
Tahmin edilen 3: .126 olasılığı
Tahmini 4: .048 olasılığı
Öngörülen olasılık 5: .014 [ve 5 veya daha fazla .019]
...(vb)
Tahmin edilen 100 olasılık (veya başka türlü gerçekçi olmayan bir rakam): .000
Gerçek değer ("4" gibi bir tam sayı)
Yukarıda poisson değerleri verirken, gerçek modelde, tahmin edilen 1.5 değerinin, gözlemler arasında farklı tahmini 0,1, ... 100 olasılıklarına sahip olabileceğini unutmayın.
Değerlerin gizliliğiyle kafam karıştı. Bir "5",% 95 aralığının dışındadır, çünkü 5 ve üzeri için yalnızca .019 vardır, bu da .025'ten daha azdır. Ancak 4'lerin birçoğu olacak - ayrı ayrı içerideler, ancak 4'lerin sayısını nasıl daha uygun bir şekilde değerlendirebilirim?
Neden umursayayım?
Baktığım modeller, toplam düzeyde doğru olduğu ancak zayıf bireysel tahminler verdiği için eleştirildi. Zayıf bireysel tahminlerin, modelin öngördüğü doğal olarak geniş güven aralıklarından ne kadar kötü olduğunu görmek istiyorum. Ampirik kapsamın daha kötü olmasını bekliyorum (örneğin, değerlerin% 88'inin% 95 güven aralığında olduğunu düşünüyorum), ama umarım biraz daha kötüdür.