Biraz basitleştirmek gerekirse, yaklaşık on yıl süren bir sistemdeki insanların giriş ve çıkış zamanlarını kaydeden yaklaşık bir milyon kaydım var. Her kaydın bir giriş zamanı vardır, ancak her kaydın bir çıkış zamanı yoktur. Sistemdeki ortalama süre ~ 1 yıldır.
Eksik çıkış süreleri iki nedenden kaynaklanır:
- Kişi, verinin alındığı sırada sistemden ayrılmamıştır.
- Kişinin çıkış süresi kaydedilmedi. Bu, kayıtların% 50'sinin
İlgilenilen sorular:
- İnsanlar sistemde daha az zaman harcıyor ve ne kadar az zaman harcıyorlar.
- Daha fazla çıkış süresi kaydediliyor ve kaç tane kaydediliyor?
Bunu, bir çıkışın kaydedilme olasılığının zamanla doğrusal olarak değiştiğini ve sistemdeki zamanın parametreleri zamanla doğrusal olarak değişen bir Weibull'a sahip olduğunu söyleyerek modelleyebiliriz. Daha sonra çeşitli parametreler için maksimum bir olasılık tahmini yapabilir ve sonuçları göz küresi yapabilir ve bunları makul olarak kabul edebiliriz. Weibull dağılımını seçtik çünkü yaşam ömrünü ölçmede kullanılıyor gibi görünüyor ve verilerin bir gama dağılımından daha iyi uydurulmasının aksine söylemek eğlenceli.
Bunun nasıl doğru bir şekilde yapılacağına dair bir ipucu almak için nereye bakmalıyım? Matematiksel olarak anlayışlıyız, ancak istatistiksel olarak çok anlayışlı değiliz.