Sigorta riski tahmin modelini geliştirmek için çalışıyorum. Bu modeller, havayolu no-show tahmini, donanım arıza tespiti, vb. Gibi "nadir olaylara" sahiptir. Veri setimi hazırlarken sınıflandırmayı uygulamaya çalıştım, ancak negatif vakaların yüksek oranı nedeniyle yararlı sınıflandırıcılar alamadım .
Bir lise istatistik dersinin ötesinde istatistik ve modelleme verileri konusunda çok fazla deneyimim yok, bu yüzden biraz kafam karıştı.
İlk düşünce olarak, homojen olmayan bir Poisson süreç modeli kullanmayı düşünüyorum. Belirli bir günde, belirli bir günde, belirli bir günde bir risk olasılığının iyi bir tahminini almak için olay verilerine (tarih, lat, lon) göre sınıflandırdım.
Bilmek istiyorum, nadir olayları tahmin etmek için yöntemler / algoritmalar nelerdir?
Bu sorunu çözmek için bir yaklaşım olarak ne öneriyorsunuz?