Nadir olayları nasıl tahmin edebiliriz?


11

Sigorta riski tahmin modelini geliştirmek için çalışıyorum. Bu modeller, havayolu no-show tahmini, donanım arıza tespiti, vb. Gibi "nadir olaylara" sahiptir. Veri setimi hazırlarken sınıflandırmayı uygulamaya çalıştım, ancak negatif vakaların yüksek oranı nedeniyle yararlı sınıflandırıcılar alamadım .

Bir lise istatistik dersinin ötesinde istatistik ve modelleme verileri konusunda çok fazla deneyimim yok, bu yüzden biraz kafam karıştı.

İlk düşünce olarak, homojen olmayan bir Poisson süreç modeli kullanmayı düşünüyorum. Belirli bir günde, belirli bir günde, belirli bir günde bir risk olasılığının iyi bir tahminini almak için olay verilerine (tarih, lat, lon) göre sınıflandırdım.

Bilmek istiyorum, nadir olayları tahmin etmek için yöntemler / algoritmalar nelerdir?
Bu sorunu çözmek için bir yaklaşım olarak ne öneriyorsunuz?

Yanıtlar:


9

Standart yaklaşım " aşırı değer teorisi " dir, Stuart Coles tarafından konuyla ilgili mükemmel bir kitap vardır (her ne kadar mevcut fiyat oldukça, her ne kadar yanlış olsa da).

Sınıflandırma veya regresyon yöntemlerini kullanarak iyi sonuçlar elde etme olasılığınızın düşük olmasının nedeni, bu yöntemlerin tipik olarak verilerin koşullu ortalamasını tahmin etmeye bağlı olmasıdır ve aşırı olaylara genellikle hepsi aynı yönde hizalanan "rastgele" faktörlerin birleşmesinden kaynaklanır, bu nedenle, koşullu ortalamadan uzun bir yol olan makul sonuçların dağılımının kuyruklarındalar. Yapabileceğiniz şey, sadece ortalamadan ziyade tüm koşullu dağılımı tahmin etmek ve dağıtımın kuyruğunu bir eşiğin üzerine entegre ederek aşırı bir olayın olasılığı hakkında bilgi almaktır. Ağır yağışların istatistiksel olarak küçültülmesine yönelik bir uygulamada bunun işe yaradığını gördüm .


1
Bu teorinin python üzerinde bir uygulaması var mı?
user3378649

Maalesef Python'da programlamam (henüz) bu yüzden orada yardım edemem.
Dikran Marsupial

yx1,,xny>Y0P(y>Y0|x1,,xn)E(y|x1,,xn)y>Y0P(y>Y0|x1,,xn)

Evet, bunu yapabilirsiniz, ancak en aza indirdiğiniz maliyet fonksiyonu, dağıtımın kuyruklarını almaya odaklanmaz, bu yüzden ilgilendiğiniz şey varsa, kuyruklardaki olayları daha açık bir şekilde modellemek daha iyidir. .
Dikran Marsupial
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.