Ben bir ikili sınıf özniteliği olan bir veri kümesi var. Sınıf +1 (kanser pozitif) ile 623 vaka ve sınıf -1 (kanser negatif) ile 101.671 vaka vardır.
Çeşitli algoritmalar denedim (Naif Bayes, Random Forest, AODE, C4.5) ve hepsinin kabul edilemez yanlış negatif oranları var. Random Forest, en yüksek genel tahmin doğruluğuna (% 99.5) ve en düşük yanlış negatif orana sahiptir, ancak yine de pozitif sınıfların% 79'unu kaçırır (yani, malign tümörlerin% 79'unu tespit edemez).
Bu durumu nasıl iyileştirebileceğim konusunda bir fikrin var mı?
Teşekkürler!