Basit bir sınıflandırmada iki sınıfımız vardır: sınıf-0 ve sınıf-1. Bazı verilerde yalnızca sınıf-1 için değerler var, bu nedenle sınıf-0 için hiçbiri yok. Şimdi sınıf-1'in verilerini modellemek için bir model yapmayı düşünüyorum. Dolayısıyla, yeni veriler geldiğinde, bu model yeni verilere uygulanır ve yeni verilerin bu modele ne kadar uygun olduğunu belirten bir olasılık bulur. Sonra bir eşik ile karşılaştırıldığında, uygunsuz verileri filtreleyebilirim.
Sorularım:
- Bu tür sorunlarla çalışmak için iyi bir yol var mı?
- Bu durumda bir RandomForest sınıflandırıcısı kullanılabilir mi? Sınıflandırıcının gürültü olarak değerlendirdiğini umduğum sınıf 0 için yapay veriler eklemem gerekir mi?
- Başka bir fikir bu soruna yardımcı olabilir mi?