Veri kümemde Destek Vektör Makineleri'ni (SVM'ler) kullanmayı denemek istiyorum. Sorunu denemeden önce, SVM'lerin son derece dengesiz veriler üzerinde iyi performans göstermedikleri konusunda uyarıldım. Benim durumumda,% 95-98 0 ve% 2-5 1'e kadar sahip olabilirim.
Seyrek / dengesiz verilerde SVM'lerin kullanımı hakkında konuşulan kaynakları bulmaya çalıştım, ancak bulabildiğim tek şey 'seyrekSVM'ler' (az miktarda destek vektörü kullanan) idi.
Birisinin kısaca açıklayabileceğini umuyordum:
- SVM'nin böyle bir veri kümesiyle ne kadar iyi olması bekleniyor?
- Hangi varsa, SVM algoritmasında değişiklikler yapılması gerekir
- Hangi kaynaklar / makaleler bunu tartışıyor