Dengesiz bir test veri setim var. Pozitif grup 100 vakadan, negatif grup 1500 vakadan oluşur. Antrenman tarafında ise daha büyük bir aday havuzum var: Pozitif antrenman setinin 1200 vakası ve negatif antrenman setinin 12000 vakası var. Bu tür bir senaryo için birkaç seçeneğim var:
1) Tüm eğitim seti için ağırlıklı SVM kullanma (P: 1200, N: 12000)
2) Örneklenen eğitim setini (P: 1200, N: 1200) temel alan SVM kullanarak, 1200 negatif vaka 12000 vakadan örneklenir.
Hangi yaklaşımın daha iyi olduğuna karar vermek için herhangi bir teorik rehberlik var mı? Test veri seti oldukça dengesiz olduğundan, dengesiz eğitim setini de kullanmalı mıyım?