Ben dengesiz veri SVMs ile bir tahmin modeli oluşturmak için çalışıyorum. Etiketlerim / çıktımın pozitif, nötr ve negatif olmak üzere üç sınıfı var. Olumlu örneğin verilerimin yaklaşık% 10-20'sini, nötr yaklaşık% 50-60'ını ve negatif yaklaşık% 30-40'ını oluşturduğunu söyleyebilirim. Sınıflar arasında yanlış tahminlerle ilişkili maliyet aynı olmadığı için sınıfları dengelemeye çalışıyorum. Bir yöntem, eğitim verilerini yeniden örneklemek ve orijinalinden daha büyük olan eşit olarak dengeli bir veri kümesi oluşturmaktı. İlginç bir şekilde, bunu yaptığımda, diğer sınıf için daha iyi tahminler almaya eğilimliyim (örneğin verileri dengelediğimde, pozitif sınıf için örnek sayısını arttırdım, ancak örnek tahminlerden negatif sınıf daha iyi oldu). Herkes bunun neden olduğunu genel olarak açıklayabilir mi? Negatif sınıf için örnek sayısını arttırırsam, örnek tahminlerden (örn. Daha iyi tahminler) pozitif sınıf için benzer bir şey alır mıyım?
Ayrıca, farklı sınıflandırmalara farklı maliyetler yükleyerek veya LibSVM'deki sınıf ağırlıklarını kullanarak (dengesizleri nasıl doğru şekilde seçeceğimi / ayarlayacağımı bilmiyorum) dengesiz verileri nasıl ele alabileceğime dair diğer düşüncelere çok açık.