Şu anda Scikit aşağıdaki kodu ile öğrenmek kullanıyorum:
clf = svm.SVC(C=1.0, tol=1e-10, cache_size=600, kernel='rbf', gamma=0.0,
class_weight='auto')
ve sonra 7 farklı etikete sahip bir veri seti için uygunluk ve tahmin yapın. Tuhaf bir çıktı aldım. Doğrulama setinde öngörülen etiketi hangi çapraz doğrulama tekniğini kullanırsam kullanalım, daima etiket 7 olacaktır.
Tam varsayılan bir ( svm.SVC()
) dahil olmak üzere diğer bazı parametreleri deniyorum ama kullandığım çekirdek yöntemi rbf
yerine olduğu gibi poly
ya linear
da gerçekten işe yaramazken poly
ve gerçekten işe yaramazsa linear
.
Ayrıca, doğrulama verileri yerine tren verisi üzerinde önceden tahmin yaptım ve mükemmel bir şekilde uyuyor.
Bu tür bir sorunu daha önce gören ve burada neler olduğunu bilen var mı?
Sınıf dağılımımı asla ayrıntılı olarak görmüyorum ama% 30 civarında olması gerektiğini biliyorum 7,% 14'ü 4.
Manuel 1'e karşı dinlenme uygulamasını bile deniyorum ve hala yardımcı olmuyor.