Scikit'te çok etiketli sınıflandırma metrikleri
Scikit kullanarak mevcut belgelere konu atamak için çok etiketli bir sınıflandırıcı oluşturmaya çalışıyorum Belgelerimi TfidfVectorizeretiketlerden geçirerek işliyorum ve tahmincisi olarak MultiLabelBinarizera OneVsRestClassifierile oluşturdum SGDClassifier. Ancak sınıflandırıcımı test ederken, sadece okuduğumdan benzer problemler için oldukça düşük olan .29'a kadar puan alıyorum. TfidfVectorizer üzerinde stopwords, unigrams, stemming gibi çok sayıda seçenek denedim …