Kestirimci olan seyrek özelliklerim var, ayrıca kestirimci olan bazı yoğun özelliklere de sahibim. Sınıflandırıcının genel performansını artırmak için bu özellikleri bir araya getirmem gerekiyor.
Şimdi, bunları bir araya getirmeye çalıştığımda, yoğun özellikler seyrek özelliklere daha fazla hakim olma eğilimindedir, bu nedenle AUC'de sadece yoğun özelliklere sahip modele kıyasla sadece% 1 iyileşme sağlar.
Birisi benzer sorunlarla karşılaştı mı? Girişleri gerçekten takdir ediyorum, sıkışmış bir tür. Zaten farklı sınıflandırıcılar, sınıflandırıcılar kombinasyonu, özellik dönüşümleri ve farklı algoritmalar ile işleme denedim.
Yardımınız için şimdiden teşekkür ederiz.
Düzenle :
Yorumlarda verilen önerileri zaten denedim. Gözlemlediğim şey, verilerin neredeyse% 45'i için, seyrek özellikler gerçekten iyi performans gösteriyor, sadece seyrek özelliklerle 0.9 civarında AUC elde ediyorum, ancak geri kalanlar için yoğun özellikler 0.75 civarında AUC ile iyi performans gösteriyor. Bu veri kümelerini ayırmayı denedim, ancak 0.6 AUC elde ediyorum, bu yüzden sadece bir model geliştiremiyorum ve hangi özelliklerin kullanılacağına karar veremiyorum.
Kod pasajı ile ilgili olarak, çok şey denedim, tam olarak ne paylaşacağımdan emin değilim :(