2
Kümeleme sorunları için özellik seçimi
Denetimsiz algoritmalar (kümeleme) kullanarak grup birlikte farklı veri kümeleri yapmaya çalışıyorum. Sorun, birçok özelliğim (~ 500) ve az miktarda vaka (200-300) olmasıdır. Şimdiye kadar sadece verileri eğitim setleri olarak etiketlediğim sınıflandırma problemleri yapıyordum. Orada, özelliklerin önceden seçilmesi için bazı kriterler (yani random.forest.importance veya information.gain) kullandım ve daha sonra ilgili özellikleri …