Yani, yaklaşık 60 x 1000 matrisim var. 1000 özellikli 60 nesne olarak bakıyorum; 60 nesne 3 sınıfa ayrılır (a, b, c). Her sınıfta 20 nesne ve gerçek sınıflandırmayı biliyoruz. Bu 60 eğitim örneği seti üzerinde denetimli öğrenme yapmak istiyorum ve hem sınıflandırıcı doğruluğu (ve ilgili metrikler) hem de 1000 özellikte özellik seçimi ile ilgileniyorum.
İlk olarak, isimlendirmem nasıl?
Şimdi asıl soru:
Belirtildiği gibi rasgele ormanlar veya başka sınıflandırıcılar atabilirim. Ama bir incelik var - gerçekten sadece c sınıfı a ve b sınıflarından ayırmayı önemsiyorum. Sınıf a ve b'yi havuzlayabilirim, ancak tüm c olmayan nesnelerin muhtemelen iki farklı küme oluşturduğu a priori bilgisini kullanmanın iyi bir yolu var mı? Benimkine benzer veriler üzerinde etkili olduğu gösterildiğinden rastgele ormanlar veya bunların bir varyantını kullanmayı tercih ederim. Ancak başka yaklaşımları denemeye ikna edilebilirim.