Veri kümeniz hakkında ve veri kümenizin özellik vektörünüze ne kadar ayrılabilir olduğunu bilmeden söylemek zor, ancak muhtemelen nispeten küçük örnek kümeniz nedeniyle standart rastgele ormanlar üzerinde aşırı rasgele orman kullanmanızı öneririm.
Aşırı rasgele ormanlar, standart rasgele ormanlara oldukça benzerdir, tek istisna, ağaçlardaki bölünmeleri optimize etmek yerine, aşırı rasgele ormanın bölünmeleri rastgele hale getirmesidir. Başlangıçta bu bir negatif gibi görünecektir, ancak genellikle eğitim setinizdeki AUC'nin biraz daha kötü olmasına rağmen, genel olarak önemli ölçüde daha iyi genelleme ve hıza sahip olduğunuz anlamına gelir.
Lojistik regresyon da bu tür görevler için oldukça sağlam bir bahistir, ancak nispeten düşük boyutluluğunuz ve küçük örneklem büyüklüğünüzle aşırı sığdırma konusunda endişelenirim. K-En Yakın Komşularını kullanarak kontrol etmek isteyebilirsiniz, çünkü genellikle düşük boyutlarla çok isteklidir, ancak genellikle kategorik değişkenleri çok iyi idare etmez.
Sorun hakkında daha fazla bilgi sahibi olmadan bir tane seçmek zorunda kalsaydım, bahislerimi kesinlikle rastgele ormana koyardım, çünkü bu tür veri kümesinde iyi bir genelleme yapma olasılığı çok yüksektir ve aynı zamanda sayısal ve kategorik verilerin bir karışımını daha iyi işler. diğer yöntemlerden daha fazladır.