Çok seyrek verilerle iyi çalışan bir R rasgele orman uygulaması var mı? Binlerce veya milyonlarca boole girdi değişkenine sahibim, ancak verilen herhangi bir örnek için yalnızca yüzlerce kadar TRUE olacaktır.
R'ye nispeten yeniyim ve seyrek verilerle ilgilenmek için bir 'Matrix' paketi olduğunu fark ettim, ancak standart 'randomForest' paketi bu veri türünü tanımıyor gibi görünüyor. Önemli ise, girdi verileri R dışında üretilecek ve ithal edilecektir.
Herhangi bir tavsiye? Ayrıca Weka, Mahout veya diğer paketleri de kullanabilirim.