Ben onları denemek düşündüm bu yüzden vb MNIST, cifar, STL-10, Rastgele Ormanları uygulanması ile ilgili herhangi literatürü bulamadı permütasyon değişmeyen MNIST kendim.
İçinde R , I güvenilir:
randomForest(train$x, factor(train$y), test$x, factor(test$y), ntree=500)
Bu 2 saat sürdü ve% 2.8 test hatası aldı.
Ben de denedim scikit-öğrenme ile,
RandomForestClassifier(n_estimators=2000,
max_features="auto",
max_depth=None)
70 dakika sonra,% 2.9 test hatası aldım, ancak bunun yerine n_estimators = 200 ile, sadece 7 dakika sonra% 2.8 test hatası aldım.
OpenCV ile denedim
rf.train(images.reshape(-1, 28**2),
cv2.CV_ROW_SAMPLE,
labels.astype('int'))
Bu 6,5 dakika sürdü ve rf
tahmin için kullanmak % 15'lik bir test hatası verdi. Rastgele Ormanlar için Python bağları params
, en azından 2.3.1 sürümünde argümanı görmezden geldiği için kaç tane ağaç yetiştirdiğini bilmiyorum . Değiştirilmesi, çünkü benim şüphelerim var - Ben de bir sınıflandırma sorunu çözmek istiyorum oldukça regresyon yerine, OpenCV için temizlemek nasıl çözemedim astype('int')
ile astype('float32')
aynı sonucu verir.
Olarak sinir ağları için bir permütasyon değişmeyen eğitim muhtemelen bir CPU üzerinde 2 saatten fazla sürer, ancak MNIST kriter, tekniğin durumu,% 0.8 Test hatasıdır.
Rastgele Ormanlar kullanarak MNIST'de% 2.8 test hatasından daha iyisini yapmak mümkün mü? Genel fikir birliğinin Rastgele Ormanların genellikle en az% 1,4 test hatası alabileceğine inandığım çekirdek SVM'leri kadar iyi olduğunu düşündüm.