Makine Öğrenimi deneylerimi yapmak için Python kütüphanelerini kullanmayı düşünüyorum. Şimdiye kadar WEKA'ya güveniyordum, ama genel olarak oldukça memnun kaldım. Bunun temel nedeni WEKA'nın o kadar iyi desteklenmediğini tespit etmem (çok az örnek, dokümantasyon seyrek ve topluluk desteği benim deneyimimden daha az isteniyor) ve kendimi yapışkan durumlarda kendime yardım etmeden bulmam. Bu hareketi düşündüğüm bir başka neden de Python'u (Python'da yeniyim) gerçekten sevmem ve Java'daki kodlamaya geri dönmek istememem.
Öyleyse sorum şu, dahası ne?
- kapsamlı
- ölçeklenebilir (100k özellikler, 10k örnekler) ve
- Python'da ML yapmak için iyi desteklenmiş kütüphaneler var mı?
Özellikle metin sınıflandırma yapmakla ilgileniyorum ve bu yüzden iyi bir sınıflandırıcı koleksiyonuna, özellik seçim yöntemlerine (Bilgi Kazancı, Chi-Sqaured vb.) Ve metin ön işleme özelliklerine (kaynak, kelime silme kaldırma) sahip bir kütüphaneyi kullanmak istiyorum. , tf-idf vb.).
Buradaki ve başka yerlerdeki geçmiş e-posta başlıklarına göre, şu ana kadar PyML, scikits-learn ve Orange'a bakıyorum. İnsanların deneyimleri, bahsettiğim yukarıdaki 3 metrikle ilgili nasıl olmuştur?
Başka bir önerin var mı?