1 milyon etiketli belgeden oluşan bir grupta metin sınıflandırması için scikit doğrusal destek vektör makinesi (SVM) sınıflandırıcısı kullanmayı planlıyorum. Ne yapmayı planlıyorum, bir kullanıcı bazı anahtar kelime girdiğinde, sınıflandırıcı ilk önce bir kategoride sınıflandıracak ve daha sonra bu kategori kategorisinin belgelerinde sonraki bilgi alma sorgusu gerçekleşecektir. Bir kaç sorum var:
- Sınıflandırmanın fazla zaman almayacağını nasıl doğrularım? Kullanıcıların daha iyi sonuçlar almak için bir sınıflandırmanın bitmesini beklemek zorunda kalmasını istemiyorum.
- Python'un scikit kütüphanesini web siteleri / web uygulamaları için kullanmak bunun için uygun mu?
- Amazon veya flipkart'ın kullanıcı sorgularında nasıl sınıflandırma yaptığını bilen var mı, yoksa tamamen farklı bir mantık kullanıyorlar mı?