Sorun
Suç verileri etiketli bir veri kümesi üzerinde Naive bayes kullanmayı denedim ama gerçekten kötü sonuçlar (% 7 doğruluk) var. Naive Bayes kullandığım diğer alogoritmalardan çok daha hızlı çalışıyor, bu yüzden skorun neden bu kadar düşük olduğunu bulmak istedim.
Araştırma
Okuduktan sonra daha yüksek frekanslı sınıflar için bir önyargıya sahip olduğu için Naif bayların dengeli veri kümeleriyle kullanılması gerektiğini buldum. Verilerim dengesiz olduğundan, özellikle veri eğrileriyle uğraşmak için yapıldığı için Tamamlayıcı Naif Bayes'i kullanmayı denemek istedim. Süreci açıklayan makalede, uygulama metin sınıflandırması içindir, ancak tekniğin diğer durumlarda neden işe yaramadığını anlamıyorum. Bahsettiğim kağıdı burada bulabilirsiniz . Kısacası fikir, bir sınıfın görünmediği olaylara dayalı olarak ağırlıkları kullanmaktır.
Biraz araştırma yaptıktan sonra Java'da bir uygulama bulabildim ama ne yazık ki Java bilmiyorum ve algoritmayı kendimi uygulayacak kadar iyi anlamıyorum.
Soru
python'da bir uygulamayı nerede bulabilirim? Eğer bu yoksa, kendim uygulamaya nasıl devam etmeliyim?