Lojistik regresyon , SVM , karar ağaçları , torbalama ve benzeri pek çok başka soru kullanırken dengesiz veriler hakkında çoktan sorularımız vardı , bu da onu çok popüler bir konu haline getirdi! Maalesef, soruların her biri algoritmaya özgü görünüyor ve dengesiz verilerle ilgilenmek için genel bir kılavuz bulamadım.
Dengesiz verilerle ilgilenen Marc Claesen tarafından verilen cevaplardan birinden alıntı
(...) büyük ölçüde öğrenme yöntemine bağlıdır. Çoğu genel amaçlı yaklaşım, bununla baş etmenin bir (veya birkaç) yoluna sahiptir.
Ancak dengesiz veriler hakkında tam olarak ne zaman endişelenmeliyiz? Hangi algoritmalar daha çok etkilenir ve hangileri ile başa çıkabilir? Verileri dengelemek için hangi algoritmalara ihtiyacımız var? Algoritmaların her birini tartışmanın bunun gibi bir soru-cevap sitesinde imkansız olacağının farkındayım, bunun ne zaman sorun olacağı konusunda genel bir rehber arıyorum.