Dengesiz veri seti tüm alanlarda yaygın bir konudur ve özellikle bilgisayarla görme ve Evrişimli Sinir Ağları (CNN) tarafından ele alınan problemlerle ilgili değildir.
Bu sorunu çözmek için, azınlık sınıflarını fazla örnekleyerek veya az örnekleme çoğunluk sınıflarını (veya her ikisini) kullanarak veri kümenizi dengelemeye çalışmalısınız. Tartışmalı olarak, yukarıda belirtildiği gibi SMOTE (Sentetik Azınlık Aşırı Örnekleme Tekniği) algoritması iyi bir seçim olacaktır. Burada farklı aşırı örnekleme algoritmalarının bir karşılaştırmasını bulabilirsiniz. Bir Python kullanıcısıysanız, dengesiz öğrenme , veri kümelerini dengelemek için birçok yararlı teknik uygulayan güzel bir kütüphanedir.
Öte yandan, görüntüleri sınıflandırmaya çalışıyorsanız, veri kümesi boyutunuzu artırmanın güzel bir yolu onu büyütmektir (örneğin, benzer görüntüler, ancak orijinal görüntülere göre döndürülmüş / kaydırılmış küçük bit gibi makul sentetik örnekler oluşturarak). Bazen daha iyi bir denge elde etmek için azınlık sınıflarını güçlendirmeyi faydalı bulabilirsiniz. Keras ImageDataGenerator sınıfı bu amaç için iyi bir araçtır.