Diyelim ki bir sınıflandırma problemi için birkaç satırım var:
Nerede özellikler / öngörücüler ve satırın özellik kombinasyonunun ait olduğu sınıftır.
Birçok özellik kombinasyonu ve sınıfları bir sınıflandırıcı sığdırmak için kullandığım veri kümesinde tekrarlanır. Ben sadece (temelde bir group by X1 ... XN Y
SQL gerçekleştirmek) kopyalarını kaldırmak için kabul edilebilir olup olmadığını merak ediyorum ? Teşekkürler.
Not:
Bu, yalnızca sınıf önceliklerinin oldukça çarpık olduğu ikili bir varlık veri kümesi içindir