Yaklaşık 20 sütun (20 özellik) olan ham veri var. Bunlardan on tanesi sürekli veridir ve 10 tanesi kategoriktir. Kategorik verilerin bazıları 50 farklı değere sahip olabilir (ABD Devletleri). Verileri önceden işledikten sonra 10 sürekli sütun 10 hazırlanmış sütun haline gelir ve 10 kategorik değer 200 tek etkin kodlanmış değişken gibi olur. Bu 200 + 10 = 210 özelliklerinin tümünü sinir ağına koyarsam, 200-sıcak özelliklerin (10 kategorik sütun) 10-sürekli özelliklere tamamen hakim olacağından endişe ediyorum.
Belki bir yöntem, sütunları bir arada "gruplandırmak" olabilir. Bu geçerli bir sorun mu ve bu sorunla başa çıkmanın standart bir yolu var mı?
(Çok önemli olduğunu düşünmeme rağmen Keras kullanıyorum.)