Merhaba 1600 kategoriler üzerinde büyük kategorik değerlere sahip veri çerçevesi var Ben 1600 sütunları yok böylece alternatifleri bulabilirsiniz herhangi bir yolu yoktur.
Bunu aşağıda ilginç bir bağlantı buldum http://amunategui.github.io/feature-hashing/#sourcecode
Ama istemediğim sınıfa / nesneye dönüşüyorlar. Nihai çıktımı bir veri çerçevesi olarak istiyorum, böylece farklı makine öğrenme modelleri ile test yapabilir miyim? veya Lojistik regresyon veya XGBoost dışındaki diğer makine öğrenimi modellerini eğitmek için üretilen matrisi kullanabilmemin bir yolu var mı?
Yine de uygulayabileceğim var mı?