ML algoritmaları, örneğin Vowpal Wabbit veya tıklama oranı yarışmaları ( Kaggle ) kazanan faktorizasyon makinelerinden bazıları olduğunda, özelliklerin 'karma' olduğunu belirtin, bu model için gerçekten ne anlama geliyor? İnternet eklentisinin kimliğini temsil eden ve '236BG231' gibi değerleri alan bir değişken olduğunu varsayalım. Sonra bu özelliğin rasgele bir tamsayıya hash olduğunu anlıyorum. Ama sorum şu:
- Şimdi modelde tamsayı (sayısal) olarak kullanılan tamsayı VEYA
- karma değeri aslında hala bir kategorik değişken ve tek-sıcak kodlu gibi mi ele alınır? Yani karma hile sadece büyük veri ile bir şekilde yerden kazanmak için mi?