Bir model yapıyorum ve coğrafi konumumun hedef değişkenimi tahmin etmede çok iyi olacağını düşünüyorum. Kullanıcılarımın her birinin posta kodunu aldım. Yine de, modelimde posta kodunu tahmin özelliği olarak eklemenin en iyi yolu hakkında tam olarak emin değilim. Posta kodu bir sayı olmasına rağmen, sayı yukarı ya da aşağı giderse bir anlamı yoktur. Tüm 30.000 posta kodunu ikilileştirebilir ve sonra bunları özellikler veya yeni sütunlar olarak ekleyebilirim (örneğin, {kullanıcı_1: {61822: 1, 62118: 0, 62444: 0, vb.}}. Ancak, bu bir ton ekleyecek gibi görünüyor. benim modelime özellikleri.
Bu durumu ele almanın en iyi yolu hakkında bir fikriniz var mı?