Hem kategorik hem de sayısal verilerle bir sınıflandırma problemim var. Karşılaştığım sorun, kategorik verilerimin sabit olmaması, yani etiketini tahmin etmek istediğim yeni adayın önceden gözlemlenmeyen yeni bir kategoriye sahip olabileceği anlamına geliyor.
Örneğin, kategorik verilerim sex
olsaydı female
, mümkün olan tek etiket male
ve other
ne olursa olsun olurdu . Ancak, kategorik değişkenim, city
tahmin etmeye çalıştığım kişinin sınıflandırıcısının hiç görmediği yeni bir şehre sahip olması olabilir.
Sınıflandırmayı bu terimlerle yapmanın bir yolu olup olmadığını veya bu yeni kategorik verileri dikkate alarak eğitimi tekrar yapmam gerekip gerekmediğini merak ediyorum.
city
bazı fonksiyonlara dayalı bir sayıya dönüştürebilir misiniz? Gibicity' = f(latitude, longitude)
bu şekilde, herhangi bir şehir için yeni bir değer oluşturabilir