Doğrusal regresyon kullanarak bir müşterinin günlüğünü (harcamasını) öngören bir sorun düşünüyorum.
Hangi özellikleri girdi olarak kullanacağımı düşünüyor ve değişkenin yüzdelik değerini girdi olarak kullanmanın uygun olup olmadığını merak ediyorum.
Mesela şirketlerin gelirini girdi olarak kullanabilirim. Merak ettiğim şey bunun yerine şirketin gelir yüzdelik dilimini kullanıp kullanamayacağım.
Başka bir örnek kategorik bir endüstri sınıflandırıcı (NAICS) olacaktır - eğer NAICS kodu başına medyan harcamaya bakacak ve daha sonra her NAICS kodunu bir 'NAICS Yüzdelik' e atayacak olsaydım, kullanabileceğim geçerli bir açıklayıcı değişken olurdu?
Yüzdelik dilleri kullanırken dikkat edilmesi gereken herhangi bir sorun olup olmadığını mı merak ediyorsunuz? Bazı açılardan bir tür özellik ölçeklendirmesine eşdeğer mi?