Birçok özellik arasında GPS koordinatları (enlem ve boylam) içeren veri kümeleri var. Bu veri kümelerini aşağıdaki gibi sorunları araştırmak için kullanmak istiyorum: (1) başlangıç ve bitiş noktaları arasında sürmek için ETA hesaplamak; ve (2) belirli bir nokta için suç miktarının tahmin edilmesi.
Doğrusal bir regresyon modeli kullanmak istiyorum. Ancak, bu GPS koordinatlarını doğrudan doğrusal bir modelde kullanabilir miyim?
Enlem ve boylam , bir kişinin yaşı gibi sıralı bir özelliğe sahip değildir . Örneğin, iki noktanın (40.805996, -96.681473) ve (41.226682, -95.986587) herhangi bir anlamlı sıraya sahip görünmüyor. Onlar sadece uzayda olan noktalardır. Onları kategorik ABD posta kodları ile değiştirmeyi ve sonra bir sıcak kodlama yapmayı düşünüyordum , ancak bu birçok değişkenle sonuçlanacaktır .