Boylam / enlem özelliğiyle başa çıkma yolları [kapalı]


19

25 özellikli kurgusal bir veri kümesi üzerinde çalışıyorum. Özelliklerden ikisi, bir yerin enlem ve boylamıdır ve diğerleri, değişen aralıklarla pH değerleri, yükseklik, rüzgar hızı vb. Diğer özelliklerde normalleştirme yapabilirim ancak enlem / boylam özelliklerine nasıl yaklaşırım?

Düzenleme: Bu tarımsal verimi tahmin etmek için bir sorundur. Konumların öngörmede ve dolayısıyla ikilemde hayati önem taşıyabileceği için enlem / boylamın çok önemli olduğunu düşünürüm.


Neden bu özellikleri normalleştirebileceğinizi düşünmüyor musunuz? Muhtemelen sayısal olarak diğer özelliklerle aynıdır, böylece mean / sd? Konumlar arasındaki mesafenin doğal olarak ölçülmesine ilişkin endişeniz mi? Öyleyse, veriler küçük bir alanı kaplıyor mu (benzer değerlere sahip) veya küresel mi?
Neil Slater

@NeilSlater Sadece sezgisel olarak bu özellikleri normalleştirmek benim için bir anlam ifade etmiyor. Normalleştirilirse bilgiler kaybolmayacak mı? Amerika'nın ilçelerini kapsayan veri setim var.
AllThingsScience

Hangi bilgilerin kaybedileceğini düşünüyorsunuz? Muhtemelen kaybolmayacak, ancak sorunuzda endişenizin ne olduğunu açıklarsanız, biri cevaplayabilir. Artık bilmeden, ne olursa olsun normalleşirdim - tamamen küresel değerler ve bazı problemler için (noktalar arasındaki mesafenin önemli olduğu yerlerde) uzun / lattan bir 3d kartezyen koordinat özelliği oluşturabilirim.
Neil Slater

Sorunuz ne? Verilerden ne bulmaya çalışıyorsunuz? Korelasyon? Kümeleme? Sınıflandırma? Tahmin? İnterpolasyon? Konum modeliniz için ne kadar önemli?
Spacedman

@Spacedman Lütfen düzenlemeye bakın.
AllThingsScience

Yanıtlar:


24

Son uzun koordinatların üç boyutlu bir alanı temsil eden 2 özellik olma sorunu vardır. Bu, uzun koordinatın etrafından dolandığı anlamına gelir, bu da en uçtaki iki değerin aslında birbirine çok yakın olduğu anlamına gelir. Bu sorunu birkaç kez ele aldım ve bu durumda yaptığım şey onları x, y ve z koordinatlarına eşlemek. Bu, bu 3 boyuttaki yakın noktaların da gerçekte yakın olduğu anlamına gelir. Kullanım durumuna bağlı olarak, yükseklikteki değişiklikleri göz ardı edebilir ve bunları mükemmel bir küre ile eşleştirebilirsiniz. Bu özellikler daha sonra uygun şekilde standartlaştırılabilir.

Açıklığa kavuşturmak için (yorumlardan özetlenmiştir):

x = cos(lat) * cos(lon)
y = cos(lat) * sin(lon), 
z = sin(lat) 

1
Bu çok ilginç. Teşekkür ederim! Bunların dönüşüm formülleri olup olmadığını teyit edebilir misiniz? x = R * cos (lat) * cos (lon), y = R * cos (lat) * sin (lon), z = R * sin (lat)
AllThingsScience

Şu anda koduma erişimim yok ama doğru görünüyor. Yine de standartlaşacağınız için R'ye ihtiyacınız yok;)
Jan van der Vegt

Mükemmel! Teşekkür ederim.
AllThingsScience
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.