Bu soru " R'deki uzamsal verileri kümeleme " olarak başladı ve şimdi DBSCAN sorusuna taşındı.
İlk soruya verilen yanıtların önerdiği gibi, DBSCAN hakkında bilgi aradım ve hakkında bazı belgeleri okudum. Yeni sorular ortaya çıktı.
DBSCAN bazı parametreler gerektirir, bunlardan biri "mesafe" dir. Verilerim üç boyutlu, boylam, enlem ve sıcaklık olduğundan, hangi "mesafeyi" kullanmalıyım? hangi boyut bu mesafeyle ilişkilidir? Sanırım sıcaklık olmalı. R ile bu kadar minimum mesafeyi nasıl bulabilirim?
Başka bir parametre, bir küme oluşturmak için oluşturulan minimum nokta sayısıdır. Bu numarayı bulmak için herhangi bir yöntem var mı? Ne yazık ki bulamadım.
Google'da arama Yapma Benimkine benzer bir veri kümesinde dbscan kullanmak için bir R örneği bulamadım, bu tür örneklere sahip herhangi bir web sitesi biliyor musunuz? Böylece okuyabilir ve durumuma uyum sağlamaya çalışabilirim.
Son soru, DBSCAN ile ilk R girişimimin (önceki sorulara uygun bir cevap olmadan) bir hafıza problemine yol açmasıdır. R vektörü ayıramadığını söylüyor. Geçerli SST noktalarını kaldırırken yaklaşık 300000 satır x 3 sütun (enlem, boylam ve sıcaklık) ile biten 779191 noktalı 4 km aralıklı bir ızgara ile başlıyorum. Bu bellek sorununa yönelik herhangi bir ipucu. Bilgisayarıma veya DBSCAN'ın kendisine mi bağlı?
Uzun ve muhtemelen sıkıcı bir mesaj okuduğunuz için teşekkür ederiz.