DBSCAN için eps ve minPts seçme rutini


14

DBSCAN, bazı literatürlere göre en çok atıf yapılan kümeleme algoritmasıdır ve yoğunluğa bağlı olarak rastgele şekil kümeleri bulabilir. İki parametre eps (mahalle yarıçapı olarak) ve minPts (bir noktayı çekirdek nokta olarak kabul etmek için minimum komşu olarak) yüksek oranda onlara bağlı olduğuna inanıyorum.

Bu parametreleri seçmek için rutin veya yaygın olarak kullanılan bir yöntem var mı?


Yanıtlar:


11

Bu parametreleri seçmek için yöntemler öneren birçok yayın vardır.

Bunlardan en önemlisi epsilon parametresini ortadan kaldıran bir DBSCAN varyasyonu olan OPTICS'dir; kabaca "olası her epsilon ile DBSCAN çalıştırmak" olarak görülen hiyerarşik bir sonuç üretir.

MinPts için ne yapmak önermek değil bir otomatik yöntemle güvenmek, ancak üzerinde etki bilgi .

İyi bir kümeleme algoritması , ihtiyaçlarınıza göre özelleştirmenizi sağlayan parametreler içerir.

Göz ardı ettiğiniz bir parametre uzaklık işlevidir. DBSCAN için yapılacak ilk şey , uygulamanız için iyi bir mesafe fonksiyonu bulmaktır . Her uygulama için en iyi olan Öklid mesafesine güvenmeyin!


Kullanıcı mesafe işlevini seçebilmesine rağmen, bunun bir parametre olduğundan şüpheliyim.
Mehraban

1
Tabiki öyle. Diğer herhangi bir çekirdekleştirilmiş yöntem için çekirdek işlevi kadar bir parametredir (aslında DBSCAN'ı önemsiz bir şekilde bu şekilde çekirdeklendirebilirsiniz) ve benim deneyimime göre Canberra veya Clark gibi diğer mesafeler sonuçları önemli ölçüde artırabilir .
QUIT - Anony-Mousse

Kümeleme üzerindeki uzaklık fonksiyonu etkisini küçümsemiyorum, ancak dbscan veya diğer tüm kümeleme algoritmalarına özgü olmayan bir şekilde genel olduğunu düşünüyorum; eps ve minPts açıkça dbscan parametreleridir.
Mehraban

1
Mesafeye dayalı olmayan çok sayıda algoritma da var. Ve minPts'in ken yakın komşu sınıflandırması için aynı olduğunu düşündüğünüzde, minPts parametresi için de aynısını söyleyebilirsiniz. Sanırım temel fark mesafe için "sık sık" mantıklı bir varsayılan var: Öklid mesafesi; oysa minPts için değer verilere özgü olacaktır.
ÇIKIŞ - Anony-Mousse

1
OPTİK'in kendisi size bölümler değil, bir küme sırası verecektir. Bölümleri almak için OPTICS belgesinde açıklanan xi ekstraksiyonunu kullanın. Farklılıkları anlamak için her bir varyant belgesine bakın.
ÇIKIŞ - Anony-Mousse
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.