«clustering» etiketlenmiş sorular

Küme analizi, sınıf etiketleri gibi önceden var olan bilgileri kullanmadan, verileri karşılıklı "benzerliklerine" göre nesnelerin alt kümelerine bölme görevidir. [Kümelenmiş standart hatalar ve / veya küme örnekleri bu şekilde etiketlenmelidir; onlar için "kümeleme" etiketini KULLANMAYIN.]

2
Kümeleme için karışım modeli nasıl takılır
İki değişkenim var - X ve Y ve kümeyi maksimum (ve optimal) = 5 yapmalıyım. Değişkenlerin ideal grafiği aşağıdaki gibidir: Bunun 5 kümesini yapmak istiyorum. Bunun gibi bir şey: Bu yüzden bu 5 küme ile karışım modeli olduğunu düşünüyorum. Her kümenin merkez noktası ve çevresinde bir güven dairesi vardır. Kümeler …

2
Zaman serileri ve anomali tespiti
Zaman serilerinde bir anormallik tespit etmek için bir algoritma kurmak istiyorum ve bunun için kümeleme kullanmayı planlıyorum. Neden ham zaman serisi verilerini değil, kümeleme için bir mesafe matrisi kullanmalıyım ?, Anomalinin tespiti için yoğunluk tabanlı kümeleme, DBscan olarak bir algoritma kullanacağım, bu durumda bu işe yarar mı? Veri akışı için …

3
Manhattan mesafesini Ward'ın hiyerarşik kümelemede kümeler arası bağıyla kullanmak uygun mudur?
Zaman serisi verilerini analiz etmek için hiyerarşik kümeleme kullanıyorum. Kodum, aşağıdaki girdiler verildiğinde hiyerarşik kümeler oluşturan Mathematica işlevi kullanılarak uygulanır DirectAgglomerate[...]: bir mesafe matrisi D kümeler arası bağlantıyı belirlemek için kullanılan yöntemin adı. Manhattan mesafesini kullanarak D mesafe matrisini hesapladım: d(x,y)=∑i|xi−yi|d(x,y)=∑i|xi−yi|d(x,y) = \sum_i|x_i - y_i| burada ve zaman serilerimdeki veri …


3
Kümelenmenin veri çıktısı nasıl çizilir?
Bir veri kümesini (işaretler kümesi) kümelemeyi denedim ve 2 küme aldım. Grafiksel olarak temsil etmek istiyorum. (X, y) koordinatlarına sahip olmadığım için temsili biraz karıştı. Ayrıca bunu yapmak için MATLAB / Python işlevi arıyor. DÜZENLE Bence veri yayınlamak soruyu daha açık hale getiriyor. Python (scipy kullanarak) kmeans kümeleme kullanarak yaptığım …

2
Dirichlet Kümeleme işlemleri: etiketlerle nasıl başa çıkılır?
S: Dirichlet İşlemi kullanarak verileri kümelemenin standart yolu nedir? Gibbs örnekleme kullanılırken örnekleme sırasında kümeler belirir ve yok olur. Ayrıca posterior dağılımın küme yeniden etiketlemelerine değişmediği için bir tanımlanabilirlik problemimiz var. Böylece, bir kullanıcının küme hangisi olduğunu söyleyemeyiz, bunun yerine iki kullanıcının aynı kümede olduğunu (yani ).p ( cben= cj)p(ci=cj)p(c_i=c_j) …

2
k-k-medyan mı?
K-ortalamaları kümeleme algoritması ve k-medyan olduğunu biliyorum. Biri ortalamayı kümenin merkezi olarak, diğeri medyanı kullanır. Sorum şu: hangisi ne zaman / nerede kullanılır?

2
Sayısal verileri doğal olarak oluşturulmuş “parantezler” halinde nasıl gruplandırabilirim? (örneğin gelir)
Aşağıdaki, neyi başarmaya çalıştığımı açıklıyor, ancak alternatif bir sorun ifadesi hedefimi tanımlayabilir: istiyorum aşağıdaki sayıları, her gruptaki sayıların varyanslarının çok büyük olmadığı ve grupların ortalamaları arasındaki farkların çok küçük olmadığı gruplara ayırın sonuçta elde edilen dağılımı "mükemmel" olanlarla karşılaştırır ve mükemmel olmaktan ne kadar "farklı" olduğunu görür. Layman'ın hedef açıklaması …

3
Neden diğer algoritmalar yerine k-araçlarını kullanıyoruz?
K-ortalamaları hakkında araştırma yaptım ve bunlar var: k-means bilinen kümelenme sorunlarını çözmek için denetimsiz öğrenme yöntemini kullanan en basit algoritmalardan biridir. Büyük veri kümeleriyle gerçekten iyi çalışır. Bununla birlikte, K-Ortalamalarının dezavantajları vardır: Aykırı değerlere ve gürültüye karşı güçlü hassasiyet Dairesel olmayan küme şekliyle iyi çalışmaz - küme sayısı ve başlangıç …

4
Kümenin şekli nasıl ölçülür?
Bu sorunun iyi tanımlanmadığını biliyorum, ancak bazı kümeler eliptik olma eğilimindedir veya diğeri doğrusal olmayan şekillere sahipken (2D veya 3D örneklerde) düşük boyutlu uzayda yatar. Kümelerin doğrusal olmama (veya "şekil") ölçüsü var mı? 2B ve 3B alanda, herhangi bir kümenin şeklini görmek bir sorun değildir, ancak daha yüksek boyutlu alanlarda …

3
Birisi zaman serisi benzerliğini belirlemek için dinamik zaman eğrilmesini açıklayabilir mi?
Zaman serilerini karşılaştırmak için dinamik zaman çözgüsü ölçüsünü kavramaya çalışıyorum. Bunun gibi üç zaman serisi veri setim var: T1 <- structure(c(0.000213652387565, 0.000535045478866, 0, 0, 0.000219346347883, 0.000359669104424, 0.000269469145783, 0.00016051364366, 0.000181950509461, 0.000385579332948, 0.00078170803205, 0.000747244535774, 0, 0.000622858922454, 0.000689084895259, 0.000487983408564, 0.000224744353298, 0.000416449765747, 0.000308388157895, 0.000198906016907, 0.000179549331179, 9.06289650172e-05, 0.000253506844685, 0.000582896161212, 0.000386473429952, 0.000179839942451, 0, 0.000275608635737, 0.000622665006227, 0.00036075036075, …

8
Makine öğrenimi için “sıcak algoritmalar” nelerdir?
Bu, makine öğrenmesini öğrenmeye başlayan birinden naif bir sorudur. Bu günlerde Marsland'dan "Makine Öğrenimi: Algoritmik bir bakış açısı" kitabını okuyorum. Bir tanıtım kitabı olarak yararlı buluyorum, ama şimdi şu anda en iyi sonuçları veren gelişmiş algoritmalara girmek istiyorum. Çoğunlukla biyoinformatikle ilgileniyorum: biyolojik ağların kümelenmesi ve biyolojik dizilerde örüntüler bulmak, özellikle …

3
Kümeleme için
Herkes kullanımı mu veya yerine kümeleme ilişkin metrikleri ? Aggarwal ve ark., Yüksek boyutlu uzayda mesafe ölçütlerinin şaşırtıcı davranışı üzerine (2001 yılında)L .5 L 2L1L1L_1L.5L.5L_.5L2L2L_2 L 2L1L1L_1 , yüksek boyutlu veri madenciliği uygulamaları için Öklid uzaklık metriği sürekli olarak daha fazla tercih edilir L2L2L_2 ve veya daha iyi olabileceğini iddia …

9
Kümeleme için görselleştirme yazılımı
Kilitli . Bu soru ve cevapları kilitlidir çünkü soru konu dışıdır, ancak tarihsel önemi vardır. Şu anda yeni yanıtları veya etkileşimleri kabul etmiyor. ~ 22000 puan toplamak istiyorum. Birçok kümeleme algoritması daha yüksek kaliteli ilk tahminlerle daha iyi çalışır. Verilerin kaba şekli hakkında iyi bir fikir verebilecek hangi araçlar var? …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.