«clustering» etiketlenmiş sorular

Küme analizi, sınıf etiketleri gibi önceden var olan bilgileri kullanmadan, verileri karşılıklı "benzerliklerine" göre nesnelerin alt kümelerine bölme görevidir. [Kümelenmiş standart hatalar ve / veya küme örnekleri bu şekilde etiketlenmelidir; onlar için "kümeleme" etiketini KULLANMAYIN.]

4
Bir korelasyon matrisinin kümelenmesi
Her öğenin diğer öğeyle nasıl ilişkilendirildiğini belirten bir korelasyon matrisim var. Dolayısıyla bir N maddesi için zaten bir N * N korelasyon matrisi var. Bu korelasyon matrisini kullanarak, K bölmesindeki Nk Öğelerinin aynı şekilde davrandığını söyleyebilmem için M bölmelerindeki N öğelerini nasıl kümeleyebilirim. Lütfen bana yardım et. Tüm öğe değerleri …

5
Kosinüs benzerlik matrisini hesaplayacak bir R fonksiyonu var mı? [kapalı]
Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Sorunuzu güncelleyin o yüzden -konu üzerinde Çapraz doğrulanmış için. Geçen yıl kapalı . Kosinüs mesafelerine dayalı sıra kümelemeli bir ısı haritası yapmak istiyorum. R'yi kullanıyorum ve heatmap.2()figür yapmak için. İçinde bir distparametre heatmap.2olduğunu görebiliyorum …


8
Karışık tip verilerin R ile kümelenmesi
Kilitli . Bu soru ve cevapları kilitlidir çünkü soru konu dışıdır ancak tarihsel önemi vardır. Şu anda yeni yanıtları veya etkileşimleri kabul etmiyor. R içinde karışık veri değişkenlerine sahip bir veri kümelenmesi yapmanın mümkün olup olmadığını merak ediyorum. Başka bir deyişle, içinde hem sayısal hem de kategorik değişkenleri içeren bir …


3
K-ortalamaları için boşluk istatistiği, açıkça iki tane olmasına rağmen neden bir küme öneriyor?
Verilerimi kümelemek için K-araçlarını kullanıyorum ve "en uygun" küme numarasını önermek için bir yol arıyordum. Boşluk istatistikleri, iyi bir küme numarası bulmanın yaygın bir yolu gibi görünmektedir. Herhangi bir nedenle 1'i optimum küme numarası olarak döndürür, ancak verilere baktığımda 2 küme olduğu açıktır: Ben R boşluğu şöyle çağırır: gap <- …

4
Kategorik verilerle, değişkenler ilişkili olmayan kümeler olabilir mi?
Küme analizlerini açıklamaya çalışırken, insanların süreci değişkenlerin ilişkili olup olmadığı ile ilgili olarak yanlış anlamaları yaygındır. İnsanları bu karışıklığı aşmanın bir yolu şöyledir: Bu, kümelerin olup olmadığı sorusu ile değişkenlerin ilişkili olup olmadığı sorusu arasındaki farkı açıkça göstermektedir. Ancak, bu sadece sürekli veri ayrımını gösterir. Kategorik verilerle bir analog düşünürken …

4
Hiyerarşik Kümelenmenin dezavantajları nasıl anlaşılır?
Birisi Hiyerarşik Kümelenmenin artılarını ve eksilerini açıklayabilir mi? Hiyerarşik Kümeleme, K ile aynı dezavantajlara sahip mi? Hiyerarşik Kümelemenin K'ye göre avantajları nelerdir? H ortalamalarını Hiyerarşik Kümeleme üzerinde ne zaman kullanmalıyız? Bu yazının cevapları k'ın çok iyi olduğu dezavantajlarını açıklıyor. K-araçlarının dezavantajları nasıl anlaşılır


1
Seyrek veri matrislerinde çalışan kümeleme algoritmaları [kapalı]
Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Sorunuzu güncelleyin o yüzden -konu üzerinde Çapraz doğrulanmış için. 5 yıl önce kapalı . Kümeleme algoritmalarının bir listesini derlemeye çalışıyorum: R'de uygulandı SparseMatrix işlevi tarafından oluşturulanlar gibi seyrek veri matrislerini (benzerlik matrislerini değil) çalıştırın …
18 r  clustering  sparse 


4
“Boyutsallığın laneti” gerçek verilerde gerçekten var mı?
"Boyutsallığın laneti" nin ne olduğunu anlıyorum ve bazı yüksek boyutlu optimizasyon problemleri yaptım ve üstel olasılıkların zorluklarını biliyorum. Ancak, gerçek boyutların çoğunda "boyutsallığın laneti" mevcutsa şüphe ediyorum. Binlerce özelliğe sahip veri toplayabiliriz ancak özelliklerin binlerce boyuta sahip bir alana tam olarak yayılması mümkün değildir. Boyut azaltma tekniklerinin bu kadar popüler …

2
Kümeleme - Kleinberg'in İmkansızlık Teoreminin arkasındaki sezgi
Kleinberg (2002) tarafından kümelenmenin zorluklarını araştıran bu ilginç analiz hakkında bir blog yazısı yazmayı düşünüyorum . Kleinberg, bir kümeleme işlevi için görünüşte sezgisel görünen üç desideratayı özetlemekte ve daha sonra böyle bir işlevin olmadığını kanıtlamaktadır. Üç ölçütten ikisini doyuran birçok kümeleme algoritması vardır; ancak, hiçbir işlev aynı anda üçünü de …

9
Rand endeksi hesaplama
Bir küme algoritmasının Rand Endeksi'ni nasıl hesaplayacağımı anlamaya çalışıyorum, ancak doğru ve yanlış negatifleri nasıl hesaplayacağım noktasında sıkıştım. Şu anda, Bilgi Edinme Anına Giriş kitabından bir örnek kullanıyorum (Manning, Raghavan ve Schütze, 2009). 359 Sayfasında Rand endeksinin nasıl hesaplanacağı hakkında konuşuyorlar. Bu örnek için üç küme kullanırlar ve kümeler aşağıdaki …
17 clustering 


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.