«hierarchical-clustering» etiketlenmiş sorular

3
Bir kümeleme yöntemi nasıl seçilir? Bir küme çözümü nasıl doğrulanır (yöntem seçimini garanti etmek için)?
Küme analizi ile ilgili en büyük sorunlardan biri, kullanılan farklı kümeleme yöntemlerine (hiyerarşik kümelemede farklı bağlantı yöntemleri dahil) dayandığında farklı sonuçlar çıkarmamız gerektiğidir . Bu konudaki fikrinizi bilmek istiyorum - hangi yöntemi seçeceksiniz ve nasıl. Biri “en iyi kümeleme yöntemi, size doğru cevabı verendir”; ancak küme analizinin denetimsiz bir teknik …

2
Hiyerarşik kümeleme için doğru bağlantı yöntemini seçme
Ben yapıyorum hiyerarşik kümeleme Google BigQuery'ye üzerinde reddit veri dökümü toplanan ve işlenen ettik verilere. İşlemim şöyle: / R / politics'teki en son 1000 yayını al Tüm yorumları topla Verileri işleyin ve bir n x mveri matrisi hesaplayın (n: kullanıcılar / samples, m: posts / features) Hiyerarşik kümeleme için uzaklık …

3
Hiyerarşik bir küme analizinin dendrogramı nasıl yorumlanır?
Aşağıdaki R örneğini düşünün: plot( hclust(dist(USArrests), "ave") ) Y ekseni "Yükseklik" tam olarak ne anlama geliyor? Kuzey Carolina ve Kaliforniya'ya bakmak (sol tarafta). Kaliforniya, Kuzey Carolina’ya Arizona’dan daha yakın mı? Bu yorumu yapabilir miyim? Hawaii (sağda) kümeye oldukça geç katılıyor. Bunu diğer devletlerden daha "yüksek" olarak görebiliyorum. Genel olarak dendrogramda …


4
Hiyerarşik Kümelenmenin dezavantajları nasıl anlaşılır?
Birisi Hiyerarşik Kümelenmenin artılarını ve eksilerini açıklayabilir mi? Hiyerarşik Kümeleme, K ile aynı dezavantajlara sahip mi? Hiyerarşik Kümelemenin K'ye göre avantajları nelerdir? H ortalamalarını Hiyerarşik Kümeleme üzerinde ne zaman kullanmalıyız? Bu yazının cevapları k'ın çok iyi olduğu dezavantajlarını açıklıyor. K-araçlarının dezavantajları nasıl anlaşılır

2
Kümeleme - Kleinberg'in İmkansızlık Teoreminin arkasındaki sezgi
Kleinberg (2002) tarafından kümelenmenin zorluklarını araştıran bu ilginç analiz hakkında bir blog yazısı yazmayı düşünüyorum . Kleinberg, bir kümeleme işlevi için görünüşte sezgisel görünen üç desideratayı özetlemekte ve daha sonra böyle bir işlevin olmadığını kanıtlamaktadır. Üç ölçütten ikisini doyuran birçok kümeleme algoritması vardır; ancak, hiçbir işlev aynı anda üçünü de …

4
Degrade artırıcı makine doğruluğu, yineleme sayısı arttıkça azalır
Gradyan arttırıcı makine algoritmasını caretR'deki paket üzerinden deniyorum. Küçük bir kolej veri kümesi kullanarak, aşağıdaki kodu koştu: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

2
Hiyerarşik bir kümelemenin geçerli olması için bir mesafenin “metrik” olması gerekir mi?
N öğesi arasında bir metrik olmayan bir mesafe tanımladığımızı varsayalım . Bu mesafeye dayanarak daha sonra Aglomeratif hiyerarşik bir kümeleme kullanıyoruz . Anlamlı sonuçlar elde etmek için bilinen algoritmaların her birini (tek / maksimum / avaerage bağlantısı vb.) Kullanabilir miyiz? Veya farklı bir deyişle, mesafe bir metrik değilse bunları kullanmayla …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.