«clustering» etiketlenmiş sorular

Küme analizi, sınıf etiketleri gibi önceden var olan bilgileri kullanmadan, verileri karşılıklı "benzerliklerine" göre nesnelerin alt kümelerine bölme görevidir. [Kümelenmiş standart hatalar ve / veya küme örnekleri bu şekilde etiketlenmelidir; onlar için "kümeleme" etiketini KULLANMAYIN.]

3
K-Means ve EM ile Kümelenme: Bunlar nasıl ilişkilidir?
Verileri kümelemek için algoritmalar çalıştım (denetimsiz öğrenme): EM ve k-araçları. Aşağıdakileri okumaya devam ediyorum: k-aracı, kümelerin küresel olduğu varsayımlarıyla birlikte EM'nin bir çeşididir. Birisi yukarıdaki cümleyi açıklayabilir mi? Küresel olanın ne anlama geldiğini ve kmeans ve EM'in birbirleriyle nasıl ilişkili olduğunu anlamıyorum, çünkü biri olasılıksal ödevini diğeri ise deterministik bir …


3
Eğri şekline göre zaman serileri kümelemesi yapılabilir mi?
Bir dizi satış noktası için satış verilerim var ve bunları zaman içindeki eğrilerinin şekline göre kategorize etmek istiyorum. Veriler kabaca bu gibi gözüküyor (ancak açıkça rastgele değil ve bazı eksik veriler var): n.quarters <- 100 n.stores <- 20 if (exists("test.data")){ rm(test.data) } for (i in 1:n.stores){ interval <- runif(1, 1, …

3
Kütle dönüştürülmüş yordayıcının ve / veya tepkinin yorumlanması
Merak ediyorum, yorumlamada sadece bağımlı, bağımsız veya bağımsız değişkenlerin mi yoksa sadece bağımsız değişkenlerin log dönüşümünde mi olduğunu fark eder mi? Durumunu düşünün log(DV) = Intercept + B1*IV + Error IV'ü yüzde artış olarak değerlendirebilirim, ancak sahip olduğumda bu nasıl değişir? log(DV) = Intercept + B1*log(IV) + Error veya sahipken …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 


5
Kümelemeden önce verileri ölçeklendirmek önemli mi?
Kümelemeden önce özelliklerde scale işlevini çalıştırmanız gerektiğini öneren bu öğreticiyi buldum (verileri z puanlarına dönüştürdüğüne inanıyorum). Bunun gerekli olup olmadığını merak ediyorum. Çoğunlukla soruyorum çünkü verileri ölçeklemediğimde güzel bir dirsek noktası var, ancak ölçeklendiğinde kayboluyor. :)

8
Topluluk tespitini ağırlıklı bir sosyal ağda / grafikte nasıl yapabilirim?
Ben bir grafik üzerinde topluluk algılama / grafik bölümleme / kümelenme performans söz konusu olduğunda birileri iyi bir başlangıç noktalarının ne önermek eğer merak ediyorum ağırlıklı , yönsüz kenarları. Söz konusu grafik yaklaşık 3 milyon kenara sahiptir ve her bir kenar, bağlandığı iki köşe arasındaki benzerlik derecesini ifade eder. Özellikle, …

5
Dinamik Zaman Çözgü Kümeleme
Zaman serilerinin kümelenmesini gerçekleştirmek için Dinamik Zaman Sıyırma (DTW) kullanma yaklaşımı ne olurdu? DTW'yi, iki zaman serisi arasında benzerlik bulmanın, zaman içinde kaydırılabileceklerini bulmanın bir yolu olarak okudum. Bu yöntemi k-means gibi kümeleme algoritması için benzerlik ölçüsü olarak kullanabilir miyim?

5
Zaman serilerinde R kümelenmesi
Zaman serisi verilerim var. Her seri aynı dönemi kapsar, ancak her zaman serisindeki gerçek tarihler tam olarak 'sıralanmayabilir'. Diğer bir deyişle, eğer Zaman dizisi bir 2D matriste okunacak olsaydı, şöyle görünürdü: date T1 T2 T3 .... TN 1/1/01 100 59 42 N/A 2/1/01 120 29 N/A 42.5 3/1/01 110 N/A …

3
Bir kümeleme yöntemi nasıl seçilir? Bir küme çözümü nasıl doğrulanır (yöntem seçimini garanti etmek için)?
Küme analizi ile ilgili en büyük sorunlardan biri, kullanılan farklı kümeleme yöntemlerine (hiyerarşik kümelemede farklı bağlantı yöntemleri dahil) dayandığında farklı sonuçlar çıkarmamız gerektiğidir . Bu konudaki fikrinizi bilmek istiyorum - hangi yöntemi seçeceksiniz ve nasıl. Biri “en iyi kümeleme yöntemi, size doğru cevabı verendir”; ancak küme analizinin denetimsiz bir teknik …


4
Silhouette çizimi ne anlama gelir?
Veri setimdeki küme sayısını belirlemek için siluet grafiği kullanmaya çalışıyorum. Veri kümesi treni göz önüne alındığında, aşağıdaki matlab kodunu kullandım Train_data = full(Train); Result = []; for num_of_cluster = 1:20 centroid = kmeans(Train_data,num_of_cluster,'distance','sqeuclid'); s = silhouette(Train_data,centroid,'sqeuclid'); Result = [ Result; num_of_cluster mean(s)]; end plot( Result(:,1),Result(:,2),'r*-.');` Ortaya çıkan arsa, küme sayısı …

3
Neden t-SNE kümeleme veya sınıflandırma için bir boyutluluk azaltma tekniği olarak kullanılmıyor?
Yakın zamanda yapılan bir atamada, boyutları 64'ten (8 x 8 görüntüler) 2'ye düşürmek için MNIST rakamlarında PCA kullanmamız söylendi. Daha sonra rakamları bir Gauss Karışım Modeli kullanarak kümelemek zorunda kaldık. Yalnızca 2 ana bileşen kullanan PCA, farklı kümeler vermez ve sonuç olarak, model yararlı gruplar oluşturamaz. Bununla birlikte, 2 bileşenli …

3
Neden bir lojistik regresyonun% 95 güven aralığında manuel olarak hesaplanması ile R'deki confint () fonksiyonunun kullanılması arasında bir fark var?
Sevgili millet - Açıklayamayacağım tuhaf bir şey fark ettim, ya sen? Özetle: bir lojistik regresyon modelinde bir güven aralığı hesaplamaya yönelik manuel yaklaşım ve R işlevi confint()farklı sonuçlar verir. Hosmer ve Lemeshow'un Applied Logistic Regresyon (2. Basım) bölümünden geçiyorum . 3. bölümde, oran oranını ve% 95 güven aralığını hesaplama örneği …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

3
(Neden) Kohonen tarzı SOM lehine düştü mü?
Söyleyebileceğim kadarıyla, Kohonen tarzı SOM'lerin 2005 yıllarında zirveye çıktıkları ve son zamanlarda pek fazla bir ricada bulunmadıkları görülüyor. SOM'lerin başka bir yöntemle yerine getirildiğini veya başka bir şeye eşdeğer olduğunu kanıtlayan herhangi bir makale bulamadım (yine de daha yüksek boyutlarda). Ancak, tSNE ve diğer metotlar günümüzde çok daha fazla mürekkep …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.