İstatistikler ve Büyük Veri k-means

1

Pandalar ve scikit öğrenmek kullanarak python kümeleme bir kmeans kodlamak istiyorum. İyi k'yi seçmek için, Tibshirani ve al 2001'den ( Pdf ) Gap İstatistiğini kodlamak istiyorum . Scikit'ten inertia_ sonucunu kullanıp kullanamayacağımı ve tüm istatistik hesaplamasını yeniden kodlamak zorunda kalmadan boşluk istatistik formülünü uyarlayıp uyarlayamayacağımı bilmek istiyorum . Scikit / …

9 clustering python k-means scikit-learn metric

1

GPS tabanlı raporlardan bilinmeyen sayıda gerçek dünya yeri belirleme

Birkaç GPS tabanlı raporlardan gerçek dünya konumlarını (fe hız kameraları) belirlemesi gereken bazı yazılımlar üzerinde çalışıyorum . Bir kullanıcı bir konum bildirirken araç kullanıyor olacak, bu nedenle raporlar çok yanlış. Bu sorunu çözmek için aynı yerle ilgili raporları kümelendirmeli ve bir ortalama hesaplamalıyım. Sorum bu raporların nasıl kümeleneceği ile ilgili …

9 k-means expectation-maximization point-estimation

3

K-ortalamaları için küme seçimi: 1 küme durumu

Kimse kmeans kullanarak kümelenmenin uygun olup olmadığını belirlemek için iyi bir yöntem biliyor mu? Yani, numuneniz aslında homojen ise? Bir karışım modeli gibi bir şey biliyorum (R'de mclust aracılığıyla) 1: k küme durumu için uygun istatistikler sağlayacaktır, ancak kmeans değerlendirmek için tüm teknikler en az 2 küme gerektirir gibi görünüyor. …

9 r clustering k-means

1

Gözlenen ve beklenen olayları nasıl karşılaştırırım?

Diyelim ki 4 olası olayın sıklık örneğine sahibim: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 ve olaylarımın gerçekleşmesi için beklenen olasılıklarım var: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Dört olayın gözlemlenen frekanslarının toplamı ile (18) Olayların beklenen frekanslarını hesaplayabilir …

9 r statistical-significance chi-squared multivariate-analysis exponential joint-distribution statistical-significance self-study standard-deviation probability normal-distribution spss interpretation assumptions cox-model reporting cox-model statistical-significance reliability method-comparison classification boosting ensemble adaboost confidence-interval cross-validation prediction prediction-interval regression machine-learning svm regularization regression sampling survey probit matlab feature-selection information-theory mutual-information time-series forecasting simulation classification boosting ensemble adaboost normal-distribution multivariate-analysis covariance gini clustering text-mining distance-functions information-retrieval similarities regression logistic stata group-differences r anova confidence-interval repeated-measures r logistic lme4-nlme inference fiducial kalman-filter classification discriminant-analysis linear-algebra computing statistical-significance time-series panel-data missing-data uncertainty probability multivariate-analysis r classification spss k-means discriminant-analysis poisson-distribution average r random-forest importance probability conditional-probability distributions standard-deviation time-series machine-learning online forecasting r pca dataset data-visualization bayes distributions mathematical-statistics degrees-of-freedom

3

K-Ortalamalar Algoritmasında Döngü

Wiki'ye göre en yaygın kullanılan yakınsama kriteri “değerlendirme değişmemiştir”. Böyle bir yakınsama kriteri kullanırsak bisikletin olup olmayacağını merak ediyordum. Birisi bisiklete binme örneği veren veya bunun imkansız olduğunu kanıtlayan bir makaleye atıfta bulunursa memnun olurum.

9 clustering algorithms k-means

«k-means» etiketlenmiş sorular