«clustering» etiketlenmiş sorular

Küme analizi, sınıf etiketleri gibi önceden var olan bilgileri kullanmadan, verileri karşılıklı "benzerliklerine" göre nesnelerin alt kümelerine bölme görevidir. [Kümelenmiş standart hatalar ve / veya küme örnekleri bu şekilde etiketlenmelidir; onlar için "kümeleme" etiketini KULLANMAYIN.]

2
"Benzer" kaynak kodlarının kümelerini algılama
Bir bilgisayar bilimi projesi yapmak zorunda olan 400 öğrencim olduğunu ve tek başına çalışmak zorunda olduklarını varsayalım (hiçbir öğrenci grubu yok). Bir proje örneği "fortran'da hızlı bir fourier dönüşüm algoritması uygulanmasına izin verebilir" (Biliyorum, seksi görünmüyor, ancak sorumu daha basit hale getiriyor). Ben düzelticiyim ve "gerçekten bağımsız olarak yazılamayacak kadar …

3
Kümeleme dağılımları
Birkaç dağıtımım var (aşağıdaki şekilde 10 dağıtım). Aslında bunlar histogramlardır: x ekseni üzerinde bir çözeltideki bazı parçacıkların boyutları olan 70 değer vardır ve her x değeri için karşılık gelen y değeri, boyutu x değeri civarında olan parçacıkların oranıdır. Bu dağılımları kümelemek istiyorum. Şu anda örneğin Öklid mesafesiyle hiyerarşik bir kümeleme …
10 clustering 

3
Boyuna değişkenler nasıl kümelenir?
0'dan 7. güne kadar uzunlamasına veriler içeren bir grup değişkenim var. Bu uzunlamasına değişkenleri (vakalar değil) farklı gruplara kümeleyebilen uygun bir kümeleme yaklaşımı arıyorum. Bu veri kümesini ayrı ayrı analiz etmeye çalıştım, ancak sonucun makul bir şekilde açıklanması oldukça zordu. Bir SAS prosedürünün kullanılabilirliğini araştırdım PROC SIMILARITYçünkü web sitesinde bir …
10 clustering 

2
Nokta bulutu verilerindeki dairesel kalıpları algılama
Üzerinde çalıştığım bazı hacim rekonstrüksiyon algoritması için, 3B nokta verilerinde (LIDAR cihazından gelen) rasgele sayıda dairesel desen tespit etmem gerekiyor. Desenler uzayda keyfi olarak yönlendirilebilir ve ince 2d düzlemlerde (mükemmel olmasa da) yattığı varsayılabilir. Aynı düzlemde iki daire bulunan bir örnek (bunun bir 3d alan olduğunu unutmayın): Birçok yaklaşım denedim …

1
Kmean kümelenmesi için R'deki istatistik paketini kullanma
Küme paketinin bir veya iki yönünü anlamakta güçlük çekiyorum. Quick-R'deki örneği yakından takip ediyorum , ancak analizin bir veya iki yönünü anlamıyorum. Bu özel örnek için kullandığım kodu dahil ettik. ## Libraries library(stats) library(fpc) ## Data mydata = structure(list(a = c(461.4210925, 1549.524107, 936.42856, 0, 0, 0, 0, 0, 0, 0, …
10 r  clustering 

1
Küme Analizi ve ardından Ayırım Analizi
Literatürde zaman zaman gördüğüm gibi (esas olarak zihinsel bozuklukların klinik alt tiplendirmesinde) k-ortalamaları gibi bir kümeleme algoritmasının sonuçlarında Diskriminant Analizini (DA) kullanmanın mantığı nedir? Genellikle, sınıflar arası (sınıf içinde sırasıyla) ataletin maksimizasyonunu (sırasıyla minimizasyon) destekledikleri için, küme yapımı sırasında kullanılan değişkenler üzerindeki grup farklılıklarının test edilmesi önerilmez. Bu nedenle, bireyleri …

1
K-anlamı: Pratik durumlarda kaç tekrarlama var?
Veri madenciliği veya büyük verilerde endüstri deneyimim yok, bu yüzden biraz deneyim paylaştığınızı duymak isterim. İnsanlar gerçekten büyük bir veri kümesinde k-ortalamaları, PAM, CLARA, vs. çalıştırıyor mu? Yoksa rastgele bir örnek mi seçtiler? Sadece veri kümesinin bir örneğini alırlarsa, veri kümesi normal olarak dağıtılmazsa sonuç güvenilir olur mu? Bu algoritmaları …

2
Düzeltilmiş Rand Endeksi ve Düzeltilmiş Karşılıklı Bilgiler
Kümeleme performansını değerlendirmeye çalışıyorum. Metriklerle ilgili skiscit-learn belgelerini okuyordum . ARI ve AMI arasındaki farkı anlamıyorum. Bana öyle geliyor ki aynı şeyi iki farklı şekilde yapıyorlar. Belgelerden alıntı: Ground_tre sınıfı atamaları label_true ve aynı sample_pred örneklerinin kümeleme algoritması atamaları hakkında bilgi verildiğinde, düzeltilmiş Rand endeksi , iki atamanın benzerliğini ölçen, …

2
Boole özelliklerinin küçük bir örnek kümesi için PCA ve spektral kümeleme arasındaki fark
50 örneklik bir veri setim var. Her örnek 11 (muhtemelen ilişkili) Boole özelliğinden oluşur. Bu örnekleri 2B çizimde nasıl görselleştirebilir ve 50 örnek arasında küme / gruplama olup olmadığını incelemek isterim. Aşağıdaki iki yaklaşımı denedim: (a) PCA'yı 50x11 matrisinde çalıştırın ve ilk iki temel bileşeni seçin. Verileri 2D çizim üzerine …

1
R doğrusal regresyon kategorik değişkeni “gizli” değer
Bu sadece birkaç kez karşılaştığım bir örnektir, bu yüzden örnek verilerim yok. R'de doğrusal regresyon modeli çalıştırmak: a.lm = lm(Y ~ x1 + x2) x1sürekli bir değişkendir. x2kategoriktir ve üç değeri vardır, örneğin "Düşük", "Orta" ve "Yüksek". Bununla birlikte, R tarafından verilen çıktı aşağıdaki gibi olacaktır: summary(a.lm) Estimate Std. Error …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
Hangi derin öğrenme modeli, birbirini dışlamayan kategorileri sınıflandırabilir
Örnekler: İş tanımında bir cümle var: "İngiltere'de Java kıdemli mühendisi". Derin bir öğrenme modelini 2 kategori olarak tahmin etmek istiyorum: English ve IT jobs. Geleneksel sınıflandırma modeli kullanırsam, sadece softmaxson katmanda işlevli 1 etiket tahmin edebilir . Bu nedenle, her iki kategoride "Evet" / "Hayır" ı tahmin etmek için 2 …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
Gaussian'ın Bayes Karışımına stokastik varyasyon çıkarımının uygulanması
Bunu izleyen stokastik varyasyon çıkarsama ile Gauss Karışım modeli uygulamak çalışıyorum kağıt . Bu Gauss Karışımının pgm'si. Makaleye göre, stokastik varyasyon çıkarımının tam algoritması: Ve hala GMM'ye ölçeklendirme yönteminden çok kafam karıştı. İlk olarak, yerel varyasyon parametresinin sadece ve diğerlerinin de tüm global parametreler olduğunu düşündüm . Eğer yanılmışsam lütfen …

2
Kümeleme sorunları için özellik seçimi
Denetimsiz algoritmalar (kümeleme) kullanarak grup birlikte farklı veri kümeleri yapmaya çalışıyorum. Sorun, birçok özelliğim (~ 500) ve az miktarda vaka (200-300) olmasıdır. Şimdiye kadar sadece verileri eğitim setleri olarak etiketlediğim sınıflandırma problemleri yapıyordum. Orada, özelliklerin önceden seçilmesi için bazı kriterler (yani random.forest.importance veya information.gain) kullandım ve daha sonra ilgili özellikleri …

2
Bir uyumsuzluk ölçüsü için ağırlıklar nasıl bulunur?
Kümeleme için kullanabileceğim benzerlik ölçümüm için ağırlıklarını öğrenmek (çıkarmak) istiyorum. Bazı örnekler vardır (aynı kümedeki olmalıdır) "içindeki", hem de bazı örnekler olarak nesnelerin çiftlerinin "benzemeyen" nesnelerin çiftlerinin (olmamalıdır aynı kümede olması). Her nesnenin birtakım nitelikleri vardır: İsterseniz, her bir nesneyi , her özelliğin negatif olmayan bir tamsayı olduğu, boyutlu bir …

2
Bu “Reddit Birleşik Devletleri” grafiği nasıl oluşturulur?
Aşağıda s. James Dowdell tarafından yapılmış olsa da Christian Rudder'ın Dataclysm'in 202'si. Kullanıcıların bağlantılar, yorumlar ve oylar gönderebileceği reddit.com'da ilgi alanları olan çeşitli ilk 200 alt kredi arasındaki ilişkileri gösterir . Bunlar bu sitedeki etiketlere benzer. Alt düzenleme bölgelerinin büyüklüğü popülerliklerini temsil eder. Altdizimler çapraz yorumlama ile gruplandırılır ve daha …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.