«unsupervised-learning» etiketlenmiş sorular

Boyutsuzluğun azaltılması için kümeleme ve özellik çıkarımı dahil etiketlenmemiş verilerde gizli (istatistiksel) yapı bulma.

3
K-ortalama küme analizi sonuçlarının güzel bir grafiği nasıl oluşturulur?
K-kümeleme yapmak için R kullanıyorum. K-means'i çalıştırmak için 14 değişken kullanıyorum K-araçlarının sonuçlarını çizmenin güzel bir yolu nedir? Herhangi bir uygulama var mı? 14 değişkene sahip olmak sonuçları çizmeyi zorlaştırıyor mu? GGcluster adında havalı görünen bir şey buldum ama hala gelişme aşamasında. Ayrıca, sammon haritalama hakkında bir şeyler okudum, ama …

2
Yapay bir sinir ağı ANN, denetlenmemiş kümelenme için nasıl kullanılabilir?
artificial neural network (ANN)Tahminlerde hatayı azaltarak armatürü iyileştirmek için backpropogation kullanarak denetimli bir şekilde nasıl eğitilebileceğini anlıyorum . Bir YSA'nın denetimsiz öğrenme için kullanılabileceğini duydum, ancak optimizasyon aşamalarını yönlendirmek için bir çeşit maliyet fonksiyonu olmadan nasıl yapılabilir? K-means veya EM algoritması ile her yinelemenin artması için bir fonksiyon vardır. Bir …



3
Neden bir lojistik regresyonun% 95 güven aralığında manuel olarak hesaplanması ile R'deki confint () fonksiyonunun kullanılması arasında bir fark var?
Sevgili millet - Açıklayamayacağım tuhaf bir şey fark ettim, ya sen? Özetle: bir lojistik regresyon modelinde bir güven aralığı hesaplamaya yönelik manuel yaklaşım ve R işlevi confint()farklı sonuçlar verir. Hosmer ve Lemeshow'un Applied Logistic Regresyon (2. Basım) bölümünden geçiyorum . 3. bölümde, oran oranını ve% 95 güven aralığını hesaplama örneği …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

2
Hiyerarşik kümeleme için doğru bağlantı yöntemini seçme
Ben yapıyorum hiyerarşik kümeleme Google BigQuery'ye üzerinde reddit veri dökümü toplanan ve işlenen ettik verilere. İşlemim şöyle: / R / politics'teki en son 1000 yayını al Tüm yorumları topla Verileri işleyin ve bir n x mveri matrisi hesaplayın (n: kullanıcılar / samples, m: posts / features) Hiyerarşik kümeleme için uzaklık …

2
Denetimli öğrenme, denetimsiz öğrenme ve güçlendirici öğrenme: İş akışı temelleri
Denetimli öğrenme 1) İnsan, girdi ve çıktı verilerine dayalı bir sınıflandırıcı oluşturur. 2) Bu sınıflandırıcı bir veri eğitim seti ile eğitilmiştir. 3) Bu sınıflandırıcı bir veri test seti ile test edilmiştir. 4) Çıktı tatmin edici ise dağıtım "Bu verileri nasıl sınıflandıracağımı biliyorum, sıralamanız için yalnızca size (sınıflandırıcı) ihtiyacım var." Yöntem …

5
İstatistik ve makine öğreniminde iki grup arasında ayrım yapılması: hipotez testi vs. sınıflandırma vs. kümeleme
A ve B olarak etiketlenmiş iki veri grubum olduğunu varsayalım (her biri 200 örnek ve 1 özellik içeren) ve farklı olup olmadıklarını bilmek istiyorum. Yapabilirdim: a) istatistiksel olarak farklı olup olmadıklarını görmek için istatistiksel bir test (ör. t-testi) yapın. b) denetimli makine öğrenmesini kullanın (örn. destek vektör sınıflandırıcısı veya rastgele …


5
Her kümenin eşit sayıda puana sahip olduğu kümeleme prosedürü?
Bazı noktalar var içinde ve ben böylece noktaları küme istiyorum:X= { x1, . . . , xn}X={x1,...,xn}X=\{x_1,...,x_n\}R,pR,pR^p Her kümede eşit sayıda elemanı bulunur . (Bu kümeler böler sayısı varsayalım .)XXXnnn Her küme, bir anlamda, araçlarından gelen kümeler gibi, "uzamsal olarak yapışkandır" .kkk Bunlardan birini veya diğerini tatmin eden birçok kümelenme …

3
Günlük Zaman Serileri Analizi
Zaman serisi analizi yapmaya çalışıyorum ve bu alanda yeniyim. 2006-2009 yılları arasında günlük bir etkinlik sayım var ve buna bir zaman serisi modeli uydurmak istiyorum. İşte kaydettiğim ilerleme: timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) Sonuçta elde ettiğim komplo: Verilerde mevsimsellik ve eğilim olup olmadığını doğrulamak için bu yazıda belirtilen adımları takip ediyorum …

3
Denetimli kümeleme veya sınıflandırma?
İkinci soru, web'de bir yerde, "denetimli kümeleme" hakkında konuştuğumda, kümelenmenin denetimsiz olduğunu bildiğim bir tartışmada buldum, peki "denetimli kümelenme" nin tam anlamı nedir? "Sınıflandırma" açısından fark nedir? Bunun hakkında konuşan birçok bağlantı var: http://www.cs.uh.edu/docs/cosc/technical-reports/2005/05_10.pdf http://books.nips.cc/papers/files/nips23/NIPS2010_0427.pdf http://engr.case.edu/ray_soumya/mlrg/supervised_clustering_finley_joachims_icml05.pdf http://www.public.asu.edu/~kvanlehn/Stringent/PDF/05CICL_UP_DB_PWJ_KVL.pdf http://www.machinelearning.org/proceedings/icml2007/papers/366.pdf http://www.cs.cornell.edu/~tomf/publications/supervised_kmeans-08.pdf http://jmlr.csail.mit.edu/papers/volume6/daume05a/daume05a.pdf vb ...


3
Sonuç sadece eğitim durumundaki olumlu vakalarla nasıl tahmin edilir?
Sadelik adına, spam / spam olmayan e-postaların klasik örneği üzerinde çalışıyorum diyelim. 20.000 e-posta setim var. Bunlardan 2000'in spam olduğunu biliyorum ama spam olmayan e-postalardan hiçbir örneğim yok. Kalan 18000’in spam olup olmadığını tahmin etmek istiyorum. İdeal olarak, aradığım sonuç, e-postanın spam olma olasılığı (veya bir p değeri). Bu durumda …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.