«unsupervised-learning» etiketlenmiş sorular

Boyutsuzluğun azaltılması için kümeleme ve özellik çıkarımı dahil etiketlenmemiş verilerde gizli (istatistiksel) yapı bulma.

1
Uzak denetim: denetimli, yarı denetimli veya her ikisi mi?
"Uzaktan denetim", sınıflandırıcının zayıf etiketlenmiş eğitim seti (eğitim verileri sezgisel yöntemlere / kurallara göre otomatik olarak etiketlenir) verildiğinde öğrenildiği bir öğrenme programıdır. Etiketli verileri sezgisel / otomatik olarak etiketlenmişse, hem denetimli öğrenme hem de yarı denetimli öğrenmenin böyle bir "uzaktan denetim" içerebileceğini düşünüyorum. Ancak, bu sayfada , "uzaktan denetim", "yarı-denetimli …


4
Hiyerarşik Kümelenmenin dezavantajları nasıl anlaşılır?
Birisi Hiyerarşik Kümelenmenin artılarını ve eksilerini açıklayabilir mi? Hiyerarşik Kümeleme, K ile aynı dezavantajlara sahip mi? Hiyerarşik Kümelemenin K'ye göre avantajları nelerdir? H ortalamalarını Hiyerarşik Kümeleme üzerinde ne zaman kullanmalıyız? Bu yazının cevapları k'ın çok iyi olduğu dezavantajlarını açıklıyor. K-araçlarının dezavantajları nasıl anlaşılır

3
Negatif olmayan matris çarpanlarına ayırmada optimum sayıda gizli faktör nasıl seçilir?
Bir matris verilen Vm × nVm×n\mathbf V^{m \times n} , negatif olmayan matris çarpanlara (NMF), iki negatif olmayan matrisleri bulur Wm × kWm×k\mathbf W^{m \times k} ve 'Hk × nHk×n\mathbf H^{k \times n} (yani, tüm elemanları ile ≥ 0≥0\ge 0 ) halinde dekompoze olmuş matrisi temsil etmek: V ≈ G …

4
Degrade artırıcı makine doğruluğu, yineleme sayısı arttıkça azalır
Gradyan arttırıcı makine algoritmasını caretR'deki paket üzerinden deniyorum. Küçük bir kolej veri kümesi kullanarak, aşağıdaki kodu koştu: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 


3
Veri harmanlama nedir?
Bu terim, yöntemle ilgili iş parçacıklarında sıklıkla görülür . Is karıştırma veri madenciliği ve istatistik öğrenme belirli bir yöntem? Google'dan alakalı bir sonuç alamıyorum. Karıştırma, birçok modelin sonuçlarını karıştırıyor ve daha iyi bir sonuç veriyor. Bu konuda daha fazla bilgi edinmeme yardımcı olan herhangi bir kaynak var mı?

4
Yapay Sinir Ağı * nedir?
Biz eski defterleri gibi Sinir Ağları edebiyat, biz nöromorfik topolojileri ( "Sinir-Ağı" gibi bir mimariler) ile diğer yöntemleri tanımlamak için olsun. Ve Evrensel Yaklaşım Teoreminden bahsetmiyorum . Örnekler aşağıda verilmiştir. O zaman beni meraklandırıyor: Yapay bir Sinir Ağının tanımı nedir? Topolojisi her şeyi kapsar. Örnekler: Yaptığımız ilk kimliklerden biri, PCA …

4
Kümenin şekli nasıl ölçülür?
Bu sorunun iyi tanımlanmadığını biliyorum, ancak bazı kümeler eliptik olma eğilimindedir veya diğeri doğrusal olmayan şekillere sahipken (2D veya 3D örneklerde) düşük boyutlu uzayda yatar. Kümelerin doğrusal olmama (veya "şekil") ölçüsü var mı? 2B ve 3B alanda, herhangi bir kümenin şeklini görmek bir sorun değildir, ancak daha yüksek boyutlu alanlarda …

3
Sınıflandırma için T-SNE kullanarak hiperparametrelerin seçimi
Çalıştığım belirli bir problemde (bir yarışma) follwoing ayarına sahibim: 21 özellik ([0,1] üzerinde sayısal) ve bir ikili çıktı. Yaklaşık 100 K satırım var. Ayar çok gürültülü görünüyor. Ben ve diğer katılımcılar bir süreliğine özellik üretmeyi uyguluyoruz ve t-dağılmış stokastik komşu yerleştirme bu ortamda oldukça güçlü çıktı. "T-SNE Etkili Nasıl Kullanılır" …

4
K-ortalamaları veri kümesinin rasgele alt örnekleri aracılığıyla başlatmak?
Belirli bir veri kümem varsa, küme merkezlerini bu veri kümesinin rasgele örneklerini kullanarak başlatmak ne kadar akıllı olurdu? Örneğin, istediğimi varsayalım 5 clusters. Orijinal veri kümesinden 5 random samplessöz ediyorum size=20%. Daha sonra bu 5 rastgele örneğin her birini ortalayabilir ve bu araçları ilk 5 küme merkezim olarak kullanabilir miyim? …


4
Çapraz doğrulama ile temel gerçeği olmayan bir veri kümesinde farklı kümeleme yöntemlerini karşılaştırabilir misiniz?
Şu anda, temel gerçeği olmayan bir metin belgesi veri kümesini analiz etmeye çalışıyorum. Farklı kümeleme yöntemlerini karşılaştırmak için k-kat çapraz doğrulamayı kullanabileceğiniz söylendi. Ancak, geçmişte gördüğüm örnekler temel bir hakikat kullanır. Sonuçlarımı doğrulamak için bu veri kümesinde k-katlama araçlarını kullanmanın bir yolu var mı?

2
DDoS filtrelemesi için makine öğrenimi uygulama
In Stanford Yapay Öğrenme kursu Andrew Ng IT ML uygulayarak söz. Bir süre sonra sitemizde orta büyüklükte (yaklaşık 20 bin bot) DDoS aldığımda basit Sinir Ağı sınıflandırıcısını kullanarak buna karşı savaşmaya karar verdim. Bu python betiğini yaklaşık 30 dakika içinde yazdım: https://github.com/SaveTheRbtz/junk/tree/master/neural_networks_vs_ddos PyBrain kullanır ve ikisi Sinir Ağı'nı eğitmek için …

5
Nominal / dairesel değişkenler için SOM kümelemesi
Nominal girdileri kümelemeye aşina olup olmadığını merak etmek. SOM'a bir çözüm olarak bakıyordum ama görünüşe göre sadece sayısal özelliklerle çalışıyor. Kategorik özellikler için herhangi bir uzantı var mı? Özellikle 'Haftanın Günleri'ni olası bir özellik olarak merak ediyordum. Tabii ki bunu sayısal bir özelliğe dönüştürmek mümkündür (yani Mon - Sun, 1-7 …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.