«machine-learning» etiketlenmiş sorular

Makine öğrenimi algoritmaları eğitim verilerinin bir modelini oluşturur. "Makine öğrenimi" terimi belirsiz bir şekilde tanımlanmıştır; istatistiksel öğrenme, takviye öğrenme, gözetimsiz öğrenme vb. olarak da adlandırılır. DAİMA DAHA ÖZEL BİR ETİKET EKLE.

4
ROC eğrilerinin avantajları
ROC eğrilerinin avantajları nelerdir? Örneğin, bir ikili sınıflandırma sorunu olan bazı görüntüleri sınıflandırıyorum. Yaklaşık 500 özellik çıkardım ve bir dizi özellik seçmek için bir özellik seçim algoritması uyguladım ve sonra sınıflandırma için SVM uyguladım. Bu durumda bir ROC eğrisini nasıl alabilirim? Özellik seçim algoritmamın eşik değerlerini değiştirmeli ve bir ROC …

1
Bir lmer modeli için hangi çoklu karşılaştırma yöntemi kullanılır: lsmeans veya glht?
Bir veri setini bir sabit efekt (durum) ve iki rastgele efekt (katılımcı konu tasarımı ve çifti nedeniyle katılımcı) ile karışık efektler modeli kullanarak analiz ediyorum. Model ile oluşturulan lme4paket: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Sonra, bu modelin sabit etki (durum) olmadan modele karşı bir olasılık oranı testi yaptım ve önemli bir farkım var. Veri …

1
Sınıflandırıcı ve model ve tahminci
Sınıflandırıcı, model ve kestirimci arasındaki fark nedir? Ne söyleyebilirim: bir tahminci regresyon algoritmasından elde edilen bir yordayıcıdır bir sınıflandırıcı, bir sınıflandırma algoritmasından bulunan bir yordayıcıdır bir model hem bir tahmin edici hem de bir sınıflandırıcı olabilir Ancak çevrimiçi görünmekten, bu tanımların karışık olabileceği anlaşılıyor. Peki, makine öğrenimi bağlamındaki gerçek tanımlar …

1
İki karar ağacının toplamı tek bir karar ağacına eşit mi?
İki regresyon ağaçları (ağaç A ve ağaç B) bu harita giriş olduğunu varsayalım çıkışına . Let ağaç A ve için ağaç B için her bir ağaç ayırma işlevleri gibi hiperdüzlemleri ile, ikili böler kullanır.x ∈ Rdx∈R,dx \in \mathbb{R}^dy^∈ Ry^∈R,\hat{y} \in \mathbb{R}y^= fbir( x )y^=fbir(x)\hat{y} = f_A(x)fB( x )fB(x)f_B(x) Şimdi, ağaç …

3
Küçük bir Doğrulama seti kullanabilir miyim?
Verileri bir Test kümesine ve Doğrulama kümesine bölmenin arkasındaki nedeni anlıyorum. Ayrımın büyüklüğünün duruma bağlı olacağını, ancak genellikle 50/50 ila 90/10 arasında değişeceğini de anlıyorum. Yazımı düzeltmek ve ~ 5m cümlelerden oluşan bir veri kümesiyle başlamak için bir RNN oluşturdum. 500k cümle tıraş ettim ve kalan ~ 4.5m cümle ile …

2
Beklenti Maksimizasyonu karışım modelleri için neden önemlidir?
Karışım modellerinde (Gauss Karışımı, Gizli Markov Modeli, vb.) Beklenen Maksimizasyon yöntemini vurgulayan birçok literatür vardır. EM neden önemlidir? EM, optimizasyon yapmanın bir yoludur ve degrade tabanlı yöntem (gradyan terbiyeli veya newton / yarı-newton yöntemi) veya BURADA tartışılan diğer gradyansız yöntem olarak yaygın olarak kullanılmaz . Buna ek olarak, EM'nin hala …


5
Bir regresyon modelini iyileştirmek için aykırı değerleri Ortalama Mutlak Hata kutu grafiğine göre düşürmek hile yapıyor mu?
Aşağıdaki kutu grafikte gördüğünüz gibi dört yöntemle test edilmiş bir tahmin modelim var. Modelin öngördüğü özellik 0-8 aralığındadır. Orada olduğunu fark edebilirsiniz biri üst sınır aykırı ve üç alt sınır aykırı tüm yöntemlerle gösterdi. Bu örnekleri verilerden kaldırmanın uygun olup olmadığını merak ediyorum. Yoksa bu tahmin modelini geliştirmek için bir …

4
Degrade artırıcı makine doğruluğu, yineleme sayısı arttıkça azalır
Gradyan arttırıcı makine algoritmasını caretR'deki paket üzerinden deniyorum. Küçük bir kolej veri kümesi kullanarak, aşağıdaki kodu koştu: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
İstatistiksel algoritma geliştirici adayları için iyi görüşme soruları nelerdir?
İstatistik / makine öğrenimi / veri madenciliği bağlamında algoritma geliştirici / araştırmacı pozisyonu için insanlarla röportaj yapıyorum. Özellikle bir adayın temel teoriye aşinalığını, anlayışını ve akışkanlığını, örneğin beklenti ve varyansın temel özellikleri, bazı yaygın dağılımları, vb. Belirlemek için sorulacak sorular arıyorum. Şu anki sorularım: " Tahmin etmek istediğimiz bilinmeyen bir …


3
Kneser-Ney yumuşatmada görünmeyen kelimeler nasıl ele alınır?
Gördüğüm kadarıyla, (ikinci dereceden) Kneser-Ney yumuşatma formülü şu ya da bu şekilde P2KN(wn|wn−1)=max{C(wn−1,wn)−D,0}∑w′C(wn−1,w′)+λ(wn−1)×Pcont(wn)PKN2(wn|wn−1)=max{C(wn−1,wn)−D,0}∑w′C(wn−1,w′)+λ(wn−1)×Pcont(wn) \begin{align} P^2_{KN}(w_n|w_{n-1}) &= \frac{\max \left\{ C\left(w_{n-1}, w_n\right) - D, 0\right\}}{\sum_{w'} C\left(w_{n-1}, w'\right)} + \lambda(w_{n-1}) \times P_{cont}(w_n) \end{align} normalize faktörü ile λ(wn−1)λ(wn−1)\lambda(w_{n-1}) olarak verilmiştir λ(wn−1)=D∑w′C(wn−1,w′)×N1+(wn−1∙)λ(wn−1)=D∑w′C(wn−1,w′)×N1+(wn−1∙) \begin{align} \lambda(w_{n-1}) &= \frac{D}{\sum_{w'} C\left(w_{n-1}, w'\right)} \times N_{1+}\left(w_{n-1}\bullet\right) \end{align} ve devam olasılığı Pcont(wn)Pcont(wn)P_{cont}(w_n) …

3
Dengesiz bir ortamda maliyete duyarlı öğrenme için öneriler
Birkaç milyon satır ve ~ 100 sütun içeren bir veri kümem var. Ortak bir sınıfa ait veri kümesindeki örneklerin yaklaşık% 1'ini tespit etmek istiyorum. Minimum hassasiyet kısıtlamam var, ancak çok asimetrik maliyet nedeniyle belirli bir geri çağırma konusunda çok hevesli değilim (10 olumlu maçla kalmadığım sürece!) Bu ortamda önerebileceğiniz bazı …


1
Gbm paketindeki çıktı terimlerinin anlamı nedir?
Sınıflandırma için gbm paketi kullanıyorum. Beklendiği gibi, sonuçlar iyi. Ama sınıflandırıcının çıktısını anlamaya çalışıyorum. Çıktıda beş terim vardır. `Iter TrainDeviance ValidDeviance StepSize Improve` Herkes her terimin anlamını, özellikle de Geliştir'in anlamını açıklayabilir mi ?

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.