«machine-learning» etiketlenmiş sorular

Makine öğrenimi algoritmaları eğitim verilerinin bir modelini oluşturur. "Makine öğrenimi" terimi belirsiz bir şekilde tanımlanmıştır; istatistiksel öğrenme, takviye öğrenme, gözetimsiz öğrenme vb. olarak da adlandırılır. DAİMA DAHA ÖZEL BİR ETİKET EKLE.


3
Çok büyük bir veri kümesinden önemli değişkenler nasıl hızlı bir şekilde seçilir?
Yaklaşık 2.000 ikili değişken / 200.000 satır içeren bir veri kümesi var ve tek bir ikili bağımlı değişken tahmin etmeye çalışıyorum. Bu aşamadaki ana amacım tahmin doğruluğu elde etmek değil, bu değişkenlerden hangisinin önemli yordayıcılar olduğunu tanımlamaktır. Son modelimdeki değişken sayısını yaklaşık 100'e düşürmek istiyorum. En önemli değişkenleri elde etmenin …

6
Zaman serilerinde kararlılık testi
Belirli bir zaman serisi dengelendiğinde test için standart (veya en iyi) bir yöntem var mı? Biraz motivasyon Bir değer veren stokastik bir dinamik sistemim var xtxtx_t her seferinde t ∈ Nt∈Nt \in \mathbb{N}. Bu sistem zaman adımına kadar bazı geçici davranışlara sahiptirt*t∗t^* ve sonra ortalama bir değer etrafında stabilize olur …

1
En az açı regresyonu korelasyonları monoton olarak azaltıyor ve bağlı tutuyor mu?
En az açı regresyonu (LAR) için bir problem çözmeye çalışıyorum. Bu sorunun 3,23 sayfada 97 arasında Hastie vd., İstatistiksel Öğrenme Unsurları, 2. ed. (5. baskı) . Tüm değişkenler ve cevap ortalama sıfır ve standart sapma bir olan bir regresyon problemi düşünün. Ayrıca her değişkenin yanıtla aynı mutlak korelasyona sahip olduğunu …

2
Veriler için ROC eğrisini hesapla
Bu yüzden, Hamming Distance kullanarak biyometrik özellikteki bir kişinin kimliğini doğrulamaya çalıştığım 16 denemem var. Eşik değer 3,5'e ayarlandı. Verilerim aşağıda ve yalnızca deneme 1 Gerçek Olumludur: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

1
Hiyerarşik Güçlendirme Görevinin Yapısını Öğrenme
Hiyerarşik pekiştirme öğrenme problemleri üzerinde çalışıyorum ve birçok makale bir politikayı öğrenmek için algoritmalar önerirken, hepsi de etki alanındaki eylemlerin hiyerarşisini tanımlayan bir grafik yapısını önceden bildiklerini varsayıyorlar. Örneğin, Dietterich'in Hiyerarşik Takviye Öğrenmesi için MAXQ Yöntemi, basit bir Taksi alanı için bir eylemler ve alt görevler grafiğini tanımlar, ancak bu …

2
Çapraz doğrulama uygulaması sonuçlarını etkiler mi?
Bildiğiniz gibi, iki popüler çapraz doğrulama türü vardır: K-katlama ve rastgele alt örnekleme ( Wikipedia'da açıklandığı gibi ). Bununla birlikte, bazı araştırmacıların K-katlamalı CV olarak tanımlanan bir şeyin gerçekten rastgele bir alt örnekleme olduğu kağıtları hazırladığını ve yayınladığını biliyorum, bu yüzden pratikte okuduğunuz makalede gerçekten ne olduğunu asla bilemezsiniz. Genellikle …

4
Model uydurma / eğitim ve validasyon için kullanılan örnek verilerin oranının hesaplanması
Verileri tahmin etmek için kullanmayı planladığım bir örnek boyut "N" sağladı. Verileri alt bölümlere ayırmanın bazı yolları nelerdir? Bunun siyah-beyaz bir cevabı olmadığını biliyorum, ama bazı "başparmak kuralları" veya genellikle kullanılan oranları bilmek ilginç olurdu. Üniversitemizden biliyorum, profesörlerimizden biri eskiden% 60 model söyler ve% 40 geçer.

1
Naive Bayes ile Tekrarlayan Sinir Ağı (LSTM) arasındaki fark
Ben metin üzerinde duygu analizi yapmak istiyorum, bazı makaleler geçti, bazıları "Naive Bayes" kullanıyor ve diğer "Tekrarlayan Sinir Ağı (LSTM)" , öte yandan duygu analizi için bir python kütüphanesi gördüm nltk. "Naive Bayes" kullanır Herkes ikisini kullanma arasındaki farkın ne olduğunu açıklayabilir? Ben de bu yazıdan geçtim ama ikisi hakkında …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.