«machine-learning» etiketlenmiş sorular

Makine öğrenimi algoritmaları eğitim verilerinin bir modelini oluşturur. "Makine öğrenimi" terimi belirsiz bir şekilde tanımlanmıştır; istatistiksel öğrenme, takviye öğrenme, gözetimsiz öğrenme vb. olarak da adlandırılır. DAİMA DAHA ÖZEL BİR ETİKET EKLE.

2
İlişkisel verilerden öğrenme
Ayarlar Birçok algoritma tek bir ilişki veya tablo üzerinde çalışırken, gerçek dünyadaki birçok veritabanı bilgileri birden çok tabloda depolar (Domingos, 2003). Question Ne tür algoritmalar çoklu (ilişkisel) tablolardan iyi öğrenir. Özellikle, regresyon ve sınıflandırma görevleri için geçerli olan algoritmalarla ilgileniyorum (ağ analizine yönelik olanlar değil, örneğin bağlantı tahmini). Aşağıda listelenen …

1
LSA ve pLSA arasında bir parellel
PLSA'nın orijinal makalesinde yazar Thomas Hoffman, sizinle tartışmak istediğim pLSA ve LSA veri yapıları arasında bir paralellik çiziyor. Arka fon: İlham alarak bir Bilgi Edinme biz bir koleksiyon olduğunu varsayın belgelerin ve bir kelime açısındanNNND={d1,d2,....,dN}D={d1,d2,....,dN}D = \lbrace d_1, d_2, ...., d_N \rbraceMMMΩ={ω1,ω2,...,ωM}Ω={ω1,ω2,...,ωM}\Omega = \lbrace \omega_1, \omega_2, ..., \omega_M \rbrace Bir …

5
Ön düzelme daha iyi bir öngörücü model oluşturmaya yardımcı olur mu?
Yayık modelleme görevi için şunları düşünüyordum: Veriler için k kümelerini hesaplama Her küme için ayrı ayrı k modelleri oluşturun. Bunun mantığı, kanıtlayacak hiçbir şeyin olmaması, alt kuruluşların nüfusunun homojen olmasıdır, bu nedenle veri üreten sürecin farklı "gruplar" için farklı olabileceğini varsaymak mantıklıdır. Sorum şu, bu uygun bir yöntem mi? Herhangi …


1
Gözlenen ve beklenen olayları nasıl karşılaştırırım?
Diyelim ki 4 olası olayın sıklık örneğine sahibim: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 ve olaylarımın gerçekleşmesi için beklenen olasılıklarım var: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Dört olayın gözlemlenen frekanslarının toplamı ile (18) Olayların beklenen frekanslarını hesaplayabilir …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

2
NN mimarisini dinamik olarak ayarlamak: gereksiz olanı icat etmek?
Doktora yolculuğuma başlıyorum ve kendimden önce belirlediğim nihai hedef, çalıştıkları ortamı izleyecek ve mimarilerini eldeki soruna dinamik olarak ayarlayacak YSA'lar geliştiriyor. Açık olan sonuç verinin zamansallığıdır: eğer veri seti sürekli değilse ve zamanla değişmezse, neden hiç ayarlama yapmıyorsunuz? Büyük soru şudur: derin öğrenmenin son zamanlarda artmasıyla birlikte, hala ilgili bir …

2
Karışık modeller için parametrik, yarı parametrik ve parametrik olmayan önyükleme
Bu makaleden aşağıdaki greftler alınmıştır . Ben bootstrap için acemi ve R bootpaket ile doğrusal karışık model için parametrik, yarı parametrik ve parametrik olmayan bootstrapping bootstrapping uygulamaya çalışıyorum . R Kodu İşte benim Rkod: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

3
Bir veri kümesinde beklenen en iyi performans
Diyelim ki bir sınıflandırma gibi basit bir makine öğrenme problemim var. Görme veya ses tanıma konusunda bazı ölçütlerle, ben, bir insan olarak, çok iyi bir sınıflandırıcıyız. Bu nedenle bir sınıflandırıcının ne kadar iyi olabileceğine dair bir sezgim var. Ancak çok fazla veriyle bir nokta, eğittiğim sınıflandırıcının ne kadar iyi olduğunu …

1
Bir baskın yordayıcı ile sınıflandırma
Bir (kkk-sınıf) sınıflandırma problemi, bir tanesi diğerlerinden çok daha fazla açıklayıcı güce sahip gibi görünen 100 gerçek değerli tahminci sırasına göre. Diğer değişkenlerin etkilerini derinleştirmek istiyorum. Bununla birlikte, standart makine öğrenme teknikleri (rastgele ormanlar, SVM'ler, vb.) Bir güçlü öngörücü tarafından gömülüyor ve bana diğerleri hakkında çok ilginç bilgi vermiyor. Eğer …

2
Duygu analizini anlama ve uygulama
Bana bazı belge koleksiyonları için duyarlılık analizi yürütme projesi atanmıştı. Googling ile, duygularla ilgili birçok araştırma ortaya çıktı. Sorularım: Makine öğrenimi ve istatistiksel analiz alanında duyarlılık analizi için başlıca yöntemler / algoritmalar nelerdir? İyi belirlenmiş sonuçlar var mı? Duygu analizini gerçekleştirebilecek herhangi bir açık kaynaklı yazılım var mı?

2
SVM giriş değişkenleri için R'de genetik algoritma değişken seçimi nasıl yapılır?
Bazı verileri sınıflandırmak için bir SVM oluşturmak için R kernlab paketini kullanıyorum . SVM, iyi bir doğruluk 'tahminleri' sağlaması açısından iyi çalışıyor, ancak giriş değişkenleri listem istediğimden daha büyük ve farklı değişkenlerin göreceli önemi konusunda emin değilim. En iyi eğitimli / en uygun SVM üreten girdi değişkenlerinin alt kümesini seçmek …

2
Sınıflandırma için eğitim setinden kopyaları kaldırın
Diyelim ki bir sınıflandırma problemi için birkaç satırım var: X1, . . .XN-, YX1,...XN,YX_1, ... X_N, Y Nerede X1, . . . ,XN-X1,...,XNX_1, ..., X_N özellikler / öngörücüler ve YYY satırın özellik kombinasyonunun ait olduğu sınıftır. Birçok özellik kombinasyonu ve sınıfları bir sınıflandırıcı sığdırmak için kullandığım veri kümesinde tekrarlanır. Ben …

1
Mevcut çok girişli maksimum entropi sınıflandırıcısından maksimum entropi Markov modeli oluşturma
Bir Maksimum Entropi Markov Modeli (MEMM) kavramı ile ilgileniyorum ve bunu Konuşma Parçası (POS) etiketleyici için kullanmayı düşünüyorum. Şu anda, her bir kelimeyi etiketlemek için geleneksel bir Maksimum Entropi (ME) sınıflandırıcısı kullanıyorum. Bu, önceki iki etiket de dahil olmak üzere bir dizi özellik kullanır. MEMM'ler, Viterbi algoritmasını Markov Zinciri boyunca …

1
PCA vs. LSA / LSI ne zaman seçilmeli
Soru: PCA'nın LSA / LSI'ya uygulanması arasında karar vermek için kullanılabilecek giriş veri özellikleri ile ilgili genel yönergeler var mı? PCA ve LSA / LSI hakkında kısa özet: İlke Bileşen Analizi (PCA) ve Gizli Semantik Analiz (LSA) veya Gizli Semantik İndeksleme (LSI), hepsinin temel olarak Tekil Değer Ayrıştırma'nın (SVD) bir …

1
SVM ile dengesiz çok sınıflı veri kümesini ele almanın en iyi yolu
Ben dengesiz veri SVMs ile bir tahmin modeli oluşturmak için çalışıyorum. Etiketlerim / çıktımın pozitif, nötr ve negatif olmak üzere üç sınıfı var. Olumlu örneğin verilerimin yaklaşık% 10-20'sini, nötr yaklaşık% 50-60'ını ve negatif yaklaşık% 30-40'ını oluşturduğunu söyleyebilirim. Sınıflar arasında yanlış tahminlerle ilişkili maliyet aynı olmadığı için sınıfları dengelemeye çalışıyorum. Bir …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.