«machine-learning» etiketlenmiş sorular

Makine öğrenimi algoritmaları eğitim verilerinin bir modelini oluşturur. "Makine öğrenimi" terimi belirsiz bir şekilde tanımlanmıştır; istatistiksel öğrenme, takviye öğrenme, gözetimsiz öğrenme vb. olarak da adlandırılır. DAİMA DAHA ÖZEL BİR ETİKET EKLE.

2
Pretraining nedir ve sinir ağı nasıl pretrain?
Ön eğitimin konvansiyonel eğitim ile ilgili bazı sorunlardan kaçınmak için kullanıldığını anlıyorum. Ben bir otoencoder ile backpropagation kullanırsanız, backpropagation yavaş olduğu için zaman sorunları ile karşılaşacağımı biliyorum ve ayrıca yerel optima sıkışmış olabilir ve bazı özellikleri öğrenmek değil. Anlamadığım şey, bir ağı nasıl önişlediğimiz ve ön işlem yapmak için özel …

1
VC-k-en yakın komşusunun boyutu
K kullanılan eğitim noktası sayısına eşitse k en yakın komşu algoritmasının VC-Boyutu nedir? Bağlam: Bu soru, aldığım bir derste sorulmuştur ve verilen cevap 0'dır. Ancak, bunun neden böyle olduğunu anlamıyorum. Sezgim, VC-Boyutunun 1 olması gerektiğidir, çünkü her model ilk modele göre bir sınıfa ve başka bir sınıfa ait olarak etiketlenecek …

3
Times serisi analizi mi, makine öğrenmesi mi?
Sadece genel bir soru. Zaman serisi verileriniz varsa, zaman serisi tekniklerini (aka, ARCH, GARCH, vb.) Makine / istatistiksel öğrenme teknikleri (KNN, regresyon) üzerinde ne zaman kullanmak daha iyidir? Çapraz onaylanmış benzer bir soru varsa, lütfen bana doğru yönlendirin - baktım ve bulamadık.

2
Küçük örneklem büyüklüğü verileri için eğitim, çapraz doğrulama ve test seti boyutları nasıl seçilir?
Küçük bir örnek boyutum olduğunu varsayalım, örneğin N = 100 ve iki sınıf. Makine öğrenimi için eğitim, çapraz doğrulama ve test seti boyutlarını nasıl seçmeliyim? Sezgisel olarak seçerdim Eğitim seti boyutu 50 Çapraz doğrulama seti boyutu 25 ve Boyutu 25 olarak test edin. Ama muhtemelen bu az ya da çok …


2
Bileşen sayısını seçmek için PCA uyumunun kalitesini değerlendirmek için iyi metrikler nelerdir?
Temel bileşen analizinin (PCA) kalitesini değerlendirmek için iyi bir ölçüm nedir? Bu algoritmayı veri kümesinde gerçekleştirdim. Amacım özellik sayısını azaltmaktı (bilgi çok gereksizdi). Tutulan varyans yüzdesinin ne kadar bilgi tuttuğumuzun iyi bir göstergesi olduğunu biliyorum, gereksiz bilgileri kaldırdığımı ve bu tür bilgileri 'kaybetmediğimden emin olmak için kullanabileceğim başka bilgi metrikleri …

2
Anomali tespiti: hangi algoritmayı kullanmalı?
Bağlam: Yazım hatası olabilecek mantıksız verileri filtrelemek için klinik verileri analiz eden bir sistem geliştiriyorum. Şimdiye kadar ne yaptım: Akla yatkınlığı ölçmek için şimdiye kadar denediğim veriyi normalleştirmek ve sonra D setindeki bilinen veri noktalarına olan uzaklığına bağlı olarak p noktası için bir güvenilirlik değeri hesaplamaktı (= eğitim seti): plausibility(p)=∑q∈DGauss(distance(p,q))plausibility(p)=∑q∈DGauss(distance(p,q))\text{plausibility}(p)=\sum_{q\in …

1
Bir regresyon modelinin performansını eğitim ve test setlerini kullanarak mı değerlendiriyorsunuz?
Sıklıkla bir test modelini uzatarak ve eğitim setinde bir model eğiterek bir sınıflandırma modelinin performansını değerlendirmeyi duyarım. Daha sonra biri tahmin edilen değerler ve diğeri gerçek değerler için olmak üzere 2 vektör oluşturuldu. Açıkçası bir karşılaştırma yapmak, kişinin F-Skoru, Kappa İstatistiği, Hassasiyet ve Geri Çağırma, ROC eğrileri vb. Bu, regresyon …

1
Sağkalım analizi için CPH, hızlandırılmış başarısızlık süresi modeli veya sinir ağlarının karşılaştırılması
Hayatta kalma analizinde yeniyim ve yakın zamanda bunu belirli bir amaç doğrultusunda yapmanın farklı yolları olduğunu öğrendim. Bu yöntemlerin gerçek uygulaması ve uygunluğu ile ilgileniyorum. Zaman, statü ve diğer tıbbi veriler göz önüne alındığında bir hastanın hayatta kalması için yöntemler olarak geleneksel Cox Orantılı Tehlikeler , Hızlandırılmış başarısızlık süresi modelleri …

2
koşullu bağımsızlık ve grafiksel gösterimi hakkında
Kovaryans seçimini incelerken, bir keresinde aşağıdaki örneği okudum. Aşağıdaki modele göre: Kovaryans matrisi ve ters kovaryans matrisi aşağıdaki gibi verilir, Burada ve bağımsızlığına neden ters kovaryans tarafından karar verildiğini anlamıyorum ?yxxxyyy Bu ilişkinin altında yatan matematiksel mantık nedir? Ayrıca, aşağıdaki şekilde sol grafiğin ve arasındaki bağımsızlık ilişkisini yakaladığı iddia edilmektedir …

1
Hangi uygulamalarda karar ağacı değişkeni (özellik) ölçeklemesi ve değişken (özellik) normalizasyonu (ayarlama) gerekir?
Birçok makine öğrenme algoritmaları, özellik ölçekleme (aka değişken ölçekleme, normalizasyon) olarak adım prepocessing ortak olan özellik Ölçekleme - Wikipedia - Bu soru yakın Soru # 41704 - Nasıl ve neden normalleştirme ve özellik ölçeklendirme çalışır? Karar Ağaçları ile ilgili iki sorum var: Özellik ölçeklendirmesi gerektiren herhangi bir karar ağacı uygulaması …

6
Makine öğreniminde esnek ve esnek olmayan modeller
Esnek modellerin (yani splineların) esnek olmayan modellerin (örn. Doğrusal regresyon) farklı senaryolarda karşılaştırılmasıyla ilgili basit bir soru ile karşılaştım. Soru: Genel olarak, esnek bir istatistiksel öğrenme yönteminin performansının aşağıdaki durumlarda esnek olmayan bir yöntemden daha iyi veya kötü performans göstermesini bekleriz: belirteçlerinin sayısı son derece fazladır ve gözlem sayısı azdır? …

4
Sinir ağı ağırlıklarının yakınsaması
Sinir Ağımın ağırlıklarının 500 tekrardan sonra bile yakınsamadığı bir duruma geldim. Sinir ağım 1 Giriş katmanı, 1 Gizli katman ve 1 Çıkış Katmanı içeriyor. Bunlar giriş katmanında yaklaşık 230, gizli katmanda 9 düğüm ve çıkış katmanında 1 çıkış düğümüdür. Erken durdurma koşulu yaparsam bilmek istedim (100 yinelemeden sonra sinir ağı …

1
ARIMA modelimdeki gözlem 48'e yenilikçi bir aykırı değeri nasıl dahil edebilirim?
Bir veri kümesi üzerinde çalışıyorum. Bazı model tanımlama tekniklerini kullandıktan sonra bir ARIMA (0,2,1) modeliyle çıktım. Orijinal veri setimin 48. gözleminde yenilikçi bir aykırı değer (IO) tespit etmek için R'deki detectIOpaketteki işlevi kullandım .TSA Öngörme amacıyla kullanabilmem için bu aykırı değeri modelime nasıl dahil edebilirim? ARIMAX modelini kullanmak istemiyorum çünkü …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

3
Nüfus r-kare değişiminde güven aralığı nasıl elde edilir
Basit bir örnek uğruna iki doğrusal regresyon modeli olduğunu varsayalım. Model 1 sahiptir üç belirleyicileri x1a, x2bvex2c Model 2, model 1'den üç öngörücüye ve iki ek öngörücüye sahiptir x2avex2b Kitle varyansı olduğu açıklanmıştır nüfus regresyon denklemi vardır Model 1 için ve Model 2 için artan varyans nüfus içinde Model 2 …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.