Geçenlerde, UPC / Barselona'daki Profesör Oriol Pujol'den Makine Öğrenimi dersinde, geniş bir makine öğrenimi ile ilgili görev için kullanılacak en yaygın algoritmaları, prensipleri ve kavramları tanımladı. İşte onları sizinle paylaşıyorum ve size soruyorum:
- farklı makine öğrenimi ile ilgili problemlere ilişkin yaklaşımlar veya yöntemler ile eşleşen herhangi bir kapsamlı çerçeve var mı?
Basit bir Gaussian'ı nasıl öğrenirim? Olasılık, rasgele değişkenler, dağılımlar; tahmin, yakınsama ve asimptotik, güven aralığı.
Gauss'luların (MoG) bir karışımını nasıl öğrenirim? Olabilirlik, Beklenti-Maksimizasyon (EM); genelleme, model seçimi, çapraz doğrulama; k-aracı, gizli markov modelleri (HMM)
Herhangi bir yoğunluğu nasıl öğrenirim? Parametrik ve Parametrik olmayan kestirim, Sobolev ve diğer fonksiyonel uzaylar; 1, 2 hata; Çekirdek yoğunluğu kestirimi (KDE), optimal çekirdek, KDE teorisi
Sürekli bir değişkeni (regresyon) nasıl tahmin edebilirim? Doğrusal regresyon, düzenlileşme, sırt regresyonu ve LASSO; lokal doğrusal regresyon; koşullu yoğunluk kestirimi.
Kesikli değişkenleri nasıl sınıflandırabilirim (sınıflandırma)? Bayes sınıflandırıcısı, saf Bayes, üretici vs. ayrımcı; algılayıcı, ağırlık kaybı, doğrusal destek vektör makinesi; en yakın komşu sınıflandırıcı ve teorisi
Hangi kayıp fonksiyonunu kullanmalıyım? Maksimum olabilirlik tahmini teorisi; -1 -2 kestirim; Bayessian tahmini; minimax ve karar teorisi, Bayescilik ve sıklıkçılık
Hangi modeli kullanmalıyım? AIC ve BIC; Vapnik-Chervonenskis teorisi; çapraz doğrulama teorisi; önyükleme; Muhtemelen Yaklaşık Doğru (PAC) teorisi; Hoeffding kaynaklı sınırlar
Daha meraklı (birleşik) modelleri nasıl öğrenebilirim? Topluluk öğrenme teorisi; artırılması; torbalama; istif
Meraklısı (doğrusal olmayan) modelleri nasıl öğrenebilirim? Genelleştirilmiş doğrusal modeller, lojistik regresyon; Kolmogorov teoremi, genelleştirilmiş katkı modelleri; çekirdekleme, çekirdeklerin çoğaltılması Hilbert uzayları, doğrusal olmayan SVM, Gauss işleminde regresyon
Meraklısı (kompozisyon) modelleri nasıl öğrenebilirim? Özyinelemeli modeller, karar ağaçları, hiyerarşik kümeleme; sinir ağları, geri yayılım, derin inanç ağları; grafik modeller, HMM karışımları, koşullu rasgele alanlar, maksimum marjlı Markov ağları; log-doğrusal modeller; dilbilgisi
Özellikleri nasıl azaltır veya ilişkilendiririm? Özellik seçimi - boyutsallık azaltma, özellik seçimi için sarıcı yöntemler; nedensellik-korelasyon, kısmi korelasyon, Bayes net yapı öğrenmesi
Yeni özellikleri nasıl oluşturabilirim? temel bileşen analizi (PCA), bağımsız bileşen analizi (ICA), çok boyutlu ölçeklendirme, manifold öğrenme, denetimli boyutluluk azaltma, metrik öğrenme
Verileri nasıl azaltabilir veya ilişkilendirebilirim? Kümeleme, iki kümeleme, kısıtlı kümeleme; birleşme kuralları ve pazar sepeti analizi; sıralama / sıra regresyonu; bağlantı analizi; ilişkisel veri
Zaman serilerine nasıl davranırım? ARMA; Kalman filtresi ve stat-uzay modelleri, parçacık filtresi; fonksiyonel veri analizi; değişim noktası tespiti; zaman serileri için çapraz doğrulama
İdeal olmayan verileri nasıl ele alabilirim? değişken değişme; sınıf dengesizliği; eksik veriler, düzensiz örneklenmiş veriler, ölçüm hataları; anomali tespiti, sağlamlık
Parametreleri nasıl optimize ederim? Kısıtsız ve kısıtsız / Konveks optimizasyon, türevsiz yöntemler, birinci ve ikinci dereceden yöntemler, backfitting; doğal gradyan; bağlı optimizasyon ve EM
Doğrusal işlevleri nasıl optimize ederim? hesaplamalı doğrusal cebir, regresyon için matris inversiyonu, boyutsallığın azaltılması için tekil değer ayrışımı (SVD)
Kısıtlamalarla nasıl optimize edebilirim? Dışbükeylik, Lagrange çarpanları, Karush-Kuhn-Tucker koşulları, iç nokta yöntemleri, SVM için SMO algoritması
Derin iç içe toplamları nasıl değerlendirebilirim? Tam grafik model çıkarımı, toplamlar üzerinde değişken sınırlar, yaklaşık grafik model çıkarımı, beklenti yayılımı
Büyük miktarları ve aramaları nasıl değerlendirebilirim? Genelleştirilmiş N-vücut problemleri (GSMH), hiyerarşik veri yapıları, en yakın komşu araştırması, hızlı çoklu yöntem; Monte Carlo entegrasyonu, Markov Zinciri Monte Carlo, Monte Carlo SVD
Daha büyük problemleri nasıl tedavi edebilirim? Paralel / dağıtılmış EM, paralel / dağıtılmış GSMH; Stokastik yeraltı yöntemleri, çevrimiçi öğrenme
Tüm bunları gerçek dünyada nasıl uygularım? ML'nin bölümlerine genel bakış, her görev için kullanılacak yöntemler, ön bilgi ve varsayımlar; keşifsel veri analizi ve bilgi görselleştirmesi; değerlendirme ve yorumlama, güven aralıkları ve hipotez testi, ROC eğrileri kullanılarak; ML'deki araştırma problemleri nerede