Bir süredir Makine öğreniminde (aynı zamanda bazı istatistikler) yeni bir bilgim var (denetimli / denetimsiz öğrenme algoritmaları, ilgili optimizasyon yöntemleri, düzenlemeler, bazı felsefeler (önyargı-varyans ödünleşimi gibi?)). Gerçek bir uygulama olmadan, o makine öğrenimi öğelerini derinlemesine anlamayacağımı biliyorum.
Bu yüzden gerçek verilerle bazı sınıflandırma problemi ile başlıyorum, el yazısı rakam sınıflandırması (MNIST) diyorum. Şaşırtıcı bir şekilde, herhangi bir özellik öğrenme / mühendislik olmadan , doğruluk, girdi olarak ham piksel değerlerine sahip rastgele orman sınıflandırıcısını kullanarak 0.97'ye ulaşır. Ayrıca, parametrelerin ayarlandığı SVM, LR gibi diğer öğrenme algoritmalarını da denedim.
Sonra kayboldum, bu çok kolay mı yoksa burada bir şey mi eksik? Sadece araç setinden bir öğrenme algoritması seçin ve bazı parametreleri ayarlayın?
Eğer pratikte makine öğrenimi ile ilgili olsaydı, o zaman bu alana olan ilgimi kaybederdim. Birkaç gün boyunca bazı blogları düşündüm ve okudum ve bazı sonuçlara vardım:
Uygulamada makine öğrenmesinin en önemli kısmı özellik mühendisliğidir , yani veriler verildiğinde özelliklerin daha iyi temsil edilmesini öğrenir .
Hangi öğrenme algoritmasının kullanılacağı da önemlidir, ayrıca parametre ayarı, ancak son seçim daha çok deneyler ile ilgilidir.
Kimsenin beni düzeltebileceğini ve pratikte makine öğrenimi hakkında bana bazı önerilerde bulunabileceğini umarak doğru anladığımdan emin değilim.