Makine öğrenimini keşfettiğim gibi farklı ilginç teknikler görüyorum:
- algoritmaları otomatik olarak
grid search
, - Daha doğru aynı "tip" farklı algoritmalar kombinasyonu ile sonuçlarını en olsun
boosting
, - O en, (algoritmaların fakat aynı tip) farklı algoritmalar kombinasyonu ile daha doğru sonuçlar elde
stacking
, - ve muhtemelen daha fazlasını keşfetmem gerek ...
Sorum şu: tüm bu parçalar var. Ancak bunları bir araya getirmek, temizlenmiş veri girişi olarak alan ve tüm tekniklerden en iyi şekilde yararlanarak iyi sonuçlar veren bir algoritma yapmak mümkün mü? (Elbette profesyonel bir veri bilimcisinden daha az verimli olacak, ama benden daha iyi olacak!) Evetse, örnek kodlarınız var mı veya bunu yapabilen çerçeveler biliyor musunuz?
EDIT: Bazı cevaplar sonra, bazı daralma yapılması gibi görünüyor. Bir örnek alalım, kategorik verilere sahip bir sütunumuz var, diyelim y
ve onu X
aptallar veya gerçek sayısal veriler (yükseklik, sıcaklık) olan sayısal verilerden tahmin etmek istiyoruz . Temizliğin daha önce yapıldığını varsayıyoruz. Bu tür verileri alıp tahmin çıkarabilecek mevcut bir algoritma var mı? (birden fazla algoritmayı test ederek, ayarlayarak, artırarak, vb.) Evet ise, hesaplama açısından verimli midir (hesaplamalar normal algoritmaya kıyasla makul bir sürede yapılıyor mu) ve bir kod örneğiniz var mı?
auto.arima
( forecast
kütüphaneden) insanlardan daha iyi olabilir - Rob Hyndman sunumlarında birkaç kez bahsetti. Bu nedenle, bazı "otomatik öğrenme" yöntemlerinin başarıyla uygulandığı alanlar vardır.