Bağlam: SysID ve ML'ye giren adamı kontrol eder.
Kullanıcı110686'nın cevabının bazı farklılıkları açıklamak için adil bir iş çıkardığını düşünüyorum . SysID zorunlu olarak giriş / çıkış verilerinden dinamik modellerle ilgilidir, oysa ML daha geniş bir problem sınıfını kapsar. Ama gördüğüm en büyük fark (a) bellek (parametre sayısı); (b) "öğrenilmiş" modelin son kullanımı. Sistem Tanımlama, frekans alanı gösterimleri, zaman-frekans analizi vb. Dikkate alınarak bir sinyal işleme yaklaşımıdır. Bazı ML üyeleri buna "özellik mühendisliği" adını verir.
(bir anı:SysID, bir araştırma alanı şekillendiğinden ML'den çok önce öne çıktı. Dolayısıyla istatistik ve sinyal işleme teorik temeller için temel dayanaktı ve hesaplama korkutucuydu. Bu nedenle, insanlar çok az sayıda parametreye sahip çok basit bir model sınıfıyla (Bias-Variance tradeoff) çalıştılar. İnsanların sorunun doğrusal olmadığını açıkça bildiği durumlarda bile en fazla 30-40 parametreden ve çoğunlukla doğrusal modellerden bahsediyoruz. Ancak, şimdi hesaplama çok ucuz ama SysID henüz kabuğundan çıkmadı. İnsanlar artık çok daha iyi sensörlere sahip olduğumuzu, çok zengin model setleriyle 1000 parametreyi kolayca tahmin edebileceğimizi fark etmeye başlamalıdır. Bazı araştırmacılar SysID için sinir ağlarını kullanmaya çalıştılar, ancak birçok teorik garanti olmadığı için birçoğu bunları "ana akım" olarak kabul etmekte isteksiz görünüyor.
(b) Öğrenilen modelin son kullanımı: Şimdi bu SysID'in çok doğru olduğu bir şey, ancak birçok ML algoritması yakalayamıyor. Hedef uygulamalar için, çevrimiçi optimizasyon için etkili bir şekilde kullanılabilecek modeller oluşturduğunuzun farkında olmanız önemlidir .Bu modeller, alınan herhangi bir kontrol kararını yaymak için kullanılacaktır ve bunu en uygun kontrol problemi olarak ayarlarken, modeller kısıtlama haline gelir. Bu nedenle, son derece karmaşık bir model yapısı kullanırken, çevrimiçi optimizasyonu çok daha zor hale getirir. Ayrıca, bu çevrimiçi kararların saniyeler veya daha kısa bir sürede alındığını unutmayın. Önerilen bir alternatif, en iyi kontrol için değer fonksiyonunu doğrudan politika dışı bir şekilde öğrenmektir. Bu temel olarak takviye öğrenmedir ve bence SysID ve RL arasında iyi bir sinerji vardır.