1
Takviye Öğrenmeyi PID Kontrolüne karşı ne zaman kullanmalıyım?
OpenAIGym'deki Lunar Lander gibi sorunlara çözüm tasarlarken , Takviye Öğrenme, acenteye başarılı bir şekilde inmek için yeterli eylem kontrolü sağlamanın cazip bir yoludur. Ancak, PID kontrolörleri gibi kontrol sistemi algoritmalarının Takviye Öğrenme'den daha iyi olmasa da yeterli bir iş yapacağı durumlar nelerdir? Gibi sorular bu bir bu soruya teorisini ele …