2
Takviye öğrenimi ile robotu takip eden bir çizgi programlama
Takviye öğrenme algoritmaları kullanarak robotu takip eden bir çizgi programlamayı düşünüyorum. Üzerinde düşündüğüm soru, herhangi bir keyfi yolda gezinmeyi öğrenmek için algoritmayı nasıl alabilirim? Takviye öğrenimi için Sutton & Barto Kitabını takip ettikten sonra, araba acentesinde pistten çıkmamayı ve hızını düzenlememeyi öğrendiği bir yarış pisti içeren bir egzersiz problemini çözdüm. …