Burada bazı iyi ders kitaplarınız / referanslarınız var:
Klasik
Sutton RS, Barto AG. Takviye Öğrenimi: Giriş. Cambridge, Kütle: Bir Bradford Kitabı; 1998. 322 s.
İkinci baskı için taslak ücretsiz olarak kullanılabilir: https://webdocs.cs.ualberta.ca/~sutton/book/the-book.html
Russell / Norvig Bölüm 21:
Russell SJ, Norvig P, Davis E. Yapay zeka: modern bir yaklaşım. Yukarı Eyer Nehri, NJ: Prentice Hall; 2010.
Daha teknik
Szepesvári C. Takviye öğrenimi için algoritmalar. Yapay Zeka ve Makine Öğrenimi Sentezi Dersleri. 2010; 4 (1): 1-103. http://www.ualberta.ca/~szepesva/RLBook.html
Bertsekas DP. Dinamik Programlama ve Optimal Kontrol. 4. baskı. Belmont, Kütle: Athena Scientific; 2007. 1270 s.
Bölüm 6, cilt 2 ücretsiz olarak kullanılabilir: http://web.mit.edu/dimitrib/www/dpchapter.pdf
Daha yeni gelişmeler için
Wiering M, van Otterlo M, editörler. Takviye Öğrenme. Berlin, Heidelberg: Springer Berlin Heidelberg; 2012 Erişim tarihi: http://link.springer.com/10.1007/978-3-642-27645-3
Kochenderfer MJ, Amato C, Chowdhary G, How JP, Reynolds HJD, Thornton JR, vd. Belirsizlik Altında Karar Verme: Teori ve Uygulama. 1 baskı. Cambridge, Massachusetts: MIT Yayınları; 2015. 352 s.
Çok ajanlı takviye öğrenimi
Buşoniu L, Babuška R, Schutter BD. Çok Etmenli Takviye Öğrenimi: Genel Bakış. İçinde: Srinivasan D, Jain LC, editörler. Çok Etmenli Sistemlerde Yenilikler ve Uygulamaları - 1. Springer Berlin Heidelberg; 2010 s. 183-221. Erişim : http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7
Schwartz HM. Çok etmenli makine öğrenimi: pekiştirme yaklaşımı. Hoboken, New Jersey: Wiley; 2014.
Videolar / Kurslar
Ayrıca YouTube'da David Silver kursunu öneririm: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa