Takviye Öğrenme ile İlgili Kitaplar


10

Takviyeli öğrenmeyi bir süredir anlamaya çalışıyorum, ancak bir şekilde bir ızgara dünya problemini çözmek için takviye öğrenimi için bir programın nasıl yazıldığını görselleştiremiyorum. Bana Takviye Öğrenimi konusunda net bir anlayış geliştirmeme yardımcı olacak bazı ders kitapları önerebilir misiniz?



Ayrıca openai bakın da temelde python Takviye Öğrenme öğrenmek için iyi bir yer
Vineet Kothari

Yanıtlar:


7

Takviye Öğrenimi ile ilgili bazı iyi referanslarınız var:

Klasik

Sutton RS, Barto AG. Takviye Öğrenimi: Giriş. Cambridge, Kütle: Bir Bradford Kitabı; 1998. 322 s.

İkinci baskı için taslak ücretsiz olarak kullanılabilir: http://incompleteideas.net/book/the-book-2nd.html

Russell / Norvig Bölüm 21:

Russell SJ, Norvig P, Davis E. Yapay zeka: modern bir yaklaşım. Yukarı Eyer Nehri, NJ: Prentice Hall; 2010.

Daha teknik

Szepesvári C. Takviye öğrenimi için algoritmalar. Yapay Zeka ve Makine Öğrenimi Sentezi Dersleri. 2010; 4 (1): 1-103. http://www.ualberta.ca/~szepesva/RLBook.html

Bertsekas DP. Dinamik Programlama ve Optimal Kontrol. 4. baskı. Belmont, Kütle: Athena Scientific; 2007. 1270 s. Bölüm 6, cilt 2 ücretsiz olarak kullanılabilir: http://web.mit.edu/dimitrib/www/dpchapter.pdf

Daha yeni gelişmeler için

Wiering M, van Otterlo M, editörler. Takviye Öğrenme. Berlin, Heidelberg: Springer Berlin Heidelberg; 2012 Erişim tarihi: http://link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ, Amato C, Chowdhary G, How JP, Reynolds HJD, Thornton JR, vd. Belirsizlik Altında Karar Verme: Teori ve Uygulama. 1 baskı. Cambridge, Massachusetts: MIT Yayınları; 2015. 352 s.

Çok ajanlı takviye öğrenimi

Buşoniu L, Babuška R, Schutter BD. Çok Etmenli Takviye Öğrenimi: Genel Bakış. İçinde: Srinivasan D, Jain LC, editörler. Çok Etmenli Sistemlerde Yenilikler ve Uygulamaları - 1. Springer Berlin Heidelberg; 2010 s. 183-221. Erişim : http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7

Schwartz HM. Çok etmenli makine öğrenimi: pekiştirme yaklaşımı. Hoboken, New Jersey: Wiley; 2014.

Videolar / Kurslar

Ayrıca YouTube'da David Silver kursunu öneririm: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa



4

Reinforcement Leraning'den çok hoşlandım : Richard Sutton'ın tanıtımı . En yeni yaklaşımlardan bahsetmese de, RL hakkında çok güzel bir birleştirici görüş sağlar (1998'den beri).


aslında bir kılavuz dünya sorun kalem ve kağıt üzerinde hesaplanarak çözülmesini görmek istedim, çünkü kavram anlayamıyorum sürece (özellikle değer yineleme)
kız101

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.