Takviye Öğrenme ile İlgili Kitaplar

10

Takviyeli öğrenmeyi bir süredir anlamaya çalışıyorum, ancak bir şekilde bir ızgara dünya problemini çözmek için takviye öğrenimi için bir programın nasıl yazıldığını görselleştiremiyorum. Bana Takviye Öğrenimi konusunda net bir anlayış geliştirmeme yardımcı olacak bazı ders kitapları önerebilir misiniz?

machine-learning books reinforcement-learning

— girl101
kaynak

stats.stackexchange.com/questions/130130/…

— Anton Tarasenko

Ayrıca openai bakın da temelde python Takviye Öğrenme öğrenmek için iyi bir yer

— Vineet Kothari

7

Takviye Öğrenimi ile ilgili bazı iyi referanslarınız var:

Klasik

Sutton RS, Barto AG. Takviye Öğrenimi: Giriş. Cambridge, Kütle: Bir Bradford Kitabı; 1998. 322 s.

İkinci baskı için taslak ücretsiz olarak kullanılabilir: http://incompleteideas.net/book/the-book-2nd.html

Russell / Norvig Bölüm 21:

Russell SJ, Norvig P, Davis E. Yapay zeka: modern bir yaklaşım. Yukarı Eyer Nehri, NJ: Prentice Hall; 2010.

Daha teknik

Szepesvári C. Takviye öğrenimi için algoritmalar. Yapay Zeka ve Makine Öğrenimi Sentezi Dersleri. 2010; 4 (1): 1-103. http://www.ualberta.ca/~szepesva/RLBook.html

Bertsekas DP. Dinamik Programlama ve Optimal Kontrol. 4. baskı. Belmont, Kütle: Athena Scientific; 2007. 1270 s. Bölüm 6, cilt 2 ücretsiz olarak kullanılabilir: http://web.mit.edu/dimitrib/www/dpchapter.pdf

Daha yeni gelişmeler için

Wiering M, van Otterlo M, editörler. Takviye Öğrenme. Berlin, Heidelberg: Springer Berlin Heidelberg; 2012 Erişim tarihi: http://link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ, Amato C, Chowdhary G, How JP, Reynolds HJD, Thornton JR, vd. Belirsizlik Altında Karar Verme: Teori ve Uygulama. 1 baskı. Cambridge, Massachusetts: MIT Yayınları; 2015. 352 s.

Çok ajanlı takviye öğrenimi

Buşoniu L, Babuška R, Schutter BD. Çok Etmenli Takviye Öğrenimi: Genel Bakış. İçinde: Srinivasan D, Jain LC, editörler. Çok Etmenli Sistemlerde Yenilikler ve Uygulamaları - 1. Springer Berlin Heidelberg; 2010 s. 183-221. Erişim : http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7

Schwartz HM. Çok etmenli makine öğrenimi: pekiştirme yaklaşımı. Hoboken, New Jersey: Wiley; 2014.

Videolar / Kurslar

Ayrıca YouTube'da David Silver kursunu öneririm: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa

— Juan Leni
kaynak

7

Udacity'nin Takviye Öğrenimi hakkında ücretsiz bir çevrimiçi kurs var. Kontrol: Makine Öğrenimi: Takviye Öğrenimi

— Sreejithc321
kaynak

Bir grid dünya probleminin bu dersin bir parçası olarak sunulduğunu belirtmek gerekir.

— Neil Slater

evet, gördüm, ama aynı kod için yeterli değil

— girl101

4

Reinforcement Leraning'den çok hoşlandım : Richard Sutton'ın tanıtımı . En yeni yaklaşımlardan bahsetmese de, RL hakkında çok güzel bir birleştirici görüş sağlar (1998'den beri).

— Martin Modrák
kaynak

aslında bir kılavuz dünya sorun kalem ve kağıt üzerinde hesaplanarak çözülmesini görmek istedim, çünkü kavram anlayamıyorum sürece (özellikle değer yineleme)

— kız101

1

Kitabımı kontrol edebilirsiniz - Python ile Uygulamalı Takviye Öğrenimi , sıfırdan gelişmiş teknoloji derin takviye öğrenme algoritmalarına kadar güçlendirici öğrenmeyi açıklar.

Açıklama ile birlikte tüm kod benim github repo zaten mevcuttur. https://github.com/sudharsan13296/Hands-On-Reinforcement-Learning-With-Python

— Sudharsan
kaynak