Takviye öğrenimi üzerine ders kitabı


12

Takviye öğreniminde bir ders kitabı / ders notları arıyorum. "İstatistiksel Öğrenmeye Giriş" e düşkünüm , ancak ne yazık ki bu konuyu kapsamıyor. Sutton ve Barto'nun bir kitabının standart bir referans olduğunu biliyorum ve belki de NDP de iyi ama 1997-98 tarihli ve bu alanın son zamanlarda oldukça fazla gelişmesi muhtemel olduğundan daha modern bir sergi bulmayı umuyordum. saati.

Yanıtlar:


15

Sutton ve Barto'nun hala standart olduğunu düşünüyorum. Çevrimiçi AI sınıflarından çok sayıda slayt destesi ve not var, ancak genellikle çok fazla ayrıntıya girmiyorlar.

Sutton ve Barto biraz eskidir, ancak ders kitaplarının 2. basımını hazırlıyorlar. Ocak 2018 tarihli bir taslak burada mevcuttur ; İlk baskının tam metnine de sahip olan Sutton'ın web sayfasından bağlantılıdır .

Kochenderfer ve arkadaşlarının Belirsizlik Altında Karar Verme ile mücadele etmeden önce buna bakardım . Bu kitap (çoğunlukla havacılıkta) bazı ilginç uygulamalara sahiptir, ancak hızla hareket eder ve çok fazla zıplar. Szepesvári Takviye Öğrenme Algoritmaları da iyi, ama özlü - yeni Sutton ve Barto'daki yedi bölüm ve 150 sayfaya kıyasla ulaşmak yaklaşık yirmi sayfa sürüyor .TD (λ)

Bunun dışında, bazı makalelere dalmayı deneyebilirsiniz - takviye öğrenme şeyleri oldukça erişilebilir olma eğilimindedir.


Teşekkürler, yeni sürüme bir göz attım, ancak çok güncel olduğunu söyleyemem. Hala daha güncel bir pozlama ile ilgileniyorum.
Ulysses

Evet, kesinlikle tam bir revizyon değil, ama Springer'in "Ders Notları" nın bazı ciltlerinin yanı sıra aslında sadece kağıt koleksiyonları olan başka hiçbir şey akla gelmiyor. Başka bir şey bulursanız, lütfen bir güncelleme gönderin; Kontrol etmek isterim.
Matt Krause

Anlıyorum, yapacağım
Ulysses

1
@CharlieParker, emin değilim. En son taslak (19 Haziran 2017) oldukça eksiksiz görünüyor ve MIT Press'ten bahsediyor, ancak MIT Press sitesi hala ilk baskıyı satıyor gibi görünüyor. Değeri için, taslak doğrudan yazarların genel web sitesinden, bu nedenle "sızdırılmış" bir versiyonun veya bunun gibi bir şeyin kullanılması konusunda endişelenmenize gerek yok.
Matt Krause

1
@Thomas, bağlantıyı daha yeni bir taslakla güncelledim.
Matt Krause


6

Burada bazı iyi ders kitaplarınız / referanslarınız var:

Klasik

Sutton RS, Barto AG. Takviye Öğrenimi: Giriş. Cambridge, Kütle: Bir Bradford Kitabı; 1998. 322 s.

İkinci baskı için taslak ücretsiz olarak kullanılabilir: https://webdocs.cs.ualberta.ca/~sutton/book/the-book.html

Russell / Norvig Bölüm 21:

Russell SJ, Norvig P, Davis E. Yapay zeka: modern bir yaklaşım. Yukarı Eyer Nehri, NJ: Prentice Hall; 2010.

Daha teknik

Szepesvári C. Takviye öğrenimi için algoritmalar. Yapay Zeka ve Makine Öğrenimi Sentezi Dersleri. 2010; 4 (1): 1-103. http://www.ualberta.ca/~szepesva/RLBook.html

Bertsekas DP. Dinamik Programlama ve Optimal Kontrol. 4. baskı. Belmont, Kütle: Athena Scientific; 2007. 1270 s. Bölüm 6, cilt 2 ücretsiz olarak kullanılabilir: http://web.mit.edu/dimitrib/www/dpchapter.pdf

Daha yeni gelişmeler için

Wiering M, van Otterlo M, editörler. Takviye Öğrenme. Berlin, Heidelberg: Springer Berlin Heidelberg; 2012 Erişim tarihi: http://link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ, Amato C, Chowdhary G, How JP, Reynolds HJD, Thornton JR, vd. Belirsizlik Altında Karar Verme: Teori ve Uygulama. 1 baskı. Cambridge, Massachusetts: MIT Yayınları; 2015. 352 s.

Çok ajanlı takviye öğrenimi

Buşoniu L, Babuška R, Schutter BD. Çok Etmenli Takviye Öğrenimi: Genel Bakış. İçinde: Srinivasan D, Jain LC, editörler. Çok Etmenli Sistemlerde Yenilikler ve Uygulamaları - 1. Springer Berlin Heidelberg; 2010 s. 183-221. Erişim : http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7

Schwartz HM. Çok etmenli makine öğrenimi: pekiştirme yaklaşımı. Hoboken, New Jersey: Wiley; 2014.

Videolar / Kurslar

Ayrıca YouTube'da David Silver kursunu öneririm: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.