Sinir ağlarının * teorisi * ders kitabı / ML algoritmaları?


23

Şimdiye kadar gördüğüm her kitapta ML algoritmaları ve bunların nasıl uygulanacağı açıklanmaktadır.

Ayrıca bu algoritmaların davranışları için teoremler ve kanıtlar oluşturan bir ders kitabı var mı? örneğin , gradyan iniş koşulları altında daima yol açacağını belirtmek ?x,y,zbir,B,C


1
Burada soruma dair birkaç öneri var . Özellikle de cevabımda tavsiye ettiğim kitabın tadını çıkarabilirsiniz.
Jack M,

Çoğu optimizasyon ders kitabı, optimizasyon algoritmaları için yakınsama kanıtları sağlar. (Bu yakınsama teoremlerinin hipotezlerinin, algoritmamızın birleşmesi garanti edildiğine dair kesin bir sonuç çıkarmadan önce tatmin olduğunu dikkatlice kontrol etmemiz gerekir.)
littleO

Yanıtlar:


16

Makine Öğreniminin Temelleri, Mehryar Mohri, Afşin Rostamizadeh ve Ameet Talwalkar tarafından 2012 yılında makine öğrenmesi teorisi üzerine bir kitap.

Makine Öğrenimini Anlama: Teoriden Algoritmalara , Shai Shalev-Shwartz ve Shai Ben-David tarafından, çok iyi tanınan ve Mohri / Rostamizadeh / Talwalkar'dan biraz daha tanıtım niteliğinde olan, ancak hala pek çok teoride sahip olan benzer bir 2014 kitabıdır. o. İnternette serbestçe kullanılabilir.

Sinir Ağı Öğrenimi: Martin Anthony ve Peter Bartlett tarafından yayınlanan Teorik Temeller , sinir ağları ile ilgili olarak ifade edilen ML teorisi hakkında 1999 tarihli bir kitaptır, ancak (benim izlenimime göre) çoğunlukla genel olarak ML teorisi ile ilgilidir.

Bu üç kitap çoğunlukla istatistiksel öğrenme teorisinin baskın görüşünü alır. Bilgisayar bilimi teorisinden esinlenerek, bilgisayarla öğrenme teorisi adında ilginç bir bakış açısı var . Bu alandaki standart tanıtım kitabının, Bilgisayarlı Öğrenme Teorisine Giriş , 1994 yılında Michael Kearns ve Umesh Vazirani tarafından yazılmış bir kitap olduğunu düşünüyorum.

Bir başka mükemmel ve tavsiye edilen ücretsiz kitap, Trevor Hastie, Robert Tibshirani ve Jerome Friedman'ın 2009 Sayılı İstatistiksel Öğrenim Öğeleri'nin ikinci baskısı . Belki diğerlerinden biraz daha az teoriktir ve istatistikçiler açısından makine öğrenicisinden daha fazla teoriktir, ancak yine de büyük bir ilgisi vardır.

Ayrıca, özellikle degrade inişini önemsiyorsanız, standart referans Stephen Boyd ve Lieven Vandenberghe tarafından yapılan Konveks Optimizasyondur . Bu 2004 kitabı çevrimiçi olarak ücretsiz olarak kullanılabilir.

Bu kitapların hiçbiri modern derinlikteki ağ teorisinde pek bir şey içermiyor, eğer ilgileniyorsanız. (Örneğin, optimizasyon teorisinin çoğu, derin ağların kararsız olduğu dışbükey durumlar hakkında olacaktır.) Çünkü bu teori çok yenidir; Sonuçların çoğu sadece son birkaç yılda ortaya çıktı ve hala çok fazla şey çözülüyor. Ancak, şimdiye kadar bu alandaki temel anlayışa genel bir bakış olarak, bunlardan herhangi biri sizi bu çalışmanın yapıldığı makaleleri anlamanız için iyi ayarlayacaktır (belki de analizin farklı yönlerine odaklanan belki de Kearns / Vazirani hariç). Henüz derin ağlara başarıyla uygulandığından emin değilim.


Makine öğrenmeyi anlama, bir yazarın web sayfasından çevrimiçi olarak yapılabilir.
Jakub Bartczuk

2

Makine Öğrenimi: Kevin P. Murphy'den Olasılıklı Bir Bakış Açısı Bayes bakış açısıyla pek çok teori açıklıyor (Ben bunu sadece lojistik regresyon için kullandım, ama bunun oldukça iyi olduğunu düşündüm). Kitabın tamamına Google’da arama yaparak çevrimiçi olarak PDF olarak erişilebilir.


2
  • Derin Öğrenme (Uyarlamalı Hesaplama ve Makine Öğrenimi serisi) . Bu Ian Goodfellow, Yoshua Bengio, Aaron Courville tarafından yazılmıştır . Yazarın MIT Press ile yaptığı anlaşmaya göre, tarayıcıda bulunan yasal olarak ücretsiz kopyayı bu web sitesinde okuyabilirsiniz. www.deeplearningbook.org Bu, saf matematik ve sinir ağı ve farklı alt dallarının teorisi için iyidir.

Buna ek olarak,

  • İstatistiksel Öğrenmenin Öğeleri: Veri Madenciliği, Çıkarım ve Tahmin , geleneksel makine öğreniminde teorik ve matematiksel bir temel oluşturmak için de iyi bir kitaptır. Bu, Trevor Hastie, Robert Tibshirani ve Jerome Friedman tarafından yazılmıştır ve yazarlar tarafından ücretsiz olarak https://web.stanford.edu/~hastie/ElemStatLearn/ adresinde bulunabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.