Bir öğrenme sisteminin hangi değiştirilebilir bileşenleri, başarısından veya başarısızlığından sorumludur? Onlarda hangi değişiklikler performansı artırır? Buna temel kredi tahsis problemi denir (Minsky, 1963). Evrensel problem çözücüler için çeşitli teorik anlamda zaman-optimal olan genel kredi tahsis yöntemleri vardır (Bölüm 6.8). Bununla birlikte, bu anket Yapay Sinir Ağlarında (NN'ler) Derin Öğrenmenin (DL) daha dar fakat şimdi ticari olarak önemli alt alanına odaklanacaktır.
Standart bir sinir ağı (NN), her biri gerçek değerli aktivasyonlar dizisi üreten nöron adı verilen birçok basit, bağlı işlemciden oluşur. Giriş nöronları çevreyi algılayan sensörler aracılığıyla aktif hale gelirken, diğer nöronlar daha önce aktif olan nöronların ağırlıklı bağlantıları ile aktif hale gelir (Ayrıntılar Bölüm 2). Bazı nöronlar, eylemleri tetikleyerek çevreyi etkileyebilir. Öğrenme veya kredi tahsisi, NN'yi araba kullanmak gibi istenen davranışlarda gösteren ağırlıkların bulunmasıyla ilgilidir. Soruna ve nöronların nasıl bağlandığına bağlı olarak, bu tür davranışlar, her bir aşama ağın toplam aktivasyonunu dönüştürdüğü (çoğunlukla doğrusal olmayan bir şekilde) hesaplama aşamalarının uzun nedensel zincirlerini (Bölüm 3) gerektirebilir. Derin Öğrenme, bu gibi birçok aşamada doğru bir şekilde kredi atamakla ilgilidir.
Bu tür birkaç evreye sahip sığ NN benzeri modeller, yüzyıllar olmasa da onlarca yıldır var olmuştur (Bölüm 5.1). Art arda gelen birkaç doğrusal olmayan nöron tabakasına sahip modeller, en azından 1960'lara (Bölüm 5.3) ve 1970'lere (Bölüm 5.5) dayanmaktadır. 1960'larda ve 1970'lerde backpropagation (BP) olarak adlandırılan, ayrık, farklılaştırılabilir derinlik ağlarında öğretmen tabanlı Denetimli Öğrenme (SL) için etkili bir gradyan iniş yöntemi geliştirildi ve 1981'de NN'lere uygulandı (Bölüm 5.5). Bununla birlikte, çok sayıda katmana sahip derin NN'lerin BP tabanlı eğitiminin 1980'lerin sonunda pratikte zor olduğu bulunmuştur (Bölüm 5.6) ve 1990'ların başında açık bir araştırma konusu haline gelmiştir (Bölüm 5.9). DL, Denetlenmeyen Öğrenme (UL), örneğin Sec. 5.10 (1991), Sec. 5.15 (2006). 1990'lar ve 2000'ler de tamamen denetlenen DL'nin birçok gelişmesini gördü (Bölüm 5). Yeni binyılda, derin NN'ler nihayetinde çok sayıda önemli uygulamada çekirdek makineleri (Vapnik, 1995; Scholkopf ve diğerleri, 1998) gibi alternatif makine öğrenme yöntemlerinden daha iyi performans göstererek geniş çapta dikkat çekti. Aslında, 2009'dan bu yana, denetlenen derin NN'ler birçok resmi uluslararası örüntü tanıma yarışmasını (ör. Bölüm 5.17, 5.19, 5.21, 5.22) kazanmış ve ilk insanüstü görsel örüntü tanıma elde edilmesi sınırlı alanlarda sonuç vermektedir (Bölüm 5.19, 2011). Derin NN'ler aynı zamanda denetleyici öğretmenin olmadığı daha genel Takviye Öğrenimi (RL) alanı için de önem kazanmıştır (Bölüm 6). temel olarak çok sayıda önemli uygulamada çekirdek makineleri (Vapnik, 1995; Scholkopf ve diğerleri, 1998) gibi alternatif makine öğrenme yöntemlerinden daha iyi performans göstererek. Aslında, 2009'dan bu yana, denetimli derin NN'ler birçok resmi uluslararası örüntü tanıma yarışmasını (ör. Bölüm 5.17, 5.19, 5.21, 5.22) kazanmış ve ilk insanüstü görsel örüntü tanıma elde edilmesi sınırlı alanlarda sonuç vermektedir (Bölüm 5.19, 2011). Derin NN'ler aynı zamanda denetleyici öğretmenin olmadığı daha genel Takviye Öğrenimi (RL) alanı için de önem kazanmıştır (Bölüm 6). temel olarak çok sayıda önemli uygulamada çekirdek makineleri (Vapnik, 1995; Scholkopf ve diğerleri, 1998) gibi alternatif makine öğrenme yöntemlerinden daha iyi performans göstererek. Aslında, 2009'dan bu yana, denetimli derin NN'ler birçok resmi uluslararası örüntü tanıma yarışmasını (ör. Bölüm 5.17, 5.19, 5.21, 5.22) kazanmış ve ilk insanüstü görsel örüntü tanıma elde edilmesi sınırlı alanlarda sonuç vermektedir (Bölüm 5.19, 2011). Derin NN'ler aynı zamanda denetleyici öğretmenin olmadığı daha genel Takviye Öğrenimi (RL) alanı için de önem kazanmıştır (Bölüm 6). ilk insanüstü görsel örüntü tanımayı başarmak sınırlı alanlarda sonuç verir (Bölüm 5.19, 2011). Derin NN'ler aynı zamanda denetleyici öğretmenin olmadığı daha genel Takviye Öğrenimi (RL) alanı için de önem kazanmıştır (Bölüm 6). ilk insanüstü görsel örüntü tanımayı başarmak sınırlı alanlarda sonuç verir (Bölüm 5.19, 2011). Derin NN'ler aynı zamanda denetleyici öğretmenin olmadığı daha genel Takviye Öğrenimi (RL) alanı için de önem kazanmıştır (Bölüm 6).
Öte yandan, makine öğrenimi stratejileri için birbirini dışlayan kovaların bir sınıflandırmasını oluşturmanın mutlaka kârlı olduğundan emin değilim. Bence modellerin sinir ağları olarak görülebileceği bakış açıları olduğunu söyleyebiliriz. Perspektifin her bağlamda mutlaka en iyi veya yararlı olduğunu düşünmüyorum. Örneğin, hala ayrımlarını ortadan kaldırmak ve "sinir ağı ağaçları" olarak adlandırmak yerine, rastgele ormanları ve eğimi güçlendirilmiş ağaçları "ağaç toplulukları" olarak adlandırmayı planlıyorum. Dahası, Schmidhuber NN'leri çekirdek makinelerinden ayırıyor - çekirdek makinelerinin NN'lerle bazı bağlantıları olsa da - "Yeni binyılda derin NN'ler nihayetinde geniş çaplı ilgi çekti, temel olarak çekirdek makineleri gibi alternatif makine öğrenme yöntemlerinden daha iyi performans göstererek ... çok sayıda önemli uygulamada. "