Makine Öğrenimi ve Derin Öğrenme


11

"Makine Öğrenmesi" ve "Derin Öğrenme" terimleri arasındaki farktan biraz kafam karıştı. Google'ı aradım ve birçok makale okudum, ancak hala benim için çok açık değil.

Tom Mitchell'in Machine Learning tarafından bilinen bir tanımı:

Bir bilgisayar programı, bir deneyim öğrenmek söylenir E görevlerden bazıları sınıfına göre , T ve performansını ölçmek P görevleri de performans ise, T ile ölçüldüğünde, P , bir deneyim ile artar E .

Köpekleri ve kedileri benim görevlerim T olarak sınıflandırmak için bir görüntü sınıflandırma problemi alırsam , bu tanımdan, bir ML algoritmasına bir sürü köpek ve kedi görüntüsü ( E deneyimi ) verirsem, ML algoritmasının yeni bir görüntüyü köpek ya da kedi olarak ayırt edin (performans ölçüsünün P iyi tanımlanmış olması şartıyla ).

Sonra Derin Öğrenme geliyor. Derin Öğrenmenin Makine Öğrenmesinin bir parçası olduğunu ve yukarıdaki tanımın geçerli olduğunu anlıyorum. Görev T'deki performans E deneyimiyle gelişir . Şimdiye kadar her şey yolunda.

Bu blog Makine Öğrenimi ile Derin Öğrenme arasında bir fark olduğunu belirtir. Adil'e göre fark, (Geleneksel) Makine Öğrenimi'nde özelliklerin el yapımı olması, Derin Öğrenme'de ise özellikler öğrenilmesidir. Aşağıdaki rakamlar ifadesini açıklığa kavuşturmuştur.

resim açıklamasını buraya girin

(Geleneksel) Makine Öğrenimi'nde özelliklerin el yapımı olması gerektiği ile kafam karıştı. Tom Mitchell'in yukarıdaki tanımından, bu özelliklerin E deneyiminden ve P performansından öğrenileceğini düşünürüm . Makine Öğreniminde başka ne öğrenilebilirdi?

Derin Öğrenmede, deneyimden, performansı artırmak için özellikleri ve birbirleriyle nasıl ilişkilendiğini öğrendiğinizi anlıyorum. Makine Öğrenimi'nde özelliklerin el yapımı olması gerektiği ve özelliklerin kombinasyonu öğrenilen şeyin ne olduğu sonucuna varabilir miyim? Yoksa başka bir şey mi kaçırıyorum?


2
Bu çok iyi kaplıdır Derin Öğrenme kitabı Goodfellow tarafından ve arkadaşları. ilk bölümde (Giriş).
17'de hbaderts

Yanıtlar:


4

Himanshu Rai'nin söylediklerine ek olarak, Derin öğrenme, sinir ağlarının kullanımını içeren bir alt alandır.Bu sinir ağları katmanlar arasındaki ağırlıkları değiştirerek temel dağılımı öğrenmeye çalışır. Şimdi, derin öğrenme kullanarak görüntü tanıma durumunu düşünün: bir sinir ağı modeli katmanlar arasında bölünür, bu katmanlar ağırlık adı verilen bağlantılarla bağlanır, eğitim süreci başlarken, bu katmanlar ağırlıkları her katman bazı özellikleri algılamaya çalışacak şekilde ayarlar ve dikkat edilmesi gereken bir sonraki katman, katmanı açıkça kenarları, gözleri, burnu veya yüzleri tespit etmeyi öğrenmesini söylemememizdir.Model bunu yapmayı öğrenir.Klasik makine öğrenme modellerinin aksine.


8

Bir araştırma alanı olarak Derin Öğrenme, Makine Öğrenmenin Yapay Zekanın bir alt alanı olduğu için Makine Öğrenmenin bir alt alanıdır.

1) Denetimsiz Özellik Öğrenimi

Kavramsal olarak, " geleneksel " (veya " sığ ") Makine Öğrenmesi ve Derin Öğrenme arasındaki ilk temel fark Denetimsiz Özellik Öğrenimidir.

Bildiğiniz gibi, " geleneksel " bir Makine Öğrenimi modelini (ör: SVM, XGBoost ...) başarıyla eğitmek , ancak verilerden anlamlı bilgiler seçmek için uygun ön işleme ve makul özellik çıkarma işleminden sonra mümkündür. Yani, iyi özellik vektörleri, farklı etiketlere sahip veri noktaları arasında ayırt edici ve aynı etikete sahip veri noktaları arasında tutarlı özellikler içerir. Böylece Özellik Mühendisliği, uzmanlardan manuel özellik seçme sürecidir. Bu çok önemli ama sıkıcı bir görevdir!

Denetimsiz Özellik Öğrenme, modelin kendisinin özellikleri eğitim yoluyla otomatik olarak seçtiği bir süreçtir. Birbirine bağlı katmanlar halinde düzenlenmiş bir Sinir Ağının topolojisi, verilerin düşük seviyeli bir temsilini daha yüksek seviyeli bir temsille eşleme özelliğine sahiptir. Eğitim sayesinde, ağ verinin hangi kısmının önemli olduğuna ve verinin hangi kısmının önemli olmadığına " karar verebilir ". Bu, özellikle sağlam özellikleri manuel olarak seçmenin veya oluşturmanın oldukça zor olduğu Bilgisayarlı Görme veya Doğal Dil İşleme için ilginçtir.

Denetimsiz Özellik Öğrenimi, kredi: Tony Beltramelli (resim kredisi: Tony Beltramelli)

Örnek olarak, kedi resimlerini sınıflandırmak istediğimizi varsayalım. Bir Derin Sinir Ağı kullanarak, ilk katman tarafından bir dizi ağırlığa eşleştirilecek ham piksel değerlerini besleyebiliriz, daha sonra bu katmanlar, ikinci katman tarafından diğer ağırlıklara, sorununuzu temsil eden sayılarla eşlenmelidir. (örn: bu durumda resmin bir kedi içeren olasılığı)

Derin Sinir Ağları Denetimsiz Özellik Öğrenimi yapabilse de, sorununuzu daha iyi temsil etmek için Özellik Mühendisliği'ni kendiniz yapmanızı engellemez. Gözetimsiz Unsur Öğrenme, Unsur Çıkarma ve Unsur Mühendisliği birbirini dışlamaz!

Kaynaklar:

2) Doğrusal Ayrılabilirlik

Derin Sinir Ağları, özellik alanını doğrusal olarak ayrılabilecek şekilde bükerek, özellik uzayını bükerek bazı doğrusal olmayan ayrılabilir problemleri çözebilir. Bir kez daha, bu, katmanların girişlerinde verilerin yeni temsillerine eşlenen ağ topolojisi sayesinde mümkündür.

Gizli katman, verilerin doğrusal olarak ayrılabilmesi için bir temsili öğrenir. (resim kredisi: Christopher Olah)

Kaynaklar: http://colah.github.io/posts/2014-03-NN-Manifolds-Topology/

3) İstatistiksel Değişmezlik

Son olarak, Derin Sinir Ağları bazı alanlarda geleneksel Makine Öğrenimi algoritmalarını aşmaktadır, çünkü bazı mimariler İstatistiksel Değişmezlik sergilemektedir (örn: Konvolüsyonel Sinir Ağları ile Uzaysal İstatistiksel Değişmezlik ve Tekrarlayan Sinir Ağları ile Geçici İstatistiksel Değişmezlik)

Daha fazla ayrıntı için bu Udacity videosunu kontrol edin: https://www.youtube.com/watch?v=5PH2Vot-tD4


4

Einstein'dan esinlenerek, ““ Altı yaşında bir çocuğa açıklayamazsan, bunu kendin anlamıyorsun. ”

Yukarıdaki yanıtların hepsi çok iyi açıklanmıştır, ancak hatırlanması kolay, soyut bir fark arıyorsanız, işte bildiğim en iyisi:

Temel fark Makine Öğrenimi sadece verileri sindirirken Derin Öğrenme veri üretebilir ve geliştirebilir. Sadece öngörücü değil, aynı zamanda üretken.

Kaynak. Tabii ki çok daha fazlası var ama yeni başlayanlar için çok kafa karıştırıcı olabilir.


-3

Tamam, böyle düşün. Doğrusal regresyon veya rasgele orman gibi makine öğrenimi algiritmalarında, algoritmalara bir dizi özellik ve hedef verirsiniz ve daha sonra maliyet işlevini en aza indirmeye çalışır, böylece hiçbir yeni özellik öğrenmez, sadece ağırlıkları öğrenir. Şimdi derin öğrenmeye geldiğinizde, belirli sayıda üniteye sahip en az bir (neredeyse her zaman daha fazla) gizli katmanınız var, bunlar hakkında konuşulan özellikler. Derin bir öğrenme algoritması sadece ağırlık setlerini öğrenmekle kalmaz, bu süreçte verdiğiniz önemsiz verilerin karmaşık üst düzey özellikleri olan gizli birimlerin değerlerini de öğrenir. Bu nedenle, vanilya makinesi öğrenimi uygularken çok fazla uzmanlık, özellikleri tasarlama yeteneğinizde yatmaktadır, çünkü algoritma tek başına öğrenmemektedir. Umarım sorunuzu cevapladım.


Başka bir soru: Örneğin CNN'lerde özellikler (veya filtreler) ağırlıklarla aynı şey değil mi?
user2835098

Hayır, bunlar evrişim tabakasının ağırlıklarıdır, ama evrişimden elde edilen ürün yani özellik haritaları özelliklerdir.
Himanshu Rai

Katılmıyorum. Gizli değişkenler rastgele orman ve yükseltme algoritmalarında da mevcuttur. Ve hala derin öğrenme özellikleri geliştiriyorsunuz. 2017'deki en iyi görüntü tanıma algoritmalarından birinde kırpma alanı gibi
keiv.fly
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.