Benzerlik
Temel olarak, makine öğrenim uygulamalarında genel bir soruyu cevaplamak için her iki algoritma türü geliştirilmiştir:
Verilen öngörücüler (faktörler) - performansı artırmak için bu faktörler arasındaki etkileşimi nasıl dahil edebiliriz?x1, x2, … , Xp
Bunun bir yolu basitçe yeni tahmincileri tanıtmaktır: Ancak bu, çok sayıda parametre ve çok özel bir etkileşim türü nedeniyle kötü bir fikir olduğunu kanıtlar.xp + 1= x1x2, xp + 2= x1x3, …
Hem Çok Düzeyli Modelleme hem de Derin Öğrenme algoritmaları bu soruya daha akıllı etkileşimler modeli sunarak cevap verir. Ve bu açıdan onlar çok benzer.
fark
Şimdi, aralarındaki en büyük kavramsal farkın ne olduğu konusundaki anlayışımı vermeye çalışayım. Bir açıklama yapmak için, modellerin her birinde yaptığımız varsayımları görelim:
Çok seviyeli modelleme: Veri yapısını yansıtan katmanı bir Bayesian Hiyerarşik Ağı olarak gösterilebilir . Bu ağ sabittir ve genellikle etki alanı uygulamalarından gelir.1
Derin Öğrenme: veriler birçok faktörün etkileşimi ile oluşturulmuştur. Etkileşimlerin yapısı bilinmemektedir, ancak katmanlı bir faktoring olarak temsil edilebilir: daha düşük seviyeli gösterimleri dönüştürerek daha yüksek seviyeli etkileşimler elde edilir.2
Temel fark , Deep Learning'de "etkileşimlerin yapısı bilinmiyor" ifadesinden gelir . Etkileşim türü hakkında bazı öncelikler alabiliriz, ancak algoritma öğrenme prosedürü sırasında tüm etkileşimleri tanımlar. Öte yandan, Çok Düzeyli modelleme için etkileşimlerin yapısını tanımlamamız gerekir (daha sonra sadece modelin parametrelerini değiştirdiğini öğreniriz).
Örnekler
Örneğin, üç faktöre ve ve farklı katmanlar olarak . { x 1 } { x 2 , x 3 }x1, x2, x3{ x1}{ x2, x3}
Çok düzeyli modelleme regresyon, örneğin, biz etkileşimleri alacak ve , ama biz etkileşim asla . Elbette, kısmen sonuçlar hataların korelasyonundan etkilenecek, ancak bu örnek için önemli değil.x 1 x 3 x 2 x 3x1x2x1x3x2x3
Derin öğrenmede, örneğin iki gizli katmana ve doğrusal aktivasyon işlevine sahip çok katmanlı Kısıtlı Boltzmann makinelerinde ( RBM ), olası tüm polinom etkileşimlerini dereceyle üç veya daha az olacak şekilde yapacağız.
Ortak avantajlar ve dezavantajlar
Çok düzeyli modelleme
(-) etkileşimlerin yapısını tanımlamanız gerekir
(+) sonuçların yorumlanması genellikle daha kolaydır
(+) istatistik yöntemleri uygulayabilir (güven aralıklarını değerlendirebilir, hipotezleri kontrol edebilir)
Derin öğrenme
(-) eğitmek için çok büyük miktarda veri gerektirir (ve aynı zamanda eğitim için zaman gerektirir)
(-) sonuçların yorumlanması genellikle mümkün değildir (kara kutu olarak sağlanır)
(+) uzman bilgisi gerektirmez
(+) iyi eğitilmiş bir kez, genellikle çoğu diğer genel yöntemlerden daha iyi performans gösterir (uygulamaya özel değil)
Umarım yardımcı olur!