Doktora saf matematikte ve teorik CS hakkında fazla bir şey bilmediğimi itiraf ediyorum. Bununla birlikte, kariyerim için akademik olmayan seçenekleri araştırmaya ve kendimi makine öğrenimi ile tanıştırmaya başladım, "Hiç kimse sinir ağlarının neden iyi çalıştığını anlamıyor" gibi ilginç bulgular getirdi.
Benim sorum, esasen, araştırmacılar ne tür cevaplar istiyor? İşte konuyla ilgili kısa araştırmamda ne buldum:
- Basit sinir ağlarını uygulayan algoritmalar oldukça basittir.
- SGD süreci, istatistiksel teoride olduğu gibi matematiksel olarak iyi anlaşılmıştır.
- Evrensel yaklaşım teoremi güçlü ve kanıtlanmıştır.
- Çok yakın zamanda yayınlanan bir makale https://arxiv.org/abs/1608.08225 esasen evrensel yaklaşımın pratikte ihtiyaç duyduğumuzdan çok daha fazla olduğu cevabını veriyor çünkü uygulamada modellemeye çalıştığımız fonksiyonlarla ilgili basitleştirici varsayımlar yapabiliriz. sinir ağı.
Yukarıda sözü edilen makalede, "Fıkra" ifadesi "" GOFAI algoritmaları analitik olarak tam olarak anlaşılmıştır, fakat çoğu YSA algoritması sadece sezgisel olarak anlaşılmaktadır. " Uygulanan algoritmalar için yakınsaklık teoremleri, sinir ağları hakkında sahip olduğumuzu düşündüğümüz analitik anlayışın bir örneğidir, bu nedenle, bu genel düzeydeki bir ifade bana neyin bilindiği ya da ne bilindiği ya da neyin kabul edilebileceği hakkında bir cevap vermez. ."
Yazarlar, sonuç olarak, belirli bir polinomu yaklaştırmak için ihtiyaç duyulan sinir ağının boyutunda etkili sınırlar gibi soruların açık ve ilginç olduğunu öne sürmektedir. Yapay sinir ağlarını "anladığımızı" söylemek için cevaplanması gereken matematiksel olarak spesifik analitik soruların diğer örnekleri nelerdir? Daha saf matematik dilinde cevaplanabilecek sorular var mı?
(Özellikle bu makalede fiziğin kullanılmasından dolayı temsil teorisindeki yöntemleri düşünüyorum - ve bencilce, çünkü bu benim çalışma alanım. Ancak, birleştirici / grafik teorisi, cebirsel geometri gibi alanları da hayal edebiliyorum. ve uygulanabilir araçlar sağlayan topoloji.)