Yapay zeka araştırmalarında “ileri matematik” ne ölçüde gereklidir / yararlıdır?


19

Şu anda matematik okuyorum. Ancak, gelecekte profesyonel bir matematikçi olmak istediğimi sanmıyorum. Matematik bilgimi yapay zekada araştırma yapmak için uygulamayı düşünüyorum. Ancak, kaç matematik dersini izlemem gerektiğinden emin değilim. (Ve hangi CS teorisi derslerini takip etmeliyim.)

Quora'dan Doğrusal Cebir, İstatistik ve Konveks Optimizasyon konularının Makine Öğrenimi ile en alakalı olduğunu öğrendim ( bu soruya bakın ). Birisi yapay zekayı incelemek için Doğrusal Cebir, Olasılık / İstatistik, Matematik, Temel Algoritmalar ve Mantık öğrenmenin gerekli olduğunu belirtti ( bu soruya bakın ).

Üniversitemizdeki matematik lisansının ilk 1.5 yılında bu konuların hepsini öğrenebilirim.

Yine de, yapay zekayı incelemek için yararlı veya hatta gerekli olan lisansüstü düzey matematik konularının bazı üst lisansları olup olmadığını merak ediyordum. ODE'ler, PDE'ler, Topoloji, Ölçüm Teorisi, Doğrusal Analiz, Manifoldlar Üzerinde Fourier Analizi ve Analizi ne olacak?

Yapay zekanın çalışmasında oldukça gelişmiş bazı matematiğin yararlı olduğunu gösteren bir kitap, Desen Teorisi: David Mumford ve Agnes Desolneux tarafından Gerçek Dünya sinyallerinin Stokastik Analizi ( bu sayfaya bakınız ). Markov Zincirleri, Parçalı Gauss Modelleri, Gibbs Tarlaları, Manifoldlar, Lie Grupları ve Lie Cebirleri ve bunların kalıp teorisine uygulamaları hakkında bölümleri içerir. Bu kitap yapay zeka araştırmalarında ne ölçüde yararlıdır?


22
Bu sitede benim 2 + yıl içinde "matematik için ne gerek ..." türü yarım düzineden fazla soru gördüm. Matematik için Princeton Companion içeriği gibi okunan sıralı cevaplar. 1) AI büyük bir alandır, alt alanlarında kullanılan matematik tüm tatlarda gelir; 2) Temel matematik derslerinizi alın, ilgiye göre daha gelişmiş dersler seçin; 3) AI'de araştırma yapın, neyi sevdiğinizi bulun, matematiğin orada kullanıldığını bulun; 4) Apriori'yi bu ya da bu problem için hangi matematiğin yararlı olacağını bilemeyiz.
Sasho Nikolov

Yanıtlar:


57

Ben küçümseyen gelmek istemiyorum, ancak lisans ve hatta lisansüstü düzeydeki derslerde okuduğunuz matematik ileri değildir. Öyle temelleri . Sorunuzun başlığı şu olmalıdır: Yapay zeka araştırmalarında "temel" matematik gerekli / yararlı mı? Yani, olabildiğince toparla, çok fazla matematik bilmekten şikayet eden bir bilgisayar bilimcisi ile hiç karşılaşmadım, ancak yeterince bilmediğinden şikayet eden birçok kişi ile tanıştım. Yapay zekadaki bir yüksek lisans öğrencisinin sayfa sıralaması tarzı bir algoritmayı anlamalarına yardımcı olduğumu hatırlıyorum. Benim için oldukça kolay bir lineer cebirdi, ama acı çekti, çünkü özdeğerlerin ve özvektörlerin ne hakkında olduğu hakkında hiçbir duygusu yoktu. Yapay zeka insanların gerçekten çok fazla matematik biliyorlarsa yapabileceklerini hayal edin!

Bir matematik bölümünde ders veriyorum ve düzenli olarak CS meslektaşlarımdan matematik öğrencilerini tercih ettikleri için CS doktora öğrencilerinin matematik bölümlerini tavsiye etmelerini talep ediyorum. Görüyorsunuz, matematik kendi başınıza öğrenmek gerçekten zor, ama bilgisayar biliminin çoğu yönü öyle değil. Biliyorum, bir CS yüksek lisans okuluna girmiş bir matematik öğrencisiydim. Elbette (Unix ve VMS hakkında iyi bilgiye sahip olmasına rağmen) işletim sistemi bilgisinde "geride" kaldım, ama "teori" konusunda çok ilerideydim. Simetrik bir durum değil.


6
ölçü teorisi ve olasılık teorisi tüm olasılıksal akıl yürütmenin temelini oluşturur. topoloji, topolojik veri analizi için çok önemli hale gelmiştir. Fourier analizi öğrenme teorisi için önemlidir (fonksiyonların hassasiyetini ve bunları öğrenmenin ne kadar zor olduğunu anlamak için kullanılır) ve manifold öğrenmesi manifold geometrisinin derinlemesine anlaşılmasını gerektirir.
Suresh Venkat

2
@MaxMuller: Listeye devam etmek için, grup teorisi ve cebirleri (Lie cebirleri gibi) topolojinin çok gerekli olduğu görüntülerin ayrışma teorisinde örüntü tanımada yaygın olarak kullanılmaktadır (ve Lie cebirleri ve manifoldlar arasında derin bir bağlantı vardır. yol boyunca öğrenin). Monique Pavel'in "Örüntü Tanıma Temelleri" gibi kitaplar sizi kategori teorisine tanıtacak ve uygulama, AI'da da resmi dillerin ve kanıt teorisinin (akıl yürütme teorisi olabilir) temellerinde kullanılması için son derece önemlidir. ...
ex0du5

1
Geçmiş intro seviyesi grad kursları, matematikçiler kendi başlarına tüm matematik öğrenmek (veya okuma grupları ve seminerlere) .. hepsi değil o bazı temelleri varsa sert ... Tamam, bu zor olabilir, ama imkansız değil.
Sasho Nikolov

1
Max, ben de aikido öğretiyorum. Herhangi bir aikido öğrencisini "neden temelleri öğrenmek zorundayım (nasıl düşeceğim, saldırı hattından nasıl hareket edeceğim?" Diye soran hatırlamıyorum. Bazen öğretmenlerinizin ne yaptığını bildiğine biraz güvenmeniz gerekir. Bununla birlikte, özellikle matematik derslerinin öğrencilere merak uyandırmak gibi öğretildiği lise ve ilköğretim okullarında çok fazla bok öğrettiğimizi ilk kabul edeceğim. Ama sizin durumunuzda, listelediğiniz konular bok değil. Güven Bana.
Andrej Bauer

13
Ve sadece bir yorum daha. Yalnızca CS'nin bazı alanlarında zaten kanıtlanmış olan matematiği öğrenirseniz, asla yeni matematik uygulama şansınız olmaz. Her zaman geride kalacaksın. Bilim bir sanattır, 9 ila 5 arası bir iş değildir. Bana "fizik öğrenmeli miyim, yapay zekaya girmek istiyorum" diye sorarsanız "kesinlikle öyle diyeceğim!" Ve eğer "sosyoloji öğrenmeli miyim, yapay zekaya girmek istiyorum" diye sorarsanız cevabım yine aynı olacaktır.
Andrej Bauer

6

Max, işte (zorunlu olarak) kısmi bir liste:

Temel doğrusal cebir ve olasılık her yerde gereklidir. Sanırım bunun için referanslara ihtiyacınız yok.

Bildiğim kadarıyla, Fourier analizi öğrenme teorisi ile ilgili bazı araştırmalarda kullanılmıştır. Örneğin bu makaleye göz atın .

Manifold öğrenme kavramı popüler hale geliyor ve Mikhail belkin ve Partha Niyogi'nin çalışmalarına bir göz atabilirsiniz. Bu çalışma alanı, manifoldlar ve riemann geometrisi ile ilgili çeşitli kavramların anlaşılmasını gerektirir.

Makine öğreniminin, istatistiklere daha derin kökleri olan başka bir yönü daha vardır, yani Bilgi geometrisi. Bu alan, Riemann geometrisi, bilgi teorisi, Fisher bilgisi, vb. Gibi çeşitli kavramlara bağlıdır. Bu tür bir çalışmanın kuzeni, çok fazla potansiyeli olan yeni bir alan olan Cebirsel istatistiklerde bulunabilir.

Sumio Watanabe, farklı bir sınır, yani öğrenme modellerinde tekilliklerin varlığını ve birçok soruyu ele almak için cebirsel geometriden alınan çözümlerin derin sonuçlarının nasıl uygulanacağını araştırdı . Watanabe'nin sonuçları, Heisuke Hironaka'nın ona Fields madalyasını kazanan ünlü çalışmasından büyük ölçüde yararlanıyor.

Sanırım nispeten ağır matematik gerektiren birçok alanı atlıyorum. Ancak Andrej'in işaret ettiği gibi, çoğu muhtemelen matematiğin sınırlarında yer almaz, ancak nispeten daha eski ve yerleşik alanlardır.

Ancak, her halükarda, Amazon'daki öneri sistemlerinde veya Apache Mahir'de bulunan makine öğrenme kütüphanelerinde olduğu gibi, genel bilgi işleme giren mevcut AI durumunun herhangi bir ileri matematik gerektirmediğini düşünüyorum. Yanılıyor olabilirim.


2

Gelişmiş tanımınıza ve ne tür bir AI çalışmak istediğinize bağlıdır.

Yapay zekadaki birçok sorun kanıtlanamaz - POMDP'lere en uygun çözümler muhtemelen NP-Complete'tir, DEC-POMDP'lere en uygun çözümler muhtemelen NEXP-Complete'tir, vb. ve teorik temelleri daha iyi. (Ölçüm teorisine ek olarak, POMDP modelinin altında yatan Bayes olasılığını gerçekten anlamak için gerekiyordu.)

Çok ajanlı yapay zeka, özellikle oyun teorisi ile kesişir; bu nedenle oyun teorisini bilmek yararlıdır ki bu da topolojiye, ölçü teorisine vb. bağlıdır. Aynı şekilde oyun teorisindeki birçok sorun da inatçıdır. O zaman bazı yaklaşım altında bile inatçı ve hatta anlayış vardır olası yararlı yaklaşık atlatmanın matematik önemli miktarda sürer.

(Oyun teorisyenlerinin Nobel Ekonomi alanında son birkaç yıldır oldukça iyi koştuğunu ve bunun doğası gereği matematiksel olduğunu düşünüyorum. Yirmi yıl sonra, bugünün algoritmik oyun teorisyenleri yaklaşık aynı olacak durum.)


1

Yapay zeka ile ilgili matematik ileri değildir ve lisans düzeyinde öğretilir. AI eğitimi ve çıkarım algoritmaları, ileri Bilgisayar Bilimi alanındadır.

Biraz kelime oyunu. AI araştırılırken bazı tarihler de dahil edilmelidir.

Örneğin, mevcut terminolojide Derin Öğrenme, AI'de trend olan bir anahtar kelime gibi görünüyor.

Derin Öğrenme, eskiden Hinton'un geri yayılan algılayıcı ağ modeli (BACKPROP) ve benzeri gibi Yapay Sinir Ağları (YSA) olarak adlandırılan şeydir.

Bir BACKPROP ANN (örneğin) ile ilgili matematik temel olarak eğitim için türev hesabı ve çıkarım için matris cebiridir.

Derin Öğrenmenin yeni yönü, eğitim ve çıkarım algoritmalarının fiziksel olarak ayrılmasıdır. CPU'lar hala eğitim için kullanılıyor, ancak şimdi GPU'lar çıkarım için kullanılıyor.

Örneğin, YSA matrisleri düzeltici türev hesabı kullanılarak geri çoğaltma hatalarıyla eğitilir (ağırlıklandırılır). Bu en iyi CPU'lar için uygundur ve her ANN dağıtımı için yalnızca bir kez gerçekleştirilmelidir.

YSA daha sonra oldukça paralelleştirilmiş bir GPU mimarisine yerleştirilir. İleri çıkarımsal matematik, GPU'ların tasarlandığı yoğun matris cebirini içerir.

Bu, dağıtılmış bir ANN'nin performansını önceki CPU tabanlı dağıtımlara kıyasla birkaç büyüklükte artırır ve herhangi bir sayıda ayrılmış GPU'da daha verimli bir şekilde ölçeklendirilebilir.

Nvidia ve AMD gibi şirketler artık Derin Öğrenme Makineleri olarak çok üst düzey GPU yonga setlerini pazarlıyorlar. GPU terimi her zaman bir yanlış adlandırma olmuştur, çünkü bunlar gerçekten genel amaçlı Paralel İşlemcilerdir. Örneğin, GPU'lar bazen blockchain uygulamalarında Bitminer olarak da adlandırılır.

Eski olan artık yeni. İlgili matematik değişmedi, sadece Bilgisayar Bilimi terminolojisi değişti (çoğunlukla pazarlama baskılarından dolayı).

AI terimi her zaman biraz karanlık bir at olarak kabul edildi. Derin Öğrenme artık politik olarak doğru, pazar dostu bir terimdir.


2
Bir önceki cevabı zaten ilk cümlede sizin iddiaya counterexamples vermiştir. (Başkaları da var.) Göndermeden önce önceki cevapları okudunuz mu? Taleplerinizi daraltmak için bu yanıtı düzenlemek isteyebilirsiniz.
DW

2
"İşlemciler hala [derin ağlar] eğitimi için kullanılıyor, ancak şimdi GPU'lar çıkarım için kullanılıyor" iddianız oldukça yanıltıcı (yanlış değilse). Herkes modern sinir ağlarını eğitiyor GPU'larda. Çoğu kişi bunları GPU'lara da dağıtır, ancak bazı dağıtım ortamları (örneğin bazı cep telefonları) hala CPU kullanır.
Mike Izbicki

Mike ile hemfikirim. "GPU'lar eğitim için kullanılır ve çıkarım için CPU'lar" "CPU'lar eğitim için kullanılır ve GPU'lar çıkarım için kullanılır"
ASDF

@MikeIzbicki CUDA, OpenCL, vb. Gibi Boru Hattı mimarileri, hata düzeltmesi için büyük ölçüde CPU çekirdeklerine dayanan Derin Öğrenme eğitimi için gereklidir. Çıkarım boru hatları sadece GPU çekirdeklerini beslemek ve hasat etmek için CPU çekirdeklerine ihtiyaç duyar. Güç ve termal verimlilik hedeftir, bu nedenle çekirdek tipleri arasındaki denge eğitim ve çıkarım arasında değişir. Bunu zaten söyledim.
Birkensocks

-1

AI, çok çeşitli olası rotalara sahip inanılmaz geniş bir alandır. Bazıları son derece matematiksel, bazıları ise dokunaklı matematik. Diğerleri daha matematiksel yaklaşımlar için zaten iyi cevaplar verdiler. İşaret ettiğiniz konulardan

"Doğrusal Cebir, Olasılık / İstatistik, Analiz, Temel Algoritmalar ve Mantık"

-Temel olarak hepsine ihtiyacınız var veya bunlardan faydalanacaksınız. Birçok yaklaşım en azından kısmen doğrudan olasılık ve istatistiklere dayanır - sezgisel tarama, sinir ağları, genetik algoritmalar, bulanık mantık. Matematik eşit derecede yararlıdır - yapay zeka veya genel olarak bilişim biliminde neredeyse her yerde bulacaksınız. Doğrusal cebir kesinlikle ihtiyacınız olan bir şeydir.

Bir CS / AI perspektifinden en önemli iki konu algoritmalar ve mantıktır, algoritmalar bilgi işlem biliminin gerçek kalbidir ve mantık algoritmaların altında yatan 'dil' dir. ve temel programlamada pratik yapmak, neredeyse tüm bilgisayar bilimleri veya yapay zeka konularının en önemli temellerinden biridir. Programlama ayrıca üniversitelerin öğretimde her zaman özellikle iyi olmadığı bir beceridir. Mantık ayrıca yapay zekanın çoğu dalı için gerçekten gereklidir; Boole mantığı, yüklem hesabı, sembolik mantık, temel permütasyon teorileri, tasarım hiyerarşisi, özyineleme, sonlu durum makineleri, Turing Makineleri, CPU tasarımı, vb.

Kendi 'Güçlü AI' matematiğine uzanmak temel ancak kesinlikle önemli bir rol oynamaktadır. Temel matematiği çok iyi anlamak muhtemelen yüksek matematikten daha önemlidir, ancak gerçekten aldığınız her şey faydalı olabilir. Güçlü AI gibi yeni ortaya çıkan bir alanda asıl sorun, her şeyin havada olması ve böylece alanın toplam akışta olmasıdır.
Potansiyel olarak faydalı olan konular şunlardır: sinir ağları, genetik algoritmalar, nöroloji, genetik, psikoloji, sibernetik ve robotik, 3D grafik teorisi, görüntü işleme teorisi, bilgisayar oyunları tasarımı, felsefe, sanat teorisi, dijital elektronik, dilbilim teorisi .. Bir alanda bu okuma gibi öğrenmenin en önemli yollarından biridir. Benim için başlangıç ​​noktaları olan birkaç kitap vardı - Roger Penrose'un İmparatorları Yeni Aklı, RL Gregory'nin Gözü ve Beyini, ama gerçekten içgörüler neredeyse her yerden gelebilir

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.