Matematikte güçlü bir geçmiş ML için toplam bir gereklilik midir?


37

Kendi beceri setimi geliştirmek istemeye başladım ve her zaman makine öğrenmekten çok etkilendim. Ancak, bunu yapmak yerine altı yıl önce, bilgisayar bilimi ile tamamen alakasız bir derece almaya karar verdim.

Yaklaşık 8-10 yıldır yazılım ve uygulamalar geliştiriyorum, bu yüzden iyi bir tutuma sahibim ancak makine öğreniminin / olasılıklarının / istatistiklerinin matematik tarafına giremiyor gibiyim.

Öğrenim materyallerine bakmaya başladım ve ilk sayfada beni kafam karıştıran ve derhal öğrenmemde bir engel oluşturan bir şey içerebilir.

  • Matematikte güçlü bir geçmiş ML için toplam bir gereklilik midir? ML ile devam etmeden önce matematik boşluklarımı doldurmalı mıyım? Kendi kendine öğrenme, herhangi bir sabit bilgisayar bilimi geçmişine sahip olmayan bir geliştirici için gerçekten işe yarayabilir mi?

İlgili soru:


4
Bayesian uygulamaları için en azından ve muhtemelen bazı olasılıkları da lineer cebiri çok iyi anlamanız gerektiğini söyleyebilirim. Ayrıca, matematiği şifreye çevirmekte rahat olmanız ve ayrıca gösterim kurallarına göre (hiç de tutarlı olmayan) uyarlanabilir olmanız gerekir. ML, çoğu bilgisayar bilimcisi için de kolay değildir.
John Moeller

3
Soruların birbiriyle ilgili olduğuna inanmıyorum. Bunu çok davetkar bir stackexchange sitesi yaptığınız ve soruyu kapadığınız için teşekkür ederiz. Bana bir kitap önerecek kimseden bahsetmedim bile. Bu, "olası yinelemeyi" temel alan bir yineleme değil
Layke

2
Meta'dan (8 saat önce) bu konuyu tekrar açmak isteyen bir iş parçacığı yaptım. meta.stats.stackexchange.com/questions/1442/…
Douglas Zare

1
Teşekkür ederim. Yine de "çok öznel" veya "gerçek bir soru değil" olarak kapatılabilir, ancak kesinlikle bir kopya değildir.
12'de

1
Layke, @Douglas Zare tarafından başlatılan meta konu başlığında açıklandığı gibi, bu soruyu sizin için potansiyel bir iyilik olarak değerlendirmeyi umarız , çünkü hemen sorunuzu yanıtlayan ilgili konulara hemen erişmenizi sağlar. Ancak, yinelenen olması amaçlanmadığını belirttiğinizden , bu sitedeki benzer soruları benzer şekilde yinelemeyen anlamını netleştirmek için sorunuzu düzenlemeyi düşünür müsünüz? Tekrar açmaktan mutlu oluruz.
whuber

Yanıtlar:


23

Stanford (Ng) ve Caltech (Abu-Mostafa) YouTube'da makine öğrenimi dersleri verdi. Ödevleri göremiyorsunuz ama dersler bunlara dayanmıyor. Bunları izlemeye çalışmanızı öneririm, çünkü bunlar, hangi matematiği öğrenmeniz gerektiğini öğrenmenize yardımcı olacaktır. Ng'nin yaratmasına yardım eden Coursera'da Andrew Ng tarafından ödevlerle benzer bir sınıfın öğretildiğine inanıyorum.

Bir istisna: Doğru hatırlıyorsam, Stanford'daki derslerin başında Ng, matris ürünlerinin izlerinin türevlerini içeren bazı hesaplamalar yapar. Bunlar oldukça izole, bu yüzden bu hesaplamaları takip etmezseniz endişelenmeyin. Hangi kursun bunları kapsayacağını bile bilmiyorum.

Olasılık, doğrusal cebir, doğrusal programlama ve çok değişkenli hesaplamalar hakkında biraz bilgi sahibi olmak istersiniz. Ancak, bu konularda birçok tam üniversite sınıfında bulunanlardan çok daha azına ihtiyacınız var.



15

Uygulamanın türüne bağlı olarak, bir ML uygulayıcısı olarak mutlaka çok fazla matematik gerekli değildir.

Kendi kendine öğretilen bir programcı (~ 15 yıl) ve matematik (Calculus III) veya istatistikte pek bir arka plan olmadan sık sık üniversiteden ayrılma olarak, birkaç kaynakla makine öğrenimi / veri madenciliği ile başladım:

  • Berry ve Linoff'un "Veri Madenciliğinde Ustalaşma: Müşteri İlişkileri Yönetimi Sanatı ve Bilimi" kitabı

  • Aynı yazarlar tarafından "Veri Madenciliği Teknikleri" kitabı

  • Özellikle R ve paketleri parti ve nnet

Kar amacı gütmeyen bir pazarlama ve operasyon alanında çalışıyorum. Özellikle başlangıçta, doğrudan posta temyizlerinde veri madenciliğini kullandım.

Daha sonra CSU'da Lineer Cebir, Andrew Ng'un Makine Öğrenmesi, İstatistiksel Yöntemlere Giriş (STAT 301) kullandım.

Sizin için iki kitapla başlamanızı, Andrew Ng'un kursunu ve uygulamanıza bağlı olarak karar ağaçlarını (R'deki parti paketi) başlamanızı öneririm.


9

Bence bu gerçekten iyi bir soru ve çok topikal; Ancak bir cevap olup olmadığından emin değilim. Son zamanlarda yayınlanan bir makalede , veri biliminin çevrimiçi öğrenmenin kolay olduğunu öne sürerek bir tartışma tartışması yaşandı ( buraya bakınız ). Bununla birlikte, bu makalede bahsedilen vaka çalışmalarının çoğuyla ilgili dikkate değer bir şey, onların aktüeryal veya matematiksel kökenden gelmeleridir.

Bu ilginç bir nokta, çünkü Coursera, Stanford ve edX gibi çevrimiçi kurslar, gerekli bilgisayar bilimi becerilerini öğretmede yardımcı olurken, uyguladığınız modellerin ne yaptığını anlamak için bazı matematiksel temellerin gerekli olması muhtemel olduğunu gösteriyor. . Öte yandan, bu adamların hepsinin analitik olarak başlamaya başladığına dair eşit derecede güçlü bir argüman ortaya konulabilir ve bu yüzden hem niceliksel disiplinlerde çalıştıkları hem de makine öğrenmesini neden kolayca öğrendikleri ve yarışmalar kazandıkları budur.

Temelde burada bir miktar analiz problemi olduğunu düşünüyorum. Matematiksel beceriler bazen uyguladığınız algoritmaların olasılıksal kökenlerini anlamada yardımcı olurken, iyi bir yazılım mühendisliği becerisinin yüksek düzeyde analiz yapmanıza ve algoritmaların parçalarını bir araya getirmenize izin vererek ekleyebileceği gibi bir argüman vardır. hedefini gerçekleştirmek için neden bunu yaptıklarını tam olarak anlamamış olsanız bile . Genel olarak, veri bilimi (ve dernek tarafından makine öğrenmesi) tam da bu genişlik nedeniyle heyecan verici bir alandır - bir veritabanı görevlisi olabilir ve problemleri çözmek için kaba bir güç veya simülasyon kullanan bir matematikçi veya iyi tasarlanmış bir bilgisayar uzmanı olabilirsiniz farklı algoritmaları ve yaklaşımları en uygun şekilde bir araya getirme kodu.

Tahmine katkıda bulunan tüm yaklaşımlar iyidir, bu yüzden bazı matematik öğrenmenin size bu alanda en iyi başarı şansını vermek için iyi bir fikir olabileceğini söyleyebilirim. Bazı iyi başlangıç ​​noktaları istiyorsanız, MIT'nin bazı güzel hesaplama uygulamaları ile anlaşılması kolay bulduğum büyük bir doğrusal cebir kursu vardır . Ayrıca, stokastik süreçler ve çok değişkenli analizler hakkında bilginizi arttırmada ilgisini çekebilecek başka kurslar da vardır.


Analitik fikirli olmayan insanlara (ya da yoksul soyutlayıcıların) matematiği basitleştirerek gerçekten yardım edilmemesi, her zaman beni ilgilendirdi (+1). Ayrıca Strang lineer cebir kursunu beğendi, fakat lineer cebir kaba kuvvet hesaplamaları ile tutturulmuş ilk matematik değil mi? Veri bilimine gelince bağlantı kolay, muhtemelen birisi zaten yükselişe geçti ancak sahte borsa yarışmalarında binin 1 veya 2'si artı usaully ustaları yenerdi - bu yüzden herhangi biri rick picking hisse senetleri alabilir!
phaneron

4

Matematikte güçlü bir geçmiş ML için toplam bir gereklilik midir? - ML için bir cevap ve bazı spekülasyonlar istatistik olarak kavramsallaştırılmış ;-)

1990'lı yıllarda bilgisayar cebirinin yardımda olmasını umuyordum, sanırım öyle ama oldukça sınırlı. Fakat kesinlikle matematik öğrenmesini hızlandırmaya yardımcı olur (pratik olarak manipülatör becerilerini geliştirmeye daha az ihtiyaç duyar veya sadece basit alıştırmaları yapabilmek için uğraşmaya çalışırsınız). Fred Szabo'nun Mathematica ile Doğrusal Cebiri bunun mükemmel bir örneği olarak buldum (ancak daha önce teorik düzeyde bir doğrusal cebir dersi almıştım.)

1988'den beri (İstatistikten Teoremleri ve Prensipleri “Kesinleştirmek” için Bilgisayar Yoğun Metotları Kullanarak - Kesinlikle) kullanarak yanıtı hayırlı ya da en azından gerekli olmayan (istatistiklerle) çalışmaktayım. Kişi ek matematiksel beceri ve anlayışla her zaman daha hızlı ve daha genel olarak anlayabilecektir. Sanırım yaklaşmaya başladım, ancak bir olasılıkla üretken olasılık modellerinin manipüle edilebilir bir şekilde gösterilmesine ve sadece oyuncak problemlerinden daha fazlası için geçerli ve yararlı olan çıkarımlara ihtiyacım var .

ML ile devam etmeden önce matematik boşluklarımı doldurmalı mıyım?

Bu zor bir çaba - MHO’da istatistikleri anlayan herkes , standart ve özellikle o kadar da standart olmayan olasılık üretme modelleri ve çıkarımın matematiksel karakteristiklerini (matematiksel istatistiklerin en üst x% 'si) standart matematiksel gösterimleri manipüle ederek oraya ulaştı. Yani sadece temel bilgileri almakla kalmıyor, aynı zamanda matematiği de rahat ettiriyor. (Bir kenara, benim için Fourier Teorisi çok önemliydi.)

Bu temsiller neden zor (matematikle bile)?

Gerd Gigerenzer, _natural frekansları kullanarak verilen test pozitif / negatif problemi ile verilen basit pozitif / negatif basit sorunlara karşı bir zorluk olmadığını hemen hemen belirledi ”. Bağlantılı sorudan yapılan bir referans, http://www.autonlab.org/tutorials/prob18.pdf adresinden iyi bir şekilde faydalanıyor gibi görünüyor.

Bu neden genelleme yapmak zor?

K testleri için (tekrarlanan veya farklı) - 2 ^ k

V değerlerini alan testler için - v ^ k

İkili bilinmeyen için - 2 * v ^ k örnek yolu olasılıkları

P çoklu ikili bilinmeyenler için 2 ^ p * v ^ k

P çoklu rasyonel bilinmeyenler için Q ^ p * v ^ k

Bunlardan biri, matematiksel uzmanlıkta bile birçok yanlış anlaşılmalara ve görünen paradokslara (örn. Borel paradoksu gibi) yol açan, bununla başa çıkabilmek için sayılabilir ve sayılamayan sınırlarla matematiğe hızla geçer.

Ek olarak, doğrusal olmayan tehlikeli yanlış anlamalara karşı doğrusallık vardır (örn . Önceden dağıtıma ilişkin bilgi içermeyen Winbug'ların ve diğer MCMC'lerin Gizli Bilgi Öncesi Belirtimlerinin Gizli Tehlikeleri ) ve etkileşimler ve rastgele etkiler, vb.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.