Veri madenciliği ve makine öğrenmesi için hangi matematik dersleri hazırlamayı önerirsiniz?


30

Veri madenciliği ve makine öğrenmesini öğrenmek için kendi kendine yönlendirilen bir matematik müfredatını oluşturmaya çalışıyorum. Bu, Andrew Ng'un makine öğrenme dersini Coursera'da başlatıp ilerlemeden önce matematik becerilerimi geliştirmek için gerekli olduğumu hissetmekle motive oluyor . Bir süre önce üniversiteden mezun oldum, bu yüzden cebirim ve istatistiklerim (özellikle siyaset bilimi / psikoloji derslerinden) paslıyım.

Konudaki cevaplar Matematikte güçlü bir arka plan ML için toplam bir gereklilik midir? yalnızca makine öğrenmesiyle doğrudan ilişkili kitapları veya sınıfları önerebilir; Bu sınıfların ve kitapların bazılarına çoktan baktım ve hangi matematiğin inceleneceğini tam olarak bilmiyorum (örneğin: matematik adresinin hangi alanı / alanlarını "bir maliyet fonksiyonunu en aza indirmeye")? Önerilen diğer konu ( Becerilerin ve derslerin bir veri analisti olması gerekiyordu ) yalnızca verileri analiz etmek için gereken geniş beceri kategorilerinden bahsediyor. İplik matematikçiler için istatistiğe giriş Zaten matematik bir derece yok çünkü geçerli değildir; Benzer bir konu Matematikçi eşdeğer bilgiyi kalite istatistik derecesine istiyor İstatistikleri kitaplarının inanılmaz bir listesi var, ama yine de, cebirin paslı bir hatırlanmasından matematiğe başlamayı ve oradan hareket etmeyi düşünüyorum.

Peki, makine öğrenimi ve veri madenciliği alanında çalışanlar için, işinizi yapmak için hangi matematik alanlarını gerekli buluyorsunuz? Veri madenciliği ve makine öğrenimi için hangi matematik konularına hazırlanmayı ve hangi sırayla önerirsiniz? Şimdiye kadar sahip olduğum liste ve sipariş:

  • Cebir
  • Ön-hesap
  • hesap
  • Lineer Cebir
  • olasılık
  • İstatistikler (buradaki pek çok farklı alt alan var, ancak bunları nasıl kıracağınızı bilmiyoruz)

Veri madenciliği ve makine öğrenimi gelince, şu anki işim aracılığıyla web sitesi / uygulama etkinliği, müşteri / abonelik işlemleri ve emlak verileri (hem statik hem de zaman serisi) kayıtlarına erişebiliyorum. Veri madenciliği ve makine öğrenmesini bu veri setlerine uygulamayı umuyorum.

Teşekkür ederim!

DÜZENLE:

Gelecekteki iyilik için, Geoffrey Gordon'un / Alex Smola'nın CMU'daki Makine Öğrenmesi sınıfına girmesi için yararlı bir matematik öz değerlendirmesi yapmak istedim .


3
Coursera derslerinin önkoşulları açısından, bu bilgi materyallerinde bir yerde bulunmalıdır. Sınıflarının dışında / daha genel olarak, stat / ML / DM için hangi matematiğe ihtiyaç duyduğunuz sorusunun bir kopyası olarak beni etkiliyor. De dahil olmak üzere, bu malzemenin kapak CV çeşitli konuları vardır: a--kuvvetli arka-matematik-a Koşul-için-ml arasında değişmektedir , ve beceri kurs ihtiyaç duyulan-to-be-a-veri analisti ( belki diğerleri arasında).
gung - Reinstate Monica

1
Lütfen bu konulara, yakından ilişkili olan konulara ve belki de siteye bakın. Etrafta okuduktan sonra hala bir sorunuz varsa, buraya geri dönün ve bu Q'yu daha belirgin hale getirmek / başka bir yerde kapsanmayan hala bilmeniz gerekenleri daha kesin belirtmek için düzenleyin.
gung - Reinstate Monica

Yanıtlar:


15

@Gung tarafından yapılan öneriler kesinlikle takip etmeye değer. Elbette kursu yaptıktan sonra, listenin iyi bir başlangıç ​​olduğunu düşünüyorum. Bazı yorumlar:

  1. Doğrusal cebir ve matris cebiri aynı şeydir, ikincisini bırakın.
  2. matematikte kısmi farklılaşma içerdiğinden emin olun. Bu demek, eğer hesap, sembolik olarak birden fazla değişken (işlevleri uygulanan bir fonksiyonudur ve daha sonra, istediğiniz yerine ). Neyse ki bu zor değil.x y zzxy dzzxdzdx
  3. matematikte, temel entegrasyonun ötesinde bir şeye ihtiyacınız yoktur (ve belki de bu olmayabilir). Bu çok şanslı çünkü entegrasyon zor.
  4. temel optimizasyon ekleyin, yani bir fonksiyonun maksimum veya minimumunu, genellikle birden fazla değişkenli bir fonksiyonu bulma. En azından gradyan inişini takdir etmek esastır.
  5. zorluk açısından, muhtemelen lisansın başlangıcı ile bitişi arasında bir yerde olmak istersiniz.
  6. bazı temel olasılık ve istatistik metinlerini çevrimiçi ya da başka bir şekilde okumaya çalışın, ancak çok fazla endişelenmeyin (temel matematik, olasılık ve istatistiklerin anlaşılması için bir ön koşuldur). Önerdiğiniz gibi bazı kurslar yaparsanız, neyi öğrenmeniz gerektiğini ve ilgi alanlarınızın nerede olduğunu öğreneceksiniz. Yapmak istemediğiniz bir şey, en azından ilk önce, hipotez testi hakkında bilgi edinmek için çok zaman harcamaktır. Rasgele değişkenler, olasılık dağılımları (PFD'ler, CDF'ler), tanımlayıcı istatistikler gibi temel istatistikleri anlamaya yönlendirmek ve ardından gerilemeyi anlamaya çalışmak istersiniz.

5

Bu forumda birkaç tane mükemmel konu var - BU da BİR de dahil olmak üzere , veri bilimi çalışmaları için önemli becerilerin kavramsal bir taslağını geliştirmek konusunda özellikle benim için faydalı bulduğum.

Yukarıda belirtildiği gibi, mevcut birçok çevrimiçi kurs vardır. Örneğin, Coursera'da , muhtemelen işiniz için ihtiyaç duyacağınız bazı araçları kapsayacak bir dizi kursu içeren bir Veri Bilimi Uzmanlığı bulunmaktadır.


3

Makine öğrenmesi / veri madenciliği alanında birikim yapmak istiyorsanız, optimizasyon / doğrusal cebir / istatistik ve olasılıkları şiddetle tavsiye ederim. İşte olasılıkla ilgili kitapların bir listesi. Umarım yardımcı olur.


3

Çok temel matematik becerilerini geliştirmek için şu kitapları kullanıyorum:

İktisat ve Finans için Matematiğin Unsurları. Mavron, Vassilis C., Phillips, Timothy N Bu kitap, kısmi farklılaşma, entegrasyon, matris ve determinantlarla ilgili temel matematik becerilerini (ek çıkarma) ve optimizasyon ve diferansiyel denklem ile ilgili küçük bir bölümü kapsar. Ekonomi ve finansı hedef alıyor, ancak küçük bir kitap, bölümlerin sırası benim ihtiyacımı karşılıyor ve benim için kolay okunuyor.

İstatistiksel Analiz: Microsoft Excel 2010. Conrad Carlberg Temel istatistiksel analizleri, çoklu regresyona ve kovaryans analizine kapsar ve excel kullanır.

R. Andy Field, Jeremy Miles, Zoë Field Kullanarak İstatistikleri Keşfetmek. Henüz okumadım. R kullanır.

İlköğretim Lineer Cebir. Ron Larson, David C. Falvo.

Matris Metodları: Uygulamalı Lineer Cebir Richard Bronson, Gabriel B. Costa. temel lineer cebir ve matris analizini kapsar

Bunlar veri madenciliği / makine öğrenmesi ile ilgili kullandığım temel matematik kitapları.

Bu yardımcı olur umarım


3

İlgili kaynaklar listelenir (ve kategorize) oldukça çok var burada sözde "Açık Kaynak Veri Bilim Masters" da.

Özellikle matematik için listeler:

  1. Doğrusal Cebir ve Programlama
  2. istatistik
  3. Diferensiyel Denklemler ve Analiz

Oldukça genel öneriler, ancak yararlı bulabileceğiniz bazı ders kitaplarını listelemelerine rağmen.


2
  • Olasılık ve istatistik esastır. Bazı anahtar kelimeler hipotez testi, çok değişkenli normal dağılım, Bayesci çıkarım (eklem olasılığı, koşullu olasılık), ortalama, varyans, kovaryans, Kullback-Leibler sapması, ...
  • Makine öğrenmesi için temel doğrusal cebir önemlidir. Öğrenebileceğiniz konular Eigen ayrışması ve tekil değer ayrışmasıdır. (Tabii ki bir matris ürününü nasıl hesaplayacağınızı da bilmelisiniz.)
  • TooTone'un daha önce de belirtildiği gibi: optimizasyon önemlidir. Gradyan inişinin ne olduğunu bilmeniz ve belki de Newton'un yöntemine, Levenberg-Marquardt, Broyden-Fletcher-Goldfarb-Shanno'ya bir göz atmanız gerekir.
  • Analiz o kadar önemli değildir, ancak fonksiyonların kısmi türevlerini (Jacobi matrisi, Hesse matrisi, ...) nasıl hesaplayacağınızı bilmek faydalı olabilir ve bir integralin ne olduğunu bilmelisiniz.

0

Lineer Cebir, İstatistikler, Matematik. Sanırım onları ML ile birlikte - ya da temel bilgilerden sonra öğrenebilirsiniz . Başlangıç ​​kursları / kitapları matematik dersi bölümleriyle harika bir iş çıkarır ve siz ML öğrenirken matematik temellerini öğrenirsiniz. Makine öğrenmesi için gereken matematik ve onları öğrenmek için gereken kaynaklar üzerine bir podcast bölümü hazırladım: 8


0

Herhangi bir makine öğrenim kursuna başlamadan önce matematik dersini takip edin. Ayrıca tek seferde kazmaya çalışmayın. Temel kavramları öğrenip matematik becerilerinizi geliştirin ve tekrarlayın: -

Matematik Konuları aşağıdaki gibidir: -

  • Lineer Cebir
  • olasılık
  • Temel Analiz
  • Maxima ve fonksiyon minima
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.