Olasılık teorisi, ölçü teorisi ve son olarak makine öğrenimi hakkında bilgi edinmek istiyorum. Nereden başlamalıyım? [kapalı]


9

Olasılık teorisi, ölçü teorisi ve son olarak makine öğrenimi hakkında bilgi edinmek istiyorum. Nihai hedefim makine öğrenimini bir yazılımda kullanmak.

Üniversitede analiz ve çok temel bir olasılık okudum ama bu kadar. Bu konular hakkında bilgi edinmek için kullanabileceğim bazı çevrimiçi kurslar veya kitaplar biliyor musunuz? Web'de birçok kaynak buldum, ancak hepsi uzman bir kitleye yönelik görünüyor. Biraz zaman alacağını biliyorum ama en baştan öğrenmek istersem nereden başlarım?



2
Bu üç soru @General tarafından listelenen kopyalar tarafından oldukça iyi bir şekilde ele alınmıştır.
whuber

Yanıtlar:


13

Sanırım sizin için iki çok iyi ve popüler referans var (bunlarla başladım ve aktüeryal bilimde usta bir arka plana sahibim):

  1. İstatistiksel Öğrenmeye Giriş (R'de uygulama ile), Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani. Öyle serbestçe , sitede mevcut oldukça kapsamlı ve pratik örneklerle anlaşılması kolay. Çok güçlü bir istatistik arka planı olmasa bile birçok şeyi öğrenmeye başlayabilirsiniz, bu referans çeşitli profiller için iyidir ve matematiksel ayrıntılara girmeden R'deki uygulaması ile birlikte yeterli sayıda popüler algoritmayı içerir.

  2. İstatistiksel Öğrenmenin Unsurları Trevor Hastie, Robert Tibshirani, Jerome Friedman . Birincisi ile karşılaştırıldığında, sizin için yararlı bulduğunuz belirli algoritmaları daha fazla araştırmak istiyorsanız, bu kitap matematiksel yönlere daha derinlemesine gider. ( ücretsizdir )

Ve elbette Cross Validated benim için birçok şey öğrenebileceğiniz en iyi kaynaklardan biri: en iyi pratikler, istatistiksel yanlış anlama ve yanlış kullanım ve daha fazlası. Okullarda / üniversitelerde yıllarca öğrenmenin yanı sıra seft-öğrenmenin ardından, Cross Validated'a ilk gittiğimde bilinen bilgimin çok sınırlı olduğunu buldum. İlk ziyaretten beri her gün buraya gitmeye ve çok şey öğrenmeye devam ediyorum.


3
Bu referansları beğendiyseniz, Stanford'un çevrimiçi kurslarına dikkat edin. T. Hastie ve R. Tibshirani sıklıkla Makine Öğrenimi ile ilgili dersler vermektedir.
Marcel10

R'deki uygulama ile İstatistiksel Öğrenime Giriş'in yaklaşık% 20'sini okudum. Bu tam olarak aradığım şeydi. Harika bir kitap ve anlaşılması oldukça kolay. Çok teşekkür ederim! :)
Max

6

Şiddetle tavsiye edildiğini duyduğum birkaç ücretsiz çevrimiçi kurs:

  • http://projects.iq.harvard.edu/stat110/home (Olasılık teorisi ile mevcut rahatlığınıza bağlı olarak Dr. Blitzstein'ın kursu, istatistik / olasılıkta bulunmayanlar için bile Harvard'da çok popüler oldu. derslerden birkaçı kendi incelemem için ve onları çok yararlı buldu.)
  • https://www.coursera.org/learn/machine-learning (Bu, Stanford'un kurucu kursu Coursera'yı bitiren Andrew Ng'in ilk büyük çevrimiçi kurslarından birinin mevcut sürümüdür. , ama zamanım olmadı.)

5

ölçü teorisine ihtiyacınız yok. Ölçüm teorisi matematikçiler tarafından diğer matematiksel prosedürleri haklı göstermek için kullanılır, örneğin integral yaklaşımlarının sınırlarını almak. Çoğu mühendis ölçü teorisini incelemeyecek, sadece sonuçları kullanacaklardı. ML için gerekli olan matematik bilgisi kabaca çok değişkenli bir Gauss'u entegre edebilmekle karakterizedir. Bundan eminseniz, muhtemelen çok değişkenli analiz, doğrusal cebir ve olasılık teorisi arka planınız vardır.

Programcılara olasılık / istatistik öğretmeyi amaçlayan Think Down'ın Allen Downey tarafından tavsiye edilmesini öneriyorum. Fikir simülasyon yapmak için programlama uzmanlığından faydalanmak ve bu nedenle olasılık teorisini / istatistiksel yöntemleri anlamaktır. allen downey blog (başkalarını yazdı) Düşünme istatistikleri (ücretsiz) pdf )


4
Ölçü teorisi sürekli zaman stokastik süreçlerde faydalıdır. Aslında, sürekli zaman finansmanı (varlık fiyatlandırması) ile ilgili her makale aşağıdaki dua ile başlar(F,Ω,P)
Aksakal

@Aksakal bence sadece sürekli süreçler değil!
Metariat

5

Makine öğrenimi ile ilgilendiğiniz için, olasılık ve mesafeyi atlayıp ML'ye atlarım. Andrew Ng'in kursu e başlamak için harika bir yer. Kelimenin tam anlamıyla iki hafta içinde bitirebilirsiniz.

Birkaç hafta boyunca öğrendiklerinizle oynayın, sonra köklere geri dönün ve bazı olasılıkları inceleyin. Eğer bir mühendisseniz, o zaman üniversiteye nasıl girmeyi başardığınıza şaşkınım. Eskiden mühendislikte zorunlu bir derstir. Her neyse, burada MIT OCW kursuna katılabilirsiniz .

Ölçüm teorisine ihtiyacınız olduğunu düşünmüyorum. Kimse ölçü teorisine ihtiyaç duymaz. Yapanlar, buraya sormaya gelmezler, çünkü danışmanları hangi kursu alacağını söyler. Bir danışmanınız yoksa kesinlikle buna ihtiyacınız yoktur. Tautoloji, ama gerçek.

Bir ölçü teorisine sahip olan şey, bunu "kolay okuma" ile öğrenemeyeceğinizdir. Egzersizleri ve problemleri yapmak zorundasınız, temel olarak, zor yoldan yapın. Bence bu sınıf odasının dışında neredeyse imkansız. Buradaki en iyi seçenek, eğer sunacaksa, yerel kolejde bir ders almaktır. Bazen, doktora düzeyinde olasılıklar dersi, olasılıkla en iyi anlaşma olan bir sınıfta ölçüm ve olasılıkları yapar. Kendinize gerçekten işkence etmek istemiyorsanız, Matematik bölümünde saf bir ölçü teorisi dersi almanızı tavsiye etmem, ancak sonunda çok memnun kalacaksınız.


2

Makine öğrenimi için, Makine Öğrenmesi: Peter Flach tarafından Veri Algılayan Algoritma Sanatı ve Bilimi ile başlamak iyi bir kaynak olabilir. Sezgisel örneklerle makine öğrenmesine genel bir giriş sağlar ve yeni başlayanlar için uygundur. Bu kitabı özellikle makine öğrenimi deneyleriyle ilgili son bölüm nedeniyle seviyorum. Makine öğrenmeyi öğrenirken, farklı modelleri tanımak yeterli değildir ve kişi farklı makine öğrenme algoritmalarını karşılaştırabilmelidir. Bence bu kitap bu algoritmaları nasıl karşılaştıracağımızı anlamayı kolaylaştırdı. Ders slaytlarını burada bulabilirsiniz .


2

Yukarıdaki mükemmel önerilere eklemek için, olasılık ve istatistikteki daha temel kavramları sağlam bir şekilde kavramakla ilgileniyorsanız, "Algoritmalardan Z-Skorlarına: İstatistiklerde Olasılıksal Hesaplama" olasılık teorisi ve stokastik süreçlerdeki en önemli başlangıç ​​/ ara kavramlardan bazılarını anlayabilir Ayrıca makine öğrenimine (ML) giriş olarak ya "İstatistiksel Öğrenmeye Giriş" ya da "İstatistiksel Öğrenmenin Unsurları" (ESL) da ikinci olacağım. Özellikle ESL'nin şaşırtıcı olduğunu düşünüyorum, ancak ML kavramlarına çok daha fazla matematik ağırlıklı bir bakış atıyor, bu yüzden kendinizi istatistiklerde sadece "iyi" olarak değerlendirirseniz, daha fazla kazandıktan sonra bunu okumak isteyebilirsiniz. ML ile deneyim.

Çalışan veya problemleri çözmek için Makine Öğrenimi ile ilgileniyorsanız, uygulamalı deneyim elde etmek önemlidir. Veri bilimi / makine öğrenimi kurslarına biraz giriş yapın. Andrew Ng, burada Coursera'daki kursunda makine öğrenimi için şaşırtıcı bir giriş yapıyor . Ayrıca bazı veri kümelerini indirmenizi ve onlarla oynamaya başlamanızı öneririm. Henüz yapmadıysanız, R ve RStudio'yu indirin (bence, yeni başlayanlar için Python veya Matlab'dan daha arkadaş canlısı) ve kaggle'a kaydolun ve başlangıç ​​problemlerinden bazılarını yapın. Temelde gerçekte ne olduğu hakkında hiçbir fikriniz olmadan ML'yi kullanmanıza yardımcı olabilecek harika yollara sahipler, ancak aslında bir ML çözümü uygulamak için atmanız gereken adımlar hakkında bir fikir verir.

Şahsen ne yaptığını bilmeden ML araçlarını kullanmaya başlamanın bir kombinasyonunu teşvik ederim (Kaggle veri kümelerini veya benzerini kullanarak); çapraz doğrulama, aşırı uyum, karışıklık matrislerini kullanma, bir modelin ne kadar iyi olduğunun farklı ölçütleri vb. gibi temel kavramları öğrenmek. / algoritmaların nasıl çalıştığını anlamaktan çok çalışmıyor.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.