Makine öğrenimi için istatistik, başlayacak makaleler?


10

Bilgisayar programlama ve temel sayı teorisinde bir geçmişim var, ancak gerçek bir istatistik eğitimi yok ve son zamanlarda bir dizi tekniğin muhteşem dünyasının aslında istatistiksel bir dünya olduğunu "keşfettim". Matris çarpanlarına ayırma, matris tamamlama, yüksek boyutlu tensörler, düğünler, yoğunluk tahmini, Bayes çıkarsama, Markov bölümleri, özvektör hesaplaması, PageRank'ın tümü son derece istatistiksel tekniklerdir ve bu tür şeyleri kullanan makine öğrenme algoritmalarının çok fazla istatistik kullandıkları görülmektedir. .

Amacım, bu tür şeyleri tartışan makaleleri okuyabilmek ve kullanılan gösterimi, "kanıtları" ve istatistiksel argümanları anlarken algoritmaları uygulayabilmeniz veya oluşturabilmektir. Sanırım en zor şey matris içeren tüm ispatları takip etmek.

Hangi temel belgeler beni başlatabilir? Ya da üzerinde çalışmaya değer alıştırmalar içeren iyi bir ders kitabı mı?

Özellikle, tamamen anlamak istediğim bazı makaleler:

  1. Konveks Optimizasyonu ile Tam Matris Tamamlama, Candes, Recht, 2008
  2. Hızlı Cauchy Dönüşümü ve Daha Hızlı Sağlam Doğrusal Regresyon, Clarkson ve ark, 2013
  3. Destek Vektör Makineleri için Rastgele Projeksiyonlar, Paul ve ark., 2013
  4. Derin Yoğunluklu Modellerle Yüksek Boyutlu Olasılık Tahmini, Rippel, Adams, 2013
  5. Düşük Dereceli Matris Tamamlama için Hata Minimize Edici Tahminler ve Evrensel Giriş Bilge Hata Sınırları Elde Etme, Király, Theran, 2013

1
Matrislere zaten aşina mısınız, örneğin, uygulamalı bir lineer cebir kursu aracılığıyla, ya da öğrenmek istediğiniz şeyin bir parçası mı? Verdiğiniz listenin ilk yarısının, istatistiki teknikten ziyade istatistiklerde önemli olan konular olduğunu söyleyebilirim (bu bana ters yönde gidiyor). Burada istatistiksel makine öğrenimi öğrenmek için önerilen kitaplar hakkında birkaç soru vardır. Sana bir örnek veya ikisini sağlayan öneririm belirli anladığınızı istediğinizi rastlamak ettik kağıtları; Bu, aldığınız cevaplara daha iyi odaklanmanıza yardımcı olacaktır.
kardinal

2
Evet, matrislere, lineer cebir ve vektör uzayı, temel, norm kavramlarına aşina, ama LU faktorizasyonu gibi şeyleri tam olarak anlamıyorum, ancak Gram-Schmidt ortogonalizasyonu ve optimize edilmemiş QR algoritması hakkında oldukça netim. neden çalıştıkları konusunda net değil . Ayrıca insanların üzerinde bir özvektör algoritması gerçekleştirmeden rastgele bir matris için özvektörleri nasıl türetebildiklerini anlamıyorum .
Cris Stringfellow

Yanıtlar:


2

Coursera'da Andrew Ngs Machine Learning kursunu tavsiye ederim, tüm temel konularda mükemmel bir kapsama sahiptir. Olasılıksal grafik modellerle ilgili bir şey okuyorsanız, Daphne Kollers kursuna da göz atmanız iyi olur.

Bu da kendi kendine çalışma kaynakları için bir hazine http://ragle.sanukcode.net/articles/machine-learning-self-study-resources/ Herb Grossman adlı ders müthiş.

Ayrıca her zaman hala kendimi öğreniyorum ve istatistikler benim arka planım olmadığından, bu kitap https://www.openintro.org/stat/textbook.php tavsiye edildi.

Benim iki sent şey ve kağıtları matematik tarafında olsa da arka plan matematik çok yakalanmış değilsiniz. Temel bilgileri öğrenin ve bahsettiğiniz bu kağıtların üzerine inşa edildiği makalelere atıfta bulunun ve daha kolay olduklarını görün (belki anlayabileceğiniz bir şey elde etmek için birkaç makaleye geri dönmeniz gerekir - bu kendim yaptığım şey) ML'de matematik farklı unsurları ve bir tavşan deliğinden emilmek kolaydır (yine kendimi bir kereden fazla yaptığım bir şey!).

İyi şanslar, gerçekten ilginç bir alan!

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.