Makine öğrenme yemek kitabı / referans kartı / hile sayfası?


57

Olasılık ve İstatistik Yemek Kitabı ve Veri Madenciliği İçin R Referans Kartı gibi kaynakları inanılmaz derecede faydalı buluyorum . Belli ki referans olarak iyi hizmet ediyorlar ama aynı zamanda bir konu hakkındaki düşüncelerimi düzenlememe ve toprağın düzenini almama yardımcı oluyorlar.

S: Bu kaynaklara benzer bir şey makine öğrenme yöntemleri için var mı?

Her ML yöntemi için içerecek bir referans kartı hayal ediyorum:

  • Genel Özellikler
  • Yöntem iyi çalıştığında
  • Yöntem zayıf olduğunda
  • Yöntem hangi yöntemlerden veya hangi yöntemden genellenir. Çoğunlukla yerini aldı mı?
  • Yönteme ilişkin yazılı makaleler
  • Yöntemle ilgili problemleri açın
  • Hesaplama yoğunluğu

Bütün bu şeyler, eminim ders kitaplarını asgari kazma ile bulunabilir. Onları birkaç sayfada görmek gerçekten kolay olurdu.


5
Güzel bir hedef, ancak "bazı ders kitaplarını çok az kazmak"? Kişi, bu 20 Kitabı, istatistiksel öğrenme ve veri madenciliği + mloss.org/software/rating için söyleyerek nasıl sıkıştırabilir ?
denis,


2
(+1) chuzpa için, eğer böyle bir genel bakış varsa, parasını öderdim. Kilit problem, algoritmanın kendisinden elde edilebilecek bazı özelliklerin yanı sıra, bu özelliklerin veya kuralların çoğunluğunun tecrübe, yani uygulama ile kazanılmış olmasıdır. Savaşta sertleşmiş uygulamalı bir araştırmacı veya ML-framework-programcı / danışmanının bunun gibi bir şey yazabileceğinden eminim ... ama şimdi ve burada?
steffen

@Denis: "20 kitap .." bağlantısı çalışmıyor, bunu kontrol edebilir misiniz?
lmsasu

6
Makine öğrenimi uzmanı değilim, bu yüzden başkalarına cevap yazmayı erteleyeceğim ama İstatistiksel Öğrenmenin Öğelerinin konuyla ilgili iyi bir metin olarak kabul edildiğini ve alandaki en büyük isimlerden bazıları tarafından yazıldığını düşünüyorum. Bu kitabın yüksek düzeyde yazıldığını ve duyduğum kişilerin istatistiklerinde doktora yapmasını önerdiğini eklemeliyim.
Makro

Yanıtlar:


25

En iyi ve serbestçe kullanılabilir kaynaklardan bazıları şunlardır:

Yazarın sorusuna gelince, "Bir sayfada hepsi bir arada" çözümü ile tanışmadım


Sergey, Barber'ın kitabı Matlab'a mı bağlı?
denis,

2
Evet, sadece kitabın bağlantısına bir göz atın: BRMLtool kutusu, okuyucuların matematiksel modellerin gerçek MAT-LAB koduna nasıl çevrildiğini görmelerine yardımcı olmak için sağlanmıştır.
Sergey

31

Makine Öğrenmeyi öğrenmek istiyorsanız, Prof. Andrew Ng tarafından verilen kışın ücretsiz çevrimiçi ML kursuna katılmanızı şiddetle tavsiye ediyorum .

Birincisini sonbaharda yaptım ve tüm öğrenme materyalleri olağanüstü kalitede ve pratik uygulamalara yönelikti ve bir kitapla tek başına mücadele etmenin çok daha kolay olmasını sağladım.

Ayrıca, sezgisel açıklamaları ve asgari miktarda matematik ile oldukça düşük asılı bir meyve yapıldı.


Bu kursu yeni bitirdim ve harika! Ayrıca, makine öğrenmeyle ilgili kitapları anlamada harika bir başlangıç ​​yaptı.
B Yedi

1
Bence bu bağlantı şu anda coursera.org/course/ml
n611x007

14

Evet iyisin; Christopher Bishop'ın "Örüntü Tanıma ve Makine Öğrenmesi" genel referans için mükemmel bir kitaptır, gerçekten yanlış gidemem.

Oldukça yeni bir kitap ama aynı zamanda çok iyi yazılmış ve aynı derecede geniş, David Barber'ın “ Bayesian Reasoning and Machine Learning ”; Hissedeceğim bir kitap, alandaki yeni gelenler için biraz daha uygundur.

Hastie ve ark.nın "İstatistiksel Öğrenmenin Öğeleri" ni kullandım. (Macro tarafından belirtilmiştir) ve çok güçlü bir kitap iken, ilk referans olarak tavsiye etmem; belki size daha özel konular için ikinci bir referans olarak daha iyi hizmet verebilir. Bu açıdan, David MacKay'ın Bilgi Kuramı, Çıkarımı ve Öğrenme Algoritmaları kitabı muhteşem bir iş de yapabilir.


2
Bishop için +1. Düzgün bir ayrıntı düzeyi ile net bir gelişim. Hala iyiyken daima Hastie ve ark. biraz dalgalı.
conjugateprior

1
+1 - Hastie, Tibshirani ve Friedman benim kişisel favorim.
StasK

1
Benim de favorim olan Hastie, Tibshirani ve Friedman'ı önermek için de +1. Diğer öneriler için teşekkürler; Onlara bir okuma vereceğim çünkü istatistikçi olmayanlara (veya alana yeni giren kişilere) tavsiye etmek için gerçekten iyi bir kitaba ihtiyacım var.
Néstor

1
Bishop için +1. Aslında klasik istatistikler için de harika bir kaynak ama güncellendi ve gizlenmiş durumda.
söylemektedir

10

Mutabakat bu sorunun yinelemeli olmadığı için, makine öğrenen yeni başlayanlar için en sevdiğim şeyi paylaşmak istiyorum:

Programcı Kolektif Zekayı yeni başlayanlar için en kolay kitap olarak buldum , çünkü yazar Toby Segaran , medyan yazılım geliştiricinin ellerini olabildiğince hızlı veri kesmekle kirletmesini sağlamaya odaklandı.

Tipik bölüm: Veri problemi açıkça tanımlanmış, ardından algoritmanın nasıl çalıştığını ve nihayet birkaç satırlık kodla bazı içgörüler oluşturulacağını gösteren kaba bir açıklama izlenmiştir.

Python'un kullanımı kişinin her şeyi oldukça hızlı bir şekilde anlamasını sağlar (Python'u bilmenize gerek yok, cidden, daha önce de bilmiyordum). DONT, bu kitabın yalnızca danışman sistemi yaratmaya odaklandığını düşünüyor. Ayrıca metin madenciliği / spam filtreleme / optimizasyon / kümeleme / doğrulama vb. İle ilgilenir ve bu nedenle size her veri madencisinin temel araçları hakkında temiz bir genel bakış sunar.


6

Witten ve Frank, "Veri Madenciliği", Elsevier 2005, kitapla birlikte bir Java kod kütüphanesi (Weka) bulunduğundan ve pratik yönelimli olduğundan, kendi kendine öğrenme için iyi bir kitaptır. Sanırım sahip olduğumdan daha yeni bir sürüm var.


1
Evet, bu kitaba "Makine Öğrenmesi" deniyordu, ancak isim yayıncıların o sırada veri madenciliği yutturmacalarına binmek için yayıncıları tarafından "Veri Madenciliği" olarak değiştirildi, yine de kitap DM değil (iki benzerlikle ilgili, ama farklı alanlardır!).
clyfe

1
Tom Mitchell'in "Makine Öğrenmesi" kitabı da çok iyi; tarzı biraz eski, ama içeriği mükemmel.
Dikran Marsupial

Evet, Tom Mitchell'in ML'si ML incilleri gibidir, sahada çok kapsamlı!
Aralık'ta


5

“İstatistiksel Öğrenmenin Öğeleri” amaçlarınız için harika bir kitap olacaktır. 2011'in başlarında basılan kitabın 5. basımı http://www.stanford.edu/~hastie/local.ftp/Springer/ESLII_print5.pdf adresinde ücretsiz olarak mevcuttur.


2
matematik ağır kitabıdır, bu nedenle öğrenen kişinin izlemesi zor olabilir.
Atilla Özgür

Springer bunun için 70 $ 'ı alırken Trevor Hastie'nin kişisel sayfalarında nasıl ücretsiz indirilebileceğini biliyor musunuz?
Alfred M.,

Emin değilim, ama Springer'ın parayı istediğini ve yazarların kitaplarını geniş çapta yayınlamak istediğini hayal ediyorum. Bu, Springer'in size yayınlanan makaleleri nasıl satacağına çok benziyor ancak yazarın web sitesinde birçok "çalışma kağıdı sürümü" ücretsiz olarak sunuluyor.
DanB

Bilginize, indirme 5 içindir baskı ikinci baskısının. Deming'e atfedilen "Tanrı'ya güveniyoruz, diğer herkes veri getiriyor" yazısının dipnotunu seviyorum. Dipnot, ironiyi, Deming'in gerçekten söylediğini doğrulayan hiçbir "veri" bulunamadığına işaret ediyor.
HeatfanJohn 25:12

Sen belirtmeliyim R ile İstatistiksel Öğrenme Giriş çeşit kendi gibi --O ESL (matematik eğer -Lite ESL çok zor olduğunu).
Steve S

5

görüntü tanımını buraya girin

Genellikle bir makine öğrenme problemini çözmenin en zor kısmı iş için doğru tahminciyi bulmak olabilir. Farklı tahminciler, farklı veri türleri ve farklı problemler için daha uygundur. Aşağıdaki akış çizelgesi, kullanıcılara verileriniz üzerinde hangi tahmin edicilerin deneneceği ile ilgili sorunlara nasıl yaklaşılacağı konusunda biraz yardımcı olacak şekilde tasarlanmıştır. Belgelerini görmek için aşağıdaki tablodaki herhangi bir tahmin ediciye tıklayın.



3

Diğer cevaplarda bahsedilen kitapların çoğu çok iyi ve bunlardan hiçbirinde gerçekten yanlış gidemezsiniz. Ayrıca, Python's için aşağıdaki kopya kağıdıscikit-learn oldukça yararlı buluyorum .


2

Duda, Hart ve Stork "Desen Sınıflandırması" nı seviyorum. Bu, her şeyi çok iyi açıklayan klasik bir metnin son halidir. Sinir ağları ve SVM'lerin kapsandığı güncellendiğinden emin değilim. Hastie, Tibshirani ve Friedman'ın kitabı en iyisidir, ancak aradığınızdan biraz daha teknik olabilir ve konuya genel bir bakıştan ziyade ayrıntılıdır.


2

Microsoft Azure ayrıca, Anton Tarasenko tarafından yayınlanan bir bilim-kurgu öğrenimine benzer bir kopya kağıdı da sağlıyor.

Microsoft Azure Makine Öğrenme Algoritması Hile Sayfası

(kaynak: https://docs.microsoft.com/en-us/azure/machine-learning/machine-learning-algorithm-cheat-sheet )

Bir ihbarla eşlik ederler:

Bu algoritma hile sayfasında sunulan öneriler yaklaşık kurallardır. Bazıları bükülebilir, bazıları ise açıkça ihlal edilebilir. Bu bir başlangıç ​​noktası önermek içindir. (...)

Microsoft ayrıca, daha fazla ayrıntı sağlayan bir tanıtım makalesi sunar.

Lütfen bu malzemelerin Microsoft Azure'da uygulanan yöntemlere odaklandığını unutmayın.


1

İstatistiksel Öğrenme Öğeleri ile başlama. Harika, ama aradığın gibi görünmeyen bir referans kitabı. Programlama Kollektif Zekası ile başlardım, çünkü kolay okunur.


ESL'yi referans metin olarak nitelendireceğimden emin değilim. Bana daha çok genel bir bakış gibi geliyor, yani, hiçbir şeyin nitrit cesaretini öğrenmeyeceksiniz. Geniş teknikleri ve genel temaları göreceksiniz.
kardinal

1

İlkeleri açıklamada iyi bir iş çıkaran makine öğrenmesi üzerine ilk kitap için şiddetle tavsiye ederim

Rogers ve Girolami, Makine Öğrenmede İlk Kurs , (Chapman & Hall / CRC Makine Öğrenimi ve Örüntü Tanıma), 2011.

Chris Bishop'un kitabı ya da David Barber'ın her ikisi de, ilkeleri iyi kavradığınız zaman, daha geniş bir kitap için iyi seçimler yapar.




0

Max Kuhn'un Applied Predictive Modeling adlı kitabında iyi bir kopya kağıdı var . Kitapta birçok ML öğrenme modelinin iyi bir özet tablosu bulunmaktadır. Tablo ek A sayfa 549'da verilmiştir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.