Mükemmel algoritmalar, makine öğrenmesi ve doğrusal cebir yok


30

İleri bir algoritma dersi veriyorum ve öğrencilerimin ilgisini çekecek makine öğrenmesi ile ilgili bazı konuları dahil etmek istiyorum. Sonuç olarak, insanların makine öğrenmesinde en güncel / en ilginç algoritmik sonuçlarla ilgili görüşlerini duymak istiyorum. Potansiyel olarak zor olan kısıtlama, öğrencilerin daha önce herhangi bir özel lineer cebir bilgisine veya makine öğrenimindeki diğer ana konulara sahip olmayacaklarıdır.

Bu, onları konu hakkında heyecanlandırmak ve ML'nin algoritmalar uzmanları için potansiyel olarak heyecan verici bir araştırma alanı olduğunu bilmelerini sağlamaktır.

EDIT: Bu, son bir lisans lisans dersidir (çünkü asıl olarak İngiltere'de lisansüstü kurslarımız yoktur). Önceden en az bir temel algoritma kursu almış olacaklar ve ileri düzey takip kursunu seçmeleri için muhtemelen iyi bir şekilde yapılıyorlardı. Gelişmiş dersin mevcut ders programı, mükemmel karma, Bloom filtreleri, van Emde Boas ağaçları, doğrusal prog., Yakl. NP zorlu problemler için algoritmalar vb. Sadece ML üzerine birden fazla ders harcamayı düşünmüyorum ama eğer bir şey hem algoritma dersi hem de ML dersi ile gerçekten alakalıysa tabii ki dahil edilebilir.


1
Lütfen iki şeyi açıklayın: 1) Bu bir lisans kursu mu, yüksek lisans kursu mu? Hangi ilgili dersleri (varsa) geçti? 2) ML'ye ne kadar zaman ayırmak istiyorsunuz?
MS Dousti

3
hmmm Lineer cebirin, en azından makine öğreniminde olmazsa olmaz bir ders olduğunu düşünüyorum. ve lineer modelin makine öğrenme algoritmaları için çok iyi bir giriş olduğunu düşünüyorum. K'ye en yakın komşu veya lojistik regresyon algoritmaları gibi diğer temel seviye algoritmaları hakkında düşünebilirsiniz. belki bu yardım en.wikipedia.org/wiki/List_of_machine_learning_algorithms
Deyaa

1
Belki de Hal Daume'un
Yaroslav Bulatov

3
Sevgili Raphael, Avrim Blum tipik olarak üst düzey algoritmalar sınıfını makine öğrenmesi ve birkaç ilgili konu ile sonlandırır; yeni bir yineleme aşağıdaki linkte cs.cmu.edu/~avrim/451f09/index.html adresindedir ve web sayfasından daha fazla bilgi edinebilirsiniz. Hem TA'd hem de bu sınıfa girdikten sonra, öğrencilerden (ve sonuç materyalinin) çok sıcak karşılandığını söyleyebilirim.
matus

1
bakınız örneğin genetik algoritmalar veya derin öğrenme
vzn

Yanıtlar:


29

Sen anlatabileceğiniz artırılması . Çok zekice, uygulaması kolay, pratikte yaygın olarak kullanılıyor ve anlaşılması için fazla ön koşullu bilgi gerektirmiyor.


5
Anketin bazı bölümlerini Arora ve ark. birkaç yıl önce grad teorisi dersinde ( cs.princeton.edu/~arora/pubs/MWsurvey.pdf ). İnsanlar hoşuna gidiyor gibiydi ve bu materyali anlamak için neredeyse hiçbir arka plana ihtiyacınız olmadığını düşünüyorum.
Danu,

9

Tek bir derste iştahlarını kesmek istiyorsanız, güçlü bir uygulama sunmak en heyecan verici olabilir. Örneğin, destek vektör makineleri ve diğer makine öğrenme algoritmaları, ilaç keşfi için kemoinformatikte kullanılır.

Öğrenme problemi esasen şudur: Bir kimyasal maddenin sergilemesini istediğimiz bir davranış söz konusu olduğunda, benzer davranışları gösteren (veya benzer olmayan) davranışlar gösteren bilinen bir yapı veri tabanından çıkartarak bu davranışı gösteren bir yapı tasarlar. Öğrenme sorununun fazladan kırışıklığı var: Yeni ilacın, patentli bir mülk bulmak için daha önce bilinen ilaçlardan küresel yapıda "uzak" olması gerekiyor.

Kaynaklardan biri, Kümeleme Yöntemleri ve Hesaplamalı Kimyadaki Kullanımlarıdır .


1
Referans için teşekkürler. Belki de SVM'leri dışbükey optimizasyonun bir uygulaması olarak öğretmeyi düşünüyordum. Bu, algoritmalar kısmını ML kısmı ile güzel bir şekilde ilişkilendirir.
Raphael,

2
Doğrusal cebirsiz SVM'leri nasıl kapsıyorsunuz?
Lev Reyzin

Onlara kursumda asgari ön koşulları öğretmeyi umuyordum. Belki de bu çok iyimserdi :-)
Raphael,

Destek vektör makinelerinin en iyi seçim olduğu yerlerde hala önemli örnekler var mı? Kaggle yarışmalarında, örneğin, kazanan bir katılımın asla ana parçası olmadıklarını fark ettim. En azından son zamanlarda gördüğüm hiçbirini. (Tabii düzeltilmeye
hazırım

7

K-Means ve KNN çok güçlüdür ve noktaların mesafelerinin hesaplanması dışında herhangi bir Doğrusal Cebir gerektirmez.


Özellikle K-Means çok güçlü bir algoritmadır. Objektif işlev performansı üzerinde kanıtlanmış sınırlar olmamasına rağmen, inanılmaz derecede etkilidir (neredeyse üstel karmaşıklığa rağmen). Çevrimiçi versiyonu, büyük ölçekli veri uygulamalarında da kullanışlıdır.
Elliot JJ

5

Christopher Bishop (MSR'de) tarafından "Sinir Ağları ve Makine Öğrenmesi" nin ikinci bölümü ML'deki algoritmalar üzerine. Bishop'ın ders kitapları genellikle lisansüstü (ve daha sonra lisans) ders kitaplarında kullanılır ve son derece iyi yazılmıştır.


4

Bu algoritma , çok az sayıda etiketli numuneyi kullanarak büyük miktarda etiketlenmemiş numuneyi sınıflandırmak için grafik minimum kesimlerini kullanır.

Onun lisans dostu. Bunu rastgele seçilen birkaç öğrenciye anlattım ve anladılar.

Ref: Blum, A. ve Chawla, S. (2001). Etiketli ve etiketsiz verilerden grafik çizgileri kullanarak öğrenme.

Kendi kendine tanıtım youtube'da algoritmanın görselleştirilmesi .




1

Klasik veya iyi sezgisel olan bazı algoritmaları kapsayabilirsiniz.

Örneğin, klasik karar ağacı algoritmaları olan C4.5 ve CART.

Ayrıca, gerçek dünya uygulamalarında çok iyi bir performansa sahip bazı topluluk yöntemlerini (örneğin, AdaBoost (Boost), Bagging) kapsayabilirsiniz.

Ayrıca, derin öğrenme de iyi bir konudur, çünkü çok sıcaktır.



0

Yerel bayes ve Bayesian ağı, karar ağacı algoritmaları, nötr bir ağ veya svm ile başlamaktan çok görselleştirmek kolaydır.


0

Genetik programlama gerçekten harika. Biyolojiden ilham alır ve çok sayıda soruna (örneğin, n-kraliçeleri problemi ve TSP) uygulanabilir.

Derin matematiksel beceri gerektirmez.

EDIT: Sadece potansiyel bir çözümün ne kadar iyi olduğunu tahmin etmenin bir yolunu gerektirir. Örneğin, bir dizi sayının ardındaki kuralı tahmin etmek, çok değişkenli problemlere minima / maxima bulmak ve çok büyük parametre alanlarını aramak için kullanılabilir. En iyi çözümle ilgilenmediğiniz, ancak yeterince iyi bir çözüm yapacağınız zaman uygundur. Bunun, oyunlar için iyi stratejiler bulmakta kullanıldığına inanıyorum (Starcraft 2'de siparişler oluşturmak ve Mario'da en iyi oyun).


En iyi yöntem olduğu önemli bir sorun var mı? Yani kesinlikle TSP için değil.
Lembik
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.