Sınıflandırma için yarı denetimli öğrenme, aktif öğrenme ve derin öğrenme


19

Tüm kaynaklar güncellendiğinde son düzenleme:

Bir proje için, sınıflandırma için makine öğrenimi algoritmaları uyguluyorum.

Zorluk: Oldukça sınırlı etiketlenmiş veriler ve çok daha fazla etiketlenmemiş veriler.

Hedefler:

  1. Yarı denetimli sınıflandırma uygulayın
  2. Bir şekilde yarı denetimli etiketleme işlemi uygulayın (aktif öğrenme olarak bilinir)

EM, Transductive SVM veya S3VM (Yarı Denetimli SVM) veya bir şekilde LDA vb. Uygulamak gibi araştırma belgelerinden çok fazla bilgi buldum.

Soru: Uygulamalar ve pratik kaynaklar nerede?


Son güncelleme (mpiktas, bayer ve Dikran Marsupial tarafından sağlanan yardımlara dayanarak)

Yarı denetimli öğrenme:

Aktif öğrenme:

  • Dualist : Metin sınıflandırmasında kaynak kodu ile aktif öğrenmenin uygulanması
  • Bu web sayfası aktif öğrenmeye harika bir genel bakış sunmaktadır.
  • Deneysel bir tasarım atölyesi: burada .

Derin öğrenme:


RTextTools bir R paketi var . Eğer yanılmıyorsam, bahsettiğiniz birkaç yöntemi uygular.
mpiktas

Merhaba mpiktas, yardımlarınız için teşekkürler. Bu ilginç bir araç. Ancak okuduğum gibi, sadece denetimli öğrenmeyle ilgileniyor gibi görünüyor "TextTools, hem acemi hem de ileri düzey kullanıcıların denetimli öğrenmeye başlamasını kolaylaştıran otomatik metin sınıflandırması için ücretsiz, açık kaynaklı bir makine öğrenme paketidir. sınıflandırması için dokuz algoritma (svm, slda, artırma, torbalama, rastgele ormanlar, glmnet, karar ağaçları, sinir ağları, maksimum entropi) "
Flake

Tamam, bir başka deneme daha: Weka . Yazarlar bir kitap yazmışlardır ve içindekiler, yarı-denetimli öğrenmeden bahsetmektedir. İçtenlikle bölüm "... ne yazık ki bu algoritmaların hiçbiri
Weka'da

Drat, kitabın eski versiyonunu aldım! Bu kaynağı gösterdiğin için çok teşekkürler!
Flake

Yanıtlar:


8

Derin öğrenme sizin için çok ilginç olabilir. Bu, denetimsiz bir şekilde ön teste tabi tutulmuş ve daha sonra süpervizyonla ince ayarlanmış çok yakın bir derin bağlantı modeli. İnce ayar, ön eğitmeden çok daha az numune gerektirir.

Dilini ıslatmak için [Semantig Hashing Salakhutdinov, Hinton . Reuters corpus'un farklı belgeleri için bulduğu kodlara bir göz atın: (denetimsiz!)

resim açıklamasını buraya girin

Uygulanan bazı kodlara ihtiyacınız varsa deeplearning.net adresini ziyaret edin . Yine de kutudan çıkmış çözümler olduğuna inanmıyorum.


Bu benim için oldukça ilginç ve yeni bir bilgi. Tabii ki kutudan daha iyi uygulamalar daha iyi olurdu, ama bu gerçekten istediğime daha yakın bir şey bilmeme yardımcı oluyor. Teşekkürler.
Flake

5

Isabelle Guyon (ve meslektaşları) bir süre önce aktif öğrenme konusunda bir mücadele düzenledi, bildiriler burada yayınlandı (açık erişim). Bu oldukça pratik olma avantajına sahiptir ve farklı yaklaşımların performanslarını tarafsız (konuşma dilinde) bir protokol altında doğrudan karşılaştırabilirsiniz (rastgele desen seçimini yenmek şaşırtıcı derecede zordur).


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.