Uzaktan denetim, kendi kendine eğitim, kendi kendini denetleyen öğrenme ve zayıf denetim arasında herhangi bir fark var mı?


12

Ne okudum itibaren:


Uzaktan denetim :

A Distant supervision algorithm usually has the following steps: 
1] It may have some labeled training data 
2] It "has" access to a pool of unlabeled data 
3] It has an operator that allows it to sample from this unlabeled 
   data and label them and this operator is expected to be noisy in its labels 
4] The algorithm then collectively utilizes the original labeled training data
    if it had and this new noisily labeled data to give the final output.

Kendi kendine eğitim :

resim açıklamasını buraya girin


Kendi kendine öğrenme ( Yates, Alexander, et al. "Textrunner: internette açık bilgi çıkarımı." İnsan Dil Teknolojileri Bildirileri: Hesaplamalı Dilbilim Derneği Kuzey Amerika Bölümünün Yıllık Konferansı: Gösteriler. Bilişimsel Dilbilim Derneği, 2007. ):

Öğrenci iki adımda çalışır. İlk olarak, kendi egzersiz verilerini otomatik olarak pozitif veya negatif olarak etiketler. İkincisi, bir Naive Bayes sınıflandırıcısını eğitmek için bu etiketli verileri kullanır.


Zayıf Denetim (Hoffmann, Raphael, et al. "Çakışan ilişkilerin çıkarılması için bilgi tabanlı zayıf denetim." Hesaplamalı Dilbilim Derneği 49. Yıllık Toplantısı Bildirileri: İnsan Dili Teknolojileri-Cilt 1. Hesaplamalı Dilbilim Derneği, 2011 .):

Genellikle “zayıf” veya “uzak” denetim olarak adlandırılan daha ümit verici bir yaklaşım, veritabanının içeriğini sezgisel olarak karşılık gelen metne eşleştirerek kendi eğitim verilerini oluşturur.


Etiketleme buluşsal yönteminin eğitimli sınıflandırıcı olması ve etiketleme aşaması ile sınıflandırıcı eğitim aşaması arasında bir döngü olması nedeniyle, kendi kendine eğitimin biraz farklı görünmesi dışında her şey bana benziyor. Ancak Yao, Limin, Sebastian Riedel ve Andrew McCallum. " Etiketli veri olmadan toplu belge-arası ilişki çıkarımı. " 2010 Doğal Dil İşlemede Ampirik Yöntemler Konferansı Bildirileri. Hesaplamalı Dilbilim Derneği, 2010. uzak denetim == kendi kendine eğitim == zayıf denetim olduğunu iddia eder.

Ayrıca, başka eşanlamlılar var mı?


İlginç soru. Bu Veri Bilimine ait olabilir mi?
goangit

@goangit Muhtemelen, bu web sitesinin iyi bir yığın gibi;)
Franck Dernoncourt

Yanıtlar:


8

Verdiğiniz tüm farklı terimlerin iki yönü vardır: 1] Eğitim verisi elde etme süreci 2] eğiten algoritmaf

f

Geleneksel olarak, denetimli öğrenmeyle ilgili herhangi bir makine öğrenim kağıdında, makalenin eğitim verilerinin mevcut olduğunu ve değerinin ne olduğu için genellikle etiketlerin kesin olduğu ve etiketlerde belirsizlik bulunmadığı varsayılır. eğitim verilerindeki örneklere verilen Bununla birlikte, uzak / zayıf denetim kağıtları ile insanlar, eğitim verilerinin kesin olmayan etiketlere sahip olduğunu ve işlerinde genellikle vurgulamak istediklerinin, kesin olmayan etiketlerin kullanılmasının bariz dezavantajlarına rağmen iyi sonuçlar elde ettiklerini fark ettiler (ve diğer algoritmik yollara sahip olabilirler) kesin olmayan etiketler sorununun üstesinden gelmek, ek filtreleme işlemi vb. ile ve genellikle kağıtlar bu ek işlemlerin önemli ve yararlı olduğunu vurgulamak ister). Bu "zayıf" terimlerini doğurdu veya "uzak" olarak egzersiz verilerinin üzerindeki etiketlerin kesin olmadığını belirtir. Bunun sınıflandırıcının öğrenme yönünü mutlaka etkilemeyeceğini unutmayın. Bu adamların kullandığı sınıflandırıcı, etiketlerin kesin olduğunu ve eğitim algoritmasının neredeyse hiç değişmediğini varsaymaktadır.

Öte yandan kendi kendine eğitim bu anlamda biraz özeldir. Daha önce gözlemlediğiniz gibi, etiketlerini kendi sınıflandırıcısından alır ve düzeltme için bir geri bildirim döngüsüne sahiptir. Genel olarak, denetimli sınıflandırıcıları, öğrenilen sınıflandırıcının tüm veriler hakkındaki eğitim verilerinden elde edilen tümevarımsal bir çıkarım olduğu "endüktif" algoritmaların biraz büyük bir tasarımı altında inceliyoruz. İnsanlar, genel bir endüktif çıkarımın algoritmanın çıktısı olmadığı, ancak algoritma topluca hem eğitim verilerini hem de test verilerini girdi olarak alır ve test verileri üzerinde etiketler üretir. Bununla birlikte, insanlar neden daha büyük eğitim verilerine sahip bir sınıflandırıcı elde etmek için endüktif öğrenme içinde transdüktif çıkarım kullanmadığını anladılar.

Umarım sizi daha fazla karıştırmadım, yorum yapmaktan ve gerekirse daha fazla açıklama istemekten çekinmeyin.

[1] Yararlı olabilir - http://www.is.tuebingen.mpg.de/fileadmin/user_upload/files/publications/pdf2527.pdf


Teşekkürler, cevabınız çok ilginç! Kendi kendine öğrenmeye ne dersiniz? Uzaktan / zayıf denetim ile aynı mı?
Franck Dernoncourt

1
Evet. Kendi kendine öğrenme ile uzak / zayıf denetim arasında özellikle bir fark görmüyorum, çünkü etiketler kesin olmayan bir kaynaktan ayrı olarak elde edilmekte ve daha sonra denetlenen bir sınıflandırıcıya beslenmektedir.
TenaliRaman
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.