Ne okudum itibaren:
A Distant supervision algorithm usually has the following steps:
1] It may have some labeled training data
2] It "has" access to a pool of unlabeled data
3] It has an operator that allows it to sample from this unlabeled
data and label them and this operator is expected to be noisy in its labels
4] The algorithm then collectively utilizes the original labeled training data
if it had and this new noisily labeled data to give the final output.
Kendi kendine öğrenme ( Yates, Alexander, et al. "Textrunner: internette açık bilgi çıkarımı." İnsan Dil Teknolojileri Bildirileri: Hesaplamalı Dilbilim Derneği Kuzey Amerika Bölümünün Yıllık Konferansı: Gösteriler. Bilişimsel Dilbilim Derneği, 2007. ):
Öğrenci iki adımda çalışır. İlk olarak, kendi egzersiz verilerini otomatik olarak pozitif veya negatif olarak etiketler. İkincisi, bir Naive Bayes sınıflandırıcısını eğitmek için bu etiketli verileri kullanır.
Zayıf Denetim (Hoffmann, Raphael, et al. "Çakışan ilişkilerin çıkarılması için bilgi tabanlı zayıf denetim." Hesaplamalı Dilbilim Derneği 49. Yıllık Toplantısı Bildirileri: İnsan Dili Teknolojileri-Cilt 1. Hesaplamalı Dilbilim Derneği, 2011 .):
Genellikle “zayıf” veya “uzak” denetim olarak adlandırılan daha ümit verici bir yaklaşım, veritabanının içeriğini sezgisel olarak karşılık gelen metne eşleştirerek kendi eğitim verilerini oluşturur.
Etiketleme buluşsal yönteminin eğitimli sınıflandırıcı olması ve etiketleme aşaması ile sınıflandırıcı eğitim aşaması arasında bir döngü olması nedeniyle, kendi kendine eğitimin biraz farklı görünmesi dışında her şey bana benziyor. Ancak Yao, Limin, Sebastian Riedel ve Andrew McCallum. " Etiketli veri olmadan toplu belge-arası ilişki çıkarımı. " 2010 Doğal Dil İşlemede Ampirik Yöntemler Konferansı Bildirileri. Hesaplamalı Dilbilim Derneği, 2010. uzak denetim == kendi kendine eğitim == zayıf denetim olduğunu iddia eder.
Ayrıca, başka eşanlamlılar var mı?