NER için Vowpal Wabbit kullanma


9

Vowpal Wabbit (VW) görünüşe göre SEARN aracılığıyla dizi etiketleme işlevselliğini desteklemektedir . Sorun, açıklamaları ve bazı örnekleri ile ayrıntılı bir parametre listesi hiçbir yerde bulamıyor olmasıdır. Bulabildiğim en iyi şey, çok kısa bir örnekle Zinkov'un blog girişi . Ana wiki sayfası zorlukla SEARN bahseder.

Teslim alınan kaynak kodunda bazı NER örnek verileri içeren demo klasörü buldum. Ne yazık ki, tüm testleri çalıştıran komut dosyası bu verilerde nasıl çalıştırılacağını göstermez. En azından beklenen formatı görmek için yeterince bilgilendiriciydi: girişler boş satırlarla ayrılması dışında standart VW veri formatıyla neredeyse aynı (bu önemlidir).

Şu anki anlayışım şu komutu çalıştırmak:

cat train.txt | vw -c --passes 10 --searn 25 --searn_task sequence \
--searn_passes_per_policy 2 -b 30 -f twpos.vw

nerede

--searn 25 - toplam NER etiketi sayısı (?)

--searn_task sequence - dizi etiketleme görevi (?)

--searn_passes_per_policy 2 - ne yaptığını net değil

Diğer parametreler VW için standarttır ve ek bir açıklamaya gerek yoktur. Belki de SEARN'a özgü daha fazla parametre var mı? Önemi ve etkisi nedir? Onları nasıl ayarlayabilirim? Temel kurallar var mı?

Örneklere ilişkin herhangi bir işaretçi takdir edilecektir.

Yanıtlar:


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.