«text-mining» etiketlenmiş sorular

Kalıpları tanıyarak metin biçimindeki verilerden veri çıkarmayla ilgili bir veri madenciliği alt kümesini ifade eder. Metin madenciliğinin amacı, belirli bir belgeyi otomatik olarak bir dizi kategoriden birinde sınıflandırmak ve bu performansı dinamik olarak iyileştirerek makine öğreniminin bir örneği haline getirmektir. Bu tür metin madenciliğinin bir örneği, e-posta için kullanılan spam filtreleridir.

1
İngilizce bir cümlenin karmaşıklığı nasıl belirlenir?
İnsanların İngilizce'yi ikinci dil olarak öğrenmelerine yardımcı olmak için bir uygulama üzerinde çalışıyorum. Cümlelerin ekstra bağlam sağlayarak bir dil öğrenmeye yardımcı olduğunu doğruladım. Bunu 60 kişilik bir sınıfta küçük bir araştırma yaparak yaptım. Çeşitli İngilizce kelimeler için Wikipedia'dan yüz binden fazla cümle inceledim (Barrons'800 kelime ve en yaygın 1000 İngilizce …

1
Word2vec için ne kadar eğitim verisi gerekir?
Farklı kaynaklarda bahsedilen aynı kelime arasındaki farkı karşılaştırmak istiyorum. Yani, yazarlar "demokrasi" gibi kötü tanımlanmış sözcükleri kullanmalarında nasıl farklılık gösterirler. Kısa bir plan "Demokrasi" terimini anlatan kitapları düz metin olarak alın Her kitapta, yerini democracyiledemocracy_%AuthorName% word2vecBu kitaplarda bir model eğitin Arasındaki mesafeyi hesaplayın democracy_AuthorA, democracy_AuthorBve diğer relabeled "demokrasi" bahseder Böylece …

2
Belirli bir kelimeyi ad, cep telefonu numarası, adres, e-posta, eyalet, ilçe, şehir vb. olarak sınıflandırmak için hangi makine / derin öğrenme / nlp teknikleri kullanılır?
Bir dizi kelimeyi veya dizeyi tarayabilen ve bunları makine öğrenimi veya derin öğrenme kullanarak adlar, cep telefonları, adresler, şehirler, eyaletler, ülkeler ve diğer varlıklar olarak sınıflandırabilen akıllı bir model oluşturmaya çalışıyorum. Yaklaşım aramıştım ama maalesef alacak bir yaklaşım bulamadım. Ben bir dize adı veya şehir vb olup olmadığını tahmin etmek …

4
Metin sınıflandırıcı eğitim veri kümeleri önerin
Bir metin sınıflandırıcısını eğitmek için hangi serbestçe kullanılabilen veri kümelerini kullanabilirim? Onun için en alakalı içeriği önererek kullanıcılarımızın katılımını artırmaya çalışıyoruz, bu yüzden içeriğimizi önceden tanımlanmış bir kelime torbasına göre sınıflandırırsak, önceden sınıflandırılmış rastgele sayıda gönderi hakkında geri bildirim alarak içeriğine ilgi çekici bir şekilde geri dönmesini önerebiliriz. önce. Bu …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.