Derin Öğrenme kütüphanelerini kullanarak Metinden anahtar kelime / kelime öbeği çıkarma


20

Belki de bu çok geniş, ancak bir metin özetleme görevinde derin öğrenmenin nasıl kullanılacağına dair referanslar arıyorum.

Standart kelime frekansı yaklaşımlarını ve cümle sıralamasını kullanarak metin özetlemeyi zaten uyguladım, ancak bu görev için derin öğrenme tekniklerini kullanma olasılığını araştırmak istiyorum. Ben de duygu analizi için Convolutional Nöral Ağlar (CNN) kullanarak wildml.com üzerinde verilen bazı uygulamalar geçirdim ; Metin özetleme ve anahtar kelime çıkarma için TensorFlow veya Theano gibi kütüphaneleri nasıl kullanabileceğini bilmek istiyorum. Sinir ağları ile denemeye başlamamdan bu yana yaklaşık bir hafta geçti ve bu kütüphanelerin performansının bu soruna önceki yaklaşımlarım ile nasıl karşılaştırıldığını görmek beni gerçekten heyecanlandırdı.

Özellikle bu çerçeveleri kullanarak metin özetlemeyle ilgili bazı ilginç makaleler ve github projeleri arıyorum. Biri bana referans verebilir mi?

Yanıtlar:


15

Google Araştırma blog bağlamında yararlı olmalıdır TensorFlow .

Yukarıdaki makalede, metin özetlemesi için rutin olarak kullanılan Açıklamalı İngilizce Gigaword veri kümesine bir referans bulunmaktadır .

Sutskever ve ark. Tarafından Sinir Ağları ile Sekans Öğrenme Dizisi başlıklı 2014 makalesi, kısa metinler için özetlemenin derin bir öğrenme tekniği ile uçtan uca öğrenilebileceği ortaya çıktığı için yolculuğunuza anlamlı bir başlangıç ​​olabilir.

Son olarak, burada TensorFlow kullanımı yaparken büyük bir Github depo tasviridir metin özetleme olduğunu.


16

Bu açık bir araştırma alanıdır ve kesinlikle sorunu nasıl şekillendirdiğinize bağlıdır. Çoklu belge özetlemesinden bahsediyorsanız, sorun tek belge özetlemesinden bahsettiğinizden biraz farklıdır.

Literatürü kısaca gözden geçirmeye değer.

U / Data Scientists Topluluğu tarafından sağlanan bağlantı harika ve tek bir belgede soyutlayıcı özetleme görevi için kullanışlıdır . Ayıklanacak önemli cümleleri tanımlayan çıkarıcı özetlemeler üzerinde de çalışmalar yapılmıştır .

Rush ve diğ. al, derin öğrenmeye dayanan Dikkat ile soyutlayıcı özetle ilgili güzel bir makaleye sahiptir .

Ekstraktif bir özet için, sınıflandırıcıyı oluşturmak ve standart TensorFlow / Torch kütüphanelerini kullanmak için bir LSTM kullanabilirsiniz, ancak bu yaklaşım için derin öğrenmenin kullanımı ile ilgili güncel yayınlar görünmemektedir.

İşte bazı GitHub depoları:


Teşekkürler @franciscojavierarceo Yukarıda belirtilen makalelere bakacağım.
shanky_thebearer

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.