Alaycılığı belirlemek ML ve NLP alanındaki en zor açık uçlu sorunlardan biri olarak kabul edilir.
Peki, bu cephede kayda değer bir araştırma yapıldı mı? Evet ise, doğruluk nasıldır? Lütfen ayrıca NLP modelini kısaca açıklayınız.
Alaycılığı belirlemek ML ve NLP alanındaki en zor açık uçlu sorunlardan biri olarak kabul edilir.
Peki, bu cephede kayda değer bir araştırma yapıldı mı? Evet ise, doğruluk nasıldır? Lütfen ayrıca NLP modelini kısaca açıklayınız.
Yanıtlar:
IIT Bombay'dan araştırmacılar tarafından yapılan aşağıdaki anket makalesi alay saptamadaki son gelişmeleri özetlemektedir: Arxiv bağlantısı .
Sorunuza istinaden, bunun olağanüstü zor veya açık uçlu olduğunu düşünmüyorum. Bilgisayarların henüz idare edemediği belirsizliği ortaya koysa da, insanlar alaycılığı kolayca anlayabiliyor ve bu nedenle alay algılaması için veri kümelerini etiketleyebiliyor.
Aynı alanda sinir ağlarının (doğru CNN'ler) aynı amaç için kullanıldığı son zamanlarda bir çalışma yapılmıştır. Biraz bilgi. araştırma hakkında:
Bu bağlamı öğrenmek için makalede sinir ağının kullanıcının “düğünlerini” bulduğu bir yöntem açıklanmaktadır - yani önceki tweet'lerin içeriği, ilgili ilgi alanları ve hesaplar gibi bağlamsal ipuçları. Kullanıcıyı başkalarıyla birlikte çizmek için bu çeşitli faktörleri kullanır ve (ideal olarak) nispeten iyi tanımlanmış gruplar oluşturduklarını bulur.
Bu nedenle makalede, metindeki alaycılığı tespit etmek için CNN'ler, kelime ve kullanıcı düğünleri kullanılmaktadır. Bununla ilgili bir Techcrunch makalesi de var.
Makale, tweet'in hissini kullanıyor ve diğer benzer tweet'lerinkiyle karşılaştırıyor:
Eğer tweet'in hissi benzer kullanıcılar tarafından ifade edilenlerin büyük bir kısmına katılmıyorsa, alaycılığın kullanılması şansı yüksektir.