Deneme için biz kullanmak istiyorum Emoji birçok zemin gerçek olarak Tweets / basit nicel senitment analiz için veri eğitim gömülü. Tweetler genellikle NLP'nin iyi çalışması için çok yapılandırılmamıştır.
Her neyse, Unicode 6.0'da 722 Emoji var ve muhtemelen Unicode 7.0'a 250 tane daha eklenecek.
Onlar için duyarlılık ek açıklamaları içeren bir veritabanı (örneğin, SentiWordNet gibi) var mı?
(SentiWordNet'in de belirsiz anlamlara izin verdiğini unutmayın . Örneğin komik olanı düşünün , ki bu sadece olumlu değil: "bu komik tatlar" muhtemelen olumlu değil ... aynı ;-)
mesela aynıdır . Ama bunun daha zor olduğunu düşünmüyorum. Emoji için normal kelimelerden daha ...)
Ayrıca, bunları duyarlılık analizi için kullanma deneyiminiz varsa, duymak isterim.