Bu sorudan esinlenerek , çok kısa metinlerin büyük koleksiyonları için konu modelleri üzerinde herhangi bir çalışma yapılıp yapılmadığını merak ediyorum. Benim sezgim Twitter'ın bu modeller için doğal bir ilham kaynağı olması. Bununla birlikte, bazı sınırlı deneylerden, standart konu modellerinin (LDA, vb.) Bu tür veriler üzerinde oldukça düşük performans gösterdiği görülmektedir.
Orada kimse bu alanda yapılmış herhangi bir iş biliyor mu? Bu makale LDA'yı Twitter'a uygulamaktan bahsediyor, ancak kısa belge bağlamında daha iyi performans gösteren başka algoritmaların olup olmadığıyla gerçekten ilgileniyorum.