Büyük bir metin grubu nerede bulunur? [kapalı]


16

İndirmek için büyük (> 1000) metin topluluğunu arıyorum. Tercihen dünya haberleriyle veya bir tür raporla . Sadece patentli bir tane buldum. Herhangi bir öneri?


Bu konunun konu dışı olduğu anlaşılıyor. Bkz. Meta.stats.stackexchange.com/questions/1032/… .
whuber

Bu soru konu dışı gibi görünüyor çünkü istatistiksel analiz yapmak yerine bir veri kümesi bulmakla ilgili
Peter Flom - Reinstate Monica

2
Bu garip, çünkü bu soru cevap gerçekten yararlı.
Sideshow Bob

@guaka, lütfen bu tür küçük yayınları bu tür küçük düzenlemeler için, özellikle de kapalı bir yayın için çarpmayın. Stil tercihimizin "teşekkürler" değil, bu küçük bir şey için sadece onu bırakacağımız doğrudur.
gung - Monica'yı eski haline getirin

Yanıtlar:




6

Reuters metin korpusu bu alanda bir klasik ve burada bulunabilir


En ilginç (ya da çeşitli) corpus değil. Lisans ayrıca Wikileaks (kamuya açık ABD belgeleri) veya wikinews ile sınırlıdır.
ariddell

@ariddell katılıyorum, ancak giriş NLP örneklerinde yaygın olarak kullanılıyor ve öğrenmede yararlı olacak kadar büyük, ancak iyi bir dizüstü bilgisayarda analiz edilecek kadar küçük.
richiemorrisroe



Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.