Kolay sınıflandırma için meta-verileri etiketleyen geniş bir pdf dokümanı koleksiyonunda otomatik içerik analizi (arzulu özetler üretmek için) yapabilen açık kaynaklı / ticari bir yazılım var mı? Google’ın web'de barındırılan pdf’i ayrıştırmak ve sıralamak için kullandığı teknoloji nedir?