Pdf dosyalarının yazılım otomatik içerik analizi [kapalı]


1

Kolay sınıflandırma için meta-verileri etiketleyen geniş bir pdf dokümanı koleksiyonunda otomatik içerik analizi (arzulu özetler üretmek için) yapabilen açık kaynaklı / ticari bir yazılım var mı? Google’ın web'de barındırılan pdf’i ayrıştırmak ve sıralamak için kullandığı teknoloji nedir?

Yanıtlar:


0

Google’ın ne kullandığından emin değilim, ancak ABCpdf.NET gibi bir yazılım bileşeniyle sunucu tarafındaki PDF belgelerini okumak ve oluşturmak mümkündür. Bu, Microsoft IIS sunucuları için ASP veya ASP.NET (Active Server Pages) veya Apache web sunucuları için PHP ile ilgili bazı programlama bilgileri gerektirir.


Bir masaüstü uygulaması olabilir pdf files..it geniş veritabanında akıllı metin madenciliği yapar şey arıyorum / komut etc..Google farklı Fileformats sürü ayrıştırmak ve metinsel içerik arayabilirsiniz
iceman
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.