Yazılım kısmen şimdilik mevcut olan en iyi açık kaynaklı OCR motoru Tesseract'a dayanıyor. Projenin gelecek yılın sonunda piyasaya sürülmesi ve Google'ın kitap tarama projesi için kullanılması beklenirken, ekibin bazı ilginç uygulamaları akılda tutması gerekiyor:
- bir web hizmeti arayüzü
- PDF, kamera ve ekran OCR
- masaüstü arama araçlarıyla entegrasyon: Beagle, Spotlight, Google Desktop
OCRopus (tm), takılabilir düzen analizi, takılabilir karakter tanıma, istatistiksel doğal dil modelleme ve çok dilli yetenekler içeren son teknoloji bir belge analizi ve OCR sistemidir.
OCRopus motoru iki araştırma projesine dayanmaktadır: 90'ların ortalarında geliştirilen ve ABD Nüfus Sayım bürosu tarafından konuşlandırılan yüksek performanslı bir el yazısı tanıyıcı ve yeni yüksek performanslı yerleşim analizi yöntemleri.
OCRopus, geliştirmenin Google tarafından desteklendiği ve başlangıçta yüksek verimli, yüksek hacimli belge dönüştürme çabalarına yöneliktir. Diğer birçok uygulama için de mükemmel bir OCR sistemi olmasını bekliyoruz.
Bağlantılar:
GOCR, GNU Kamu Lisansı altında geliştirilmiş bir OCR (Optik Karakter Tanıma) programıdır. Metnin taranmış görüntülerini tekrar metin dosyalarına dönüştürür. Joerg Schulenburg programı başlattı ve şimdi bir geliştirici ekibine liderlik ediyor. GOCR, farklı işletim sistemleri ve mimarilere taşınmayı çok kolaylaştıran farklı ön uçlarla kullanılabilir. Birçok farklı görüntü formatı açabilir ve kalitesi her geçen gün artmaktadır.