teserakt
2018 itibariyle, mevcut en iyi açık kaynaklı OCR yazılımı, yeni LSTM sinir ağı OCR modeliyle Tesseract 4 (beta) . OCR performansı, sürüm 3'te kullanılan önceki OCR modelinden çok daha iyidir.
Örnek ( output.pdf
taranan almanca bir belge için metin katmanı içeren bir PDF dosyası oluşturun):
$ echo page-*.png > input.list
$ tesseract --oem 1 -l deu input.list output pdf
Tanınan metni stdout'a yazdırın:
$ tesseract --oem 1 -l deu page page-0001.png stdout
Kurulu dilleri listele:
$ tesseract --list-langs
Çok sayıda dil / komut dosyası desteği, indirilebilir eğitimli bir veri kümesi biçiminde mevcuttur , örneğin Fraktur için bir veri kümesi bile vardır.
Yeni LSTM modeliyle Tesseract, OCRopus araştırma projesinden ilham alıyor .
Tesseract sürüm 3, kaliteli giriş görüntülerinde bile nispeten kötü performans gösterir, yani genellikle toz piksellerinde (herhangi bir metinsel bağlamın dışında) tek karakterleri yanlış algılar ve iyi bilinen kelimelerdeki tek karakter hatalarını kolayca ekler.
çiviyazısı
Çivi yazısı OCR performansı o kadar da kötü değil, ancak aktif olarak korunmuyor (2011'in son sürümü, sürüm 1.1) ve kolayca çöküyor ve başka sorunları var:
Düzen algoritmasını şu şekilde devre dışı bırakabilirsiniz:
$ cuneiform --singlecolumn -l ger -f text -o foo.txt image-0001
( -l
kaynak belgenin dilini belirtir)
ocrad
$ ocrad -F utf8 image-0001
Metin varsayılan olarak stdout'a yazdırılır.
Bir işletme belgesinde, çivi yazısı / tesseract / gocr'ın yapmadığı altı çizili bir kelimeyi kaçırdı.
GoCRM
$ gocr image-0001
Metin varsayılan olarak stdout'a yazdırılır.
Donanım
Sane , Avision ve Fujitsu gibi birçok otomatik belge besleme (ADF) tarayıcısı için çok iyi bir desteğe sahiptir .
Sane ile birlikte, komutlu scanimage
tarama boru hatlarını oluşturmak için kullanabileceğiniz komut satırı programı da gelir (örn. Benim adf2pdf.py
komut dosyam).