Linux Mint 17.2 x32 Tarçın var. Muhtemelen bu adımlar Ubuntu 14.04 x32'de de işe yarar.
- Tesseract OCR'ı yükleyin sudo apt-get install -y tesseract-ocr tesseract-ocr-eng Ek paketler yükleyerek diğer dilleri ekleyebilirsiniz. Bu ekran görüntüsü synaptic'ten:
Synaptic'teki Tesseract dil paketleri
Tesseract'ı kullanma
SEÇENEK 1 - komut satırı açık terminali ile görüntü dosyalarını (jpg, png) sakladığınız klasöre gidin ve komutu çalıştırın:
a) tüm görüntü dosyalarını metne dönüştürmek
for i in *png; do b=`basename "$i" .png`; tesseract -l eng "$i" "$b" text; done
Tüm metin dosyalarını tek bir dosyada birleştirmek için bir komut çalıştırın cat *.txt >> all.txt
b) tüm resim dosyalarını hocr dosyalarına dönüştürmek (Firefox ile açın)
for i in *png; do b=`basename "$i" .png`; tesseract -l eng "$i" "$b" hocr; done
SEÇENEK 2 - GUI tarafından
a) gImageReader'ı kurun ve kullanın
sudo add-apt-repository -y ppa:sandromani/gimagereader
sudo apt-get update
sudo apt-get install -y gimagereader
b) İkinci uygulama VietOCR'dur. Gerçek sürüm 4.0, bu yüzden indir VietOCR-4.0.zip
Dosyaları açın ve Java ile VietOCR.jar dosyasını açın:
Java ile VietOCR uygulamasını açma
Java yüklü değilse, depodan yükleyebilir veya resmi Oracle Java 8 yükleyebilirsiniz. Ubuntu 14.04'te Oracle Java 8'i yükleme adımları
sudo add-apt-repository ppa:webupd8team/java
sudo apt-get update
sudo apt-get install oracle-java8-installer
sudo apt-get install oracle-java8-set-default
Ben VietOCR öneririz, çünkü OCR pdf dosyalarını sağlar, toplu dönüştürme de bir seçenektir.