Çok sayfalı PDF veya taranmış belgelerdeki OCR
Bu muhtemelen en kolay yoldur. Gscan2pdf, yalnızca dosyaları taramanıza değil, aynı zamanda dosyaları içe aktarmanıza ve üzerinde OCR gerçekleştirmenize de olanak sağlayan grafik bir araçtır. Gscan2pdf dosyasını buradan , Ubuntu Software Center'dan yükleyin veya bu komutu bir terminalde çalıştırın:
sudo apt-get install gscan2pdf
- Gscan2pdf dosyasını çalıştırın
- Pdf dosyasını içe aktar (Ctrl + O)
- İsteğe bağlı: Araçlar> Temizle
- Araçlar> OCR Tasarrufu'nu (Ctrl + S) seçin.
Gscan2PDF özelleştirilebilir OCR motorlarını kullanabilir, varsayılan tesseract-ocr
Uygun dili seçmeyi düşünebilirsiniz. Bu durumda tesseract-ocr-LANG
paketi kurmanız gerekecek LANG
, üç harfli ISO 639-2 dil kodu. Şimdi 16.04 deposunda 108 diliniz var.