16.04'te Tesseract için yeni bir dil paketini nasıl kurabilirim

Tesseract'ın yanı sıra gscan2pdf v1.3.9'u da yükledim. İkincisine gelince, ilk önce Yüklü Yazılım listemin en altında ortaya çıktı, ancak şimdi hala çalışmasına rağmen gitmiş gibi görünüyor (sanırım).

Her neyse, taranan bir belgenin pdf'sini düzenlenebilir metne dönüştürmeye çalışıyorum, ancak belge İngilizce değil, bu yüzden gscan bundan bir karışıklık çıkarıyor.

Ben gittiğimde sadece seçeneklerim olsun Tools > OCR > Language to recognizeolduğunu English, equve osd. Belirli bir dil paketini nasıl kurabileceğime dair bir fikrin var mı?

Deneyimli bir Linux kullanıcısı değilim, bu yüzden adım adım talimatlar çok takdir edilecektir.

language-support ocr

— maa
kaynak

Sadece bunu kullanarak gerekli ocr dilini yükleyin:

sudo apt-get install tesseract-ocr-[lang]

[Dil] nerede olabilir

all

VEYA

afr
amh
ara
asm
aze
aze-cyrl
bel
ben
bod
bos
bul
cat
ceb
ces
chi-sim
chi-tra
chr
cym
dan
dan-frak
deu
deu-frak
dev
dzo
ell
enm
epo
est
eus
fas
fin
fra
frk
frm
gle
gle-uncial
glg
grc
guj
hat
heb
hin
hrv
hun
iku
ind
isl
ita
ita-old
jav
jpn
kan
kat
kat-old
kaz
khm
kir
kor
kur
lao
lat
lav
lit
mal
mar
mkd
mlt
msa
mya
nep
nld
nor
ori
pan
pol
por
pus
ron
rus
san
sin
slk
slk-frak
slv
spa
spa-old
sqi
srp
srp-latn
swa
swe
syr
tam
tel
tgk
tgl
tha
tir
tur
uig
ukr
urd
uzb
uzb-cyrl
vie
yid

— Abhijit Ghosh
kaynak

'eng' da listede olmalı

— Will