Resimlerden nasıl metin çıkarabilirim?


25

Resimlerden nasıl metin çıkarabilirim?

Taranan dosyalardan bahsetmiyorum, fakat sınıfta bir karatahtanın yüksek çözünürlüklü bir resmini çektiğinizde olduğu gibi bahçe çeşitliliği olan resimler ve güzel el yazısı; veya bir kitabı bir tarif defterinden fotoğrafladığınızda ve tarifin metin biçiminde olmasını istediğinizde.

Bunun için herhangi bir özgür ve açık yazılım?

Tesseract'ı denedim ve sonuçlar berbattı.


Aynı anda Bengalce ve İngilizceyi destekleyen bir OCR'ye ihtiyacım var .
alhelal

Yanıtlar:


26

Resimlerden metin çıkarma eylemi denir OCRve Ubuntu'da OCR'a özel bir wiki sayfası vardır . Bu sayfadan:

Kullanılabilir OCR araçları

Ubuntu Universe depoları aşağıdaki OCR araçlarını içerir:

  1. gocr - Bir komut satırı OCR
  2. fuzzyocr - resim eklerini kontrol etmek için spamassassin eklentisi
  3. libhocr0 - İbranice OCR
  4. ocrad - Optik Karakter Tanıma programı
  5. ocrfeeder - Belge düzeni analizi ve optik karakter tanıma sistemi
  6. ahtapot - döküman analizi ve OCR sistemi
  7. tesseract-ocr

Ubuntu multiverse satış defterleri ayrıca şunları içerir:

  1. çivi yazısı - çok dilli OCR sistemi

Bazı paketler eskidir, ancak resmi olmayan taze paketler Alex_P PPA'da bulunabilir (PPA kod ekleme: ppa: alex-p / notesalexp). Hiç bir PPA kullanmadıysanız, bir PPA'dan nasıl yazılım ekleneceğini kontrol edin .

düzenleme: Yorumda görüldüğü gibi Clara OCR da var ama Hardy de stuk var ve kendi web sitesinde en son güncellenen 2009 vardır.


Açıkladığım örnekler için bunlardan herhangi birini kullanma konusunda tecrübeniz var mı? Onlar için düzenli ocr araçlarına karşı biraz şüpheci oldum. Listedeki 7 numara denedim ve kesinlikle korkunçtu.
Strapakowsky

Eğer hatırlarsam, eşdeğer korkunç sonuçları olan gocr'u da denedim. Bunlardan herhangi birini başarılı bir şekilde denediyseniz, hangi sözdizimini kullandınız? Teşekkürler.
Strapakowsky

Hiçbiri, hiçbiri! OCR ile hiç uğraşmadım: D Freshmeat araması Clara OCR ve tesseract-ocr;) ( freshmeat.net/search/… )
Rinzwind

OCR'nin başarılı bir şekilde kullanılmasının, işlem hakkında bilgi ve taranacak belirli bir görüntüye uyması için dikkatli bir kurulum gerektirdiğini söylersem yanlış mıyım? Bu nedenle, eğer haklıysam, yazılımdan değil kullanıcı yüzünden kötü sonuçlar olabilir.
NN

OCRGörüntünün nasıl oluşturulduğunu bilirseniz ve kullandığınız yazılımı kullanma konusunda çok ustaysanız (ikincisi onu kullanmak için hiç bir zaman bulamıyorum).
Rinzwind

18

tesseract-ocrdiğerlerine göre harika olanı olurdu. Kurulum için komutu çalıştırın sudo apt-get install tesseract-ocr.

Kullanım tesseract filename.jpg output.txt.

Yukarıdaki komut üretecektir output.txt.

Uygun dili seçmeyi düşünebilirsiniz. Bu durumda tesseract-ocr-LANGpaketi kurmanız gerekecek LANG, üç harfli ISO 639-2 dil kodu . Şimdi 18.04 deposunda 123 diliniz var. O zaman örneğin kullanın :

tesseract mySpanishText.jpg output -l spa

Hey, bu işe yarıyor ama doğru değil ya da% 80-85 doğru olduğunu söylerdim. Bu görüntü için örnek gibi: pbs.twimg.com/media/DJs6_pcXkAA2VrN.jpg , $ işaretini ve çoğu parantezi bozdu . Kare, yuvarlak, kıvrımlı, tüm parantezler bir problemdir, asla düzgün bir şekilde çıkarılmazlar. Herhangi bir düzeltme biliyor musunuz?
Milan Chheda
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.