Hataları düzeltmek için GUI ile iyi ücretsiz OCR? (pencereler için)


9

Hataları düzeltmek için güzel bir GUI'ye sahip SimpleOCR kullandım . Ne yazık ki çok fazla hata yapıyor! (ve diğer hatalar ve sınırlamalar yaşar)

Öte yandan Tesseract daha doğrudur ancak hiç GUI'si yoktur.

Benim sorum, güzel bir GUI ve düşük hata oranına sahip Windows için ücretsiz bir OCR programı var mı? Ben SimpleOCR yaptığı gibi benzer OCRed kelimesini düzenlerken şüpheli kelimeleri (OCR belirsizlik, sadece yazım denetimi değil) vurgulamak ve orijinal (bitmap) kelime göstermek istiyorum.

Açık kaynak en iyi olurdu, ardından ücretsiz, ardından deneme / demo / crippleware uzun bir yol var.

Hataları düzeltmek için GUI'yi gösteren SimpleOCR ekran görüntüsü



2
@Sathya: Özel gereksinimlerim onu ​​bu sorudan ayırıyor.
Hugh Allen

Tam olarak ücretsiz değil, ancak Microsoft Office'e baktınız mı? OCR ile birlikte gelir. (
Kurulumda

@horsedrowner: Sadece denedim. Doğruluğu Tesseract ile karşılaştırılabilir, ancak uygun DPI ayarına sahip bir TIFF dosyası gerektirir veya çalışmaz ve OCR hatalarını düzeltmek için bir arayüzü yoktur.
Hugh Allen

@Hugh Allen: Öyle mi? OneNote 2007'de bağlam menüsü işlevine rastladığımda oldukça iyi çalıştı. Ve bir web sitesinden kopyalanmış bir rastgele görüntü dosyası kullanıyordum ...
Vivelin

Yanıtlar:


2

Tesseract için bir gui cephesi olan gimagereader'ı denedin mi?


Sadece denedim (Windows altında) ve benim için çalışmaz - işlem bir hata mesajı vermeden hemen çıkar :( Yine de ekran görüntülerine baktığınızda, düzenlediğiniz kelimeyi vurgulamak için görünmüyor. o?
Hugh Allen

2

OCRopus :

Yazılım kısmen şimdilik mevcut olan en iyi açık kaynaklı OCR motoru Tesseract'a dayanıyor. Projenin gelecek yılın sonunda piyasaya sürülmesi ve Google'ın kitap tarama projesi için kullanılması beklenirken, ekibin bazı ilginç uygulamaları akılda tutması gerekiyor:

  • bir web hizmeti arayüzü
  • PDF, kamera ve ekran OCR
  • masaüstü arama araçlarıyla entegrasyon: Beagle, Spotlight, Google Desktop

OCRopus (tm), takılabilir düzen analizi, takılabilir karakter tanıma, istatistiksel doğal dil modelleme ve çok dilli yetenekler içeren son teknoloji bir belge analizi ve OCR sistemidir.

OCRopus motoru iki araştırma projesine dayanmaktadır: 90'ların ortalarında geliştirilen ve ABD Nüfus Sayım bürosu tarafından konuşlandırılan yüksek performanslı bir el yazısı tanıyıcı ve yeni yüksek performanslı yerleşim analizi yöntemleri.

OCRopus, geliştirmenin Google tarafından desteklendiği ve başlangıçta yüksek verimli, yüksek hacimli belge dönüştürme çabalarına yöneliktir. Diğer birçok uygulama için de mükemmel bir OCR sistemi olmasını bekliyoruz. alternatif metin Bağlantılar:


GOCR

GOCR, GNU Kamu Lisansı altında geliştirilmiş bir OCR (Optik Karakter Tanıma) programıdır. Metnin taranmış görüntülerini tekrar metin dosyalarına dönüştürür. Joerg Schulenburg programı başlattı ve şimdi bir geliştirici ekibine liderlik ediyor. GOCR, farklı işletim sistemleri ve mimarilere taşınmayı çok kolaylaştıran farklı ön uçlarla kullanılabilir. Birçok farklı görüntü formatı açabilir ve kalitesi her geçen gün artmaktadır. alternatif metin alternatif metin

Bağlantılar:



Bunlardan herhangi birinin onlarla birlikte gitmek için iyi bir GUI'si var mı?
Hugh Allen

1
Düzenlendi sorunuzu cevaplayın .... ama ben "Hayır, onlar yok" derim, ama abiword OCRopus destekler duyuyorum ( arstechnica.com/open-source/news/2007/08/… )
Krazy_Kaos

1
Cevaplamak için ekran görüntüleri eklemek ve sunulan iki programı mini incelemek için +1 ...
Kurt Pfeifle

0

Ayrıca 11 Dilde Yazım Sonrası Yazım Denetleyicisi içeren TOPOCR ( SnapReader olarak da bilinir) vardır:

SnapReader hemen hemen her belge görüntüsünden kendi aranabilir notlarınızı oluşturmak için kullanılabilir. Veya bunu bir geliştirme aracı olarak kullanabilir ve tarayıcınızı veya kameranızı kullanarak kendi düzenlenebilir içeriğinizi oluşturabilir ve sonuçları HTML veya PDF olarak kaydedebilirsiniz. SnapReader, Audrey'i kullanarak metni çok yüksek kaliteli sese dönüştürebilir. Bu nedenle, belgeleri yakalamak için tarayıcınızı veya kameranızı kullanmakla kalmaz, aynı zamanda bunları "okumak" için taşınabilir müzik çalarınızı veya akıllı telefonunuzu da kullanabilirsiniz.

görüntü

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.