Android için herhangi bir ücretsiz OCR kitaplığı var mı? [kapalı]


148

Android'de çalışan bir Java OCR arıyorum, ancak Asprise platformdan bağımsız bir OCR gibi görünmüyor. android uygulama geliştirme için kullanabileceğim herhangi bir açık kaynak / ücretsiz Java OCR var mı?


9
Bu sorgulanan tekrar açılmalıdır, çok önemli ve geçerli bir soru
Utsav Gupta

5
Google kısa süre önce bir OCR API'sı yayınladı: developers.google.com/vision/text-overview
Wirling

Yanıtlar:


38

OCR oldukça CPU yoğun olabilir, bunu bir akıllı telefonda yapmayı yeniden düşünmek isteyebilirsiniz.

Bunun yanı sıra, bildiğim kadarıyla popüler OCR kütüphaneleri Aspire ve Tesseract'tır . Hiçbiri doğrudan Java değildir, bu nedenle bir Android OCR kitaplığına sahip olmayacaksınız.

Ancak, Tesseract açık kaynaklıdır (GitHub infact barındırılır); Böylece, ihtiyacınız olan alt kümeyi Java'ya taşımak için biraz zaman ayırabilirsiniz. Anladığım kadarıyla C ++ çılgınca değil , bu yüzden OCR'ye ne kadar çok ihtiyacınız olduğuna bağlı olarak, zaman ayırmaya değer olabilir.

Çok kısa cevap: Hayır.

Uzun cevap: eğer bunun için çalışmaya istekliysen.


2
üzerine taşıyarak, alt kümeyi Java'da yeniden yazmayı mı kastediyorsunuz? Bu çok çaba gerektirebilir, bu yüzden orada% 100 Java OCR yok mu?
user121196

13
Tesseract'ı Android'in Java'sına taşımayı denemek yerine Android NDK aracılığıyla bir JNI katmanına sarmayı denemenizi tavsiye ederim. Tesseract halihazırda ARM'ye taşınmış gibi görünüyor, bu yüzden üstüne bir JNI API'si koymak daha kolay olmalı. Ayrıca, bu, herhangi bir Java bağlantı noktasından daha hızlı olmasını sağlar ve uzun vadeli bakımı basitleştirir.
CommonsWare

15
Java için Tessjeract adında bir Tesseract JNI arayüzü zaten var. code.google.com/p/tesjeract
sventechie

1
Tesseract, C'den java'ya kısa bir yürüyüş olmayacak. Gördüğüm kod son derece deyimsel 80's C ve diğer dillere kolayca taşınamaz.
kaide

2
@vincent geçen yıl ortadan kayboldu. JNA sürümü artık mevcut: github.com/nguyenq/tess4j, ancak aynı zamanda bir Android çatal: github.com/rmtheis/tess-two
sventechie

21

Soru kapatıldı, ancak olumlu sonuçlar almış birini bulmak güzel. Bu sourceforge tipi projelerde insan bulmak çok zor. Soru: Tesseract'ı pasaportların veya kimlik belgelerinin görüntü taramalarıyla denediniz mi? Metin PDF'lerinde sorun yok gibi görünüyor ama resimlerle uğraşıyorum.
PKHunter

Üzerinde resim olan hiçbir şeyle denemedim, sadece metin içeren bir belgeydi (aynı yazı tipi, yazı tipi, boyut)
Ben Pearson

Umarım bende işe
Romantic Electron

20

Diğer bir seçenek, görüntüyü bir web uygulamasına (muhtemelen daha sonra) göndermek ve C ++ -> Java bağlantı noktası sorunları olmadan ve muhtemelen mobil CPU'yu tıkamadan OCR işlemine tabi tutmak olabilir.


çok iyi bir fikir: DI Eğer bir web hizmeti (asmx) demek farz teşekkürler
Omidoo


4

Evet var.

Ancak OCR çok geniştir. OCR özelliği olan bir Android uygulaması biliyorum, ancak bu sizin aradığınız OCR türü olmayabilir.

Bu açık kaynaklı uygulamaya Aedict adı verilir ve el yazısı Japonca karakterlerde OCR işlemi yapar. O kadar yavaş değil.

Aradığınız şey değilse, lütfen hangi tür karakterleri ve hangi veri girişini (resim veya XY dokunma geçmişi) kesin.


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.