Evernote , kaydettiğiniz görüntülerde OCR yapar. Evernote'ta bir görüntü için tam metin eşdeğerini almanın bir yolu var mı, yoksa OCR yalnızca arama yapmak için mi?
Evernote , kaydettiğiniz görüntülerde OCR yapar. Evernote'ta bir görüntü için tam metin eşdeğerini almanın bir yolu var mı, yoksa OCR yalnızca arama yapmak için mi?
Yanıtlar:
Evernote API, bu metnin resmin içinde bulunduğu yerde metin ve dikdörtgen alma işlevine sahiptir. Bkz. Http://evernote.com/about/developer/api/evernote-api.htm , "Evernote Tanıma Dizini XML Biçimi" ne bakın ve almak için işlevler. Sorun, geleneksel OCR yapmamalarıdır ... OCR algoritmaları görüntüdeki tek "kelime" için farklı kelimeler üretebilir. Tüm kullandıkları aramadır, bu yüzden onlar için iyidir, ancak bunu bir tanıma motoru olarak kullanmak için iyi değildir. (Her kelime alternatifi için size ağırlık verseler de, belki bunu kullanabilirsiniz)
Ayrıca, Evernote belli bir görüntünün tam olarak bir kelimeye eşdeğer olduğuna karar vermez - örneğin, Evernote belirli bir görüntünün "ipucu" olduğunu ve "bitiş" olmadığını belirlemez. Aksine, her ikisini de izler ve her ikisini de aramak aynı görüntüyü döndürür. Bu nedenle, tam metin eşdeğeri elde etmenin bir yolu yoktur, çünkü Evernote tam metnin gerçekte ne olduğuna karar vermez, sadece ne olabileceğine karar verir.
evernote, ocr-stuff'ın yaratıcısına iyi bir miktar öder ya da birlikte bir şeyler yapmak için iyi bir miktar öder. böylece, gerçekten ayıklanan metin (+ görüntü üzerinde konumlandırma) elde izin verecek şüpheliyim.
(diğer insanların resimlerini taramak ve iyi ocr sağlamak için bir iş modeli olabilir :))
Dolayısıyla cevap hayır.
Ne kadar karmaşıklığa ihtiyacınız olduğundan emin değilim, ama Adobe Acrobat'ı da kullandığımdan, Acrobat ile açmak için Evernote ekime sağ tıklıyorum.
Sonra Acrobat içinden "Belge | OCR metin tanıma" yı seçiyorum, ardından belgeyi düz metin olarak kaydediyorum.
Sadece ara sıra OCR dönüştürmeye ihtiyacım olduğu için bu benim için iyi çalışıyor.
Tüm görüntüleri Evernote'tan çıkarabilirseniz, OCR'yi Google Dokümanlar ile yapabilirsiniz.
Bir resim klasörünü Google Dokümanlar'a yükleyebilir ve hem görüntüyü hem de OCRed metnini içeren Dokümanlar'a dönüştürmelerini sağlayabilirsiniz.
Daha sonra bu belgelerin tümünü toplu metin olarak indirerek görüntüyü çıkarabilirsiniz.
Tüm Evernote resimlerini bir karma (örneğin md5
) ile adlandırırsanız, Google Dokümanlar'dan indirilen düz metin dosyalarını orijinal görüntüyle bağlamak kolay olmalıdır.
Windows'tayım ve Adobe Acrobat Pro ve Word kullanıyorum, böylece aşağıdakileri yapıyorum: