Taranan metin görüntüsünü otomatik döndür (Komut satırı ile OCR?)


1

Esas olarak metin içeren bir resmi otomatik olarak döndürebilir miyim? Belki OCR ile? Algoritma veya görüntüyü taramak için gereken her şey ve onu 90 °, 180 ° veya 270 ° döndürmek zorunda olup olmadığına karar vermek

Bu özelliği mevcut bir PowerShell betiğine dahil etmek istiyorum, bu nedenle komut satırı yeteneği zorunludur.

ImageMagick çözümlerine açığım

Örnek

enter image description here
Büyütmek için tıklayın

Aşağıdaki SO sorularını zaten okudum. Ama fotoğrafları döndürürler.
ve yalnızca yalnızca EXIF ​​meta verisi olmayan saf metin taramalarını döndürmeye çalışıyorum.

Yanıtlar:


1

Ben şu anda bunu yapıyorum teserakt Görüntünün yönünü algılayan "-psm 0" anahtarlarını kullanarak.

Örnek çıktı:

Tesseract Open Source OCR Engine v3.04.00 with Leptonica
Orientation: 3
Orientation in degrees: 90
Orientation confidence: 3.94
Script: 1
Script confidence: 13.81

Sonra koşarım ImageMagick görüntüyü doğru yöne döndürmek için. El yazısı ile yazılmış belgeler ve fotoğraflar hariç çoğu resim için çalışır.

Biraz ağır, ama OCR'yi dört kez çalıştırmaktan çok daha hızlı.


0

Sen istiyorsun ImageMagick convert Yarar. Sadece koş

convert -rotate 90 image.png

ve 90 derece döndürülecek ve aynı dosya adı ile geri kaydedilecektir.


Bunun sorudan açıkça anlaşıldığını düşündüm ( » OCR ). Görünüşe göre öyle değil. Bazen taramalar 270 °, 90 ° veya 180 ° döndürülmelidir. Bu sabit değil
nixda

@ nixda bir de var -auto-orient Kullanılabilecek seçenek - Ben kullanmadım, bu yüzden ne kadar doğru olduğunu bilmiyorum. Üzgünüm, asıl sorunuzdan, hepsinin aynı yönde olmadıklarını anlamadım.
MattDMo

belgeleme EXIF verileri kullandığını söylüyor. Yani bu bir çözüm değil. If the EXIF profile was previously stripped, the -auto-orient operator will do nothing.
nixda

0

En şık yol değil, fakat dört yönelimde de OCR yapmaya çalışabilirsiniz ve hangisi en az saçma sapan varsa, hangisi doğru ise. Biraz hızlı arama yaptım ve böyle bir tekniği kullanarak tartışan birkaç referans buldum. Örneğin :

Doküman düzeltmenin ikinci aşaması, içeriğe dayalı otomatik döndürmedir. kullanma   bir tam sayfa OCR yazılımı birkaç yönden okuyabilir   hangi yönde okumanın kalitesinin en iyi olduğunu belirler. Bu   belgeyi döndürmenin en doğru yoludur. Küçük belgeler   metin veya çeşitli açılardaki metinler yalnızca riskli belgelerdir. Bunların içinden   Bu durumda, yazılım MOST okunabilir metnin yönünü seçer.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.