OCR işleme için biraz "yarı tonlu" görüntüye filtre uygulama


10

Gizli metin katmanı eklemek istediğim taranmış bir PDF malzemem var, bu yüzden belgeyi dizine ekleyebilirim. Sayfaları tiff görüntüleri olarak çıkarmak için ghostscript siyah beyaz tiff çıkış cihazı (tiffg4) kullandım ve işte neye benzediklerine bir örnek:

resim açıklamasını buraya girin

Bu görüntüyü tesseract ile işlemek iyi sonuç vermez.
Ghostscript çıktı DPI'sini (600, 300, 150, 96) değiştirmek, 96 DPI'deki görüntünün tesserattan en iyi sonucu verdiğini gösterir, ancak yine de tatmin edici değildir.

Şimdi hangi filtrenin OCR işleme için bu görüntüyü geliştireceğini tavsiye etmeyi düşündüm.

Imagemagick veya numpy / scipy / ndimage kullanabilirim

Yanıtlar:



2

bunu düşük geçişli bir filtre kullanarak kaldırabilirsiniz. ya frekans alanında yapılır ya da sadece görüntünün gaussianını alır.

Gauss düşük geçişi, daha sonra keskinleştirmek için gaussianların farkı

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.