OCR işleme için biraz "yarı tonlu" görüntüye filtre uygulama

10

Gizli metin katmanı eklemek istediğim taranmış bir PDF malzemem var, bu yüzden belgeyi dizine ekleyebilirim. Sayfaları tiff görüntüleri olarak çıkarmak için ghostscript siyah beyaz tiff çıkış cihazı (tiffg4) kullandım ve işte neye benzediklerine bir örnek:

resim açıklamasını buraya girin

Bu görüntüyü tesseract ile işlemek iyi sonuç vermez.
Ghostscript çıktı DPI'sini (600, 300, 150, 96) değiştirmek, 96 DPI'deki görüntünün tesserattan en iyi sonucu verdiğini gösterir, ancak yine de tatmin edici değildir.

Şimdi hangi filtrenin OCR işleme için bu görüntüyü geliştireceğini tavsiye etmeyi düşündüm.

Imagemagick veya numpy / scipy / ndimage kullanabilirim

image-processing ocr

— zetah
kaynak

9

Gerçekten ihtiyacınız olan şey muhtemelen dilatasyon ve ardından erozyon gibi morfolojik bir işlemdir. Buna Kapanış işlemi denir . Sizin durumunuzda olabilir- sadece genişlemenin kendisi iyi olabilir.

Daha önce sorulan benzer bir soru vardı - bu, diğer yönlere yardımcı olabilir.

tek renkli (1 bit siyah beyaz) görüntü dönüştürme

Yalnızca morfolojik işlemleri kullanarak bir görüntüdeki metni nasıl yeniden oluştururum?

— Dipan Mehta
kaynak

2

bunu düşük geçişli bir filtre kullanarak kaldırabilirsiniz. ya frekans alanında yapılır ya da sadece görüntünün gaussianını alır.

— Christoph Rackwitz
kaynak