13
tesseract OCR doğruluğunu artırmak için görüntü işleme
Belgeleri metne dönüştürmek için tesseract kullanıyorum. Belgelerin kalitesi çılgınca değişiyor ve ne tür görüntü işlemenin sonuçları iyileştirebileceğine dair ipuçları arıyorum. Yüksek pikselli metnin - örneğin faks makineleri tarafından üretilen - tesseratın işlenmesi için özellikle zor olduğunu fark ettim - muhtemelen karakterlerin tüm bu pürüzlü kenarları şekil tanıma algoritmalarını karıştırıyor. Ne …