Kendi öğrenme amaçlarım için, aşağıdaki gibi bir kitaplık görüntüsü verildiğinde, kitapları listeleyecek bir algoritma uygulaması geliştirmeye çalışıyorum:
İlk adım, görüntüyü tek tek kitaplara ayırmaktır.
Mathematica'daki algoritmam :
img = ColorConvert[Import["http://i.stack.imgur.com/IaLQk.jpg"], "GrayScale"]
- temel bir kenar algılama ve
metni kaldırın ve uzun satırları tutmaya çalışın
edge = DeleteSmallComponents[EdgeDetect[img, 3],Last[ImageDimensions[img]]/5]
ardından istenmeyen yatay çizgileri kaldırın
lines = Sort[ImageLines[img5] /. {{0., _}, {_, _}} -> Sequence[]] Show[img, Graphics[{Thick, Orange, Line /@ lines}]]
Ancak sonuçlar harikadan daha az:
Sorularım:
- Daha iyi sonuçlar elde etmek için bunu nasıl geliştirebilirim?
- Bunu yapmanın daha akıllı bir yolu var mı?
- (daha sonra) OCR aşamasında doğruluğu artırmak için görüntüleri nasıl daha fazla işlemeliyim?
- Segmentasyonu iyileştirmek için renk bilgileri nasıl kullanılır?