Skip to content

OCR issues #5

@yousrchive

Description

@yousrchive
  1. 웹툰 번역 OCR 착안
    https://www.youtube.com/watch?v=REFmxA9hUa4

image

가맹점이 한 박스, 이화약국이 한 박스로 다른 박스로 인식되면, '가맹점 : 이화약국'(가맹점이 이화약국에 해당함)이라는 것을 알 수 없다.
다만 easyocr 등 OCR 라이브러리들은 한 단어로 인식하는 박스의 네 모서리 좌표(min, max) (x, y)를 알려주므로, 이를 이용할 수 있다.
따라서, 이미지 전처리를 통해 박스를 평행하게 만들어 두 모서리의 Y값을 일치시킨 다음, min y, max y가 비슷하면서(평행하면서) x값이 너무 떨어져 있지 않은 경우, 하나의 박스로 취급하도록 코드를 짜 줄 수 있다.

image

그런데 이 경우에도 결국 박스를 추출한 다음에 하드코딩으로 'if '가맹점' in text 이런 식의 코드를 짜야 하는데,
한글을 완벽히 인지하지 않는 경우가 많아 그럴 수 없었다.
모든 경우의 수를 계산하기란. '가맹점' '가게' '가맴정' '가맴점' '가냉점'...

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions