-
Notifications
You must be signed in to change notification settings - Fork 0
Open
Description
- 웹툰 번역 OCR 착안
https://www.youtube.com/watch?v=REFmxA9hUa4
가맹점이 한 박스, 이화약국이 한 박스로 다른 박스로 인식되면, '가맹점 : 이화약국'(가맹점이 이화약국에 해당함)이라는 것을 알 수 없다.
다만 easyocr 등 OCR 라이브러리들은 한 단어로 인식하는 박스의 네 모서리 좌표(min, max) (x, y)를 알려주므로, 이를 이용할 수 있다.
따라서, 이미지 전처리를 통해 박스를 평행하게 만들어 두 모서리의 Y값을 일치시킨 다음, min y, max y가 비슷하면서(평행하면서) x값이 너무 떨어져 있지 않은 경우, 하나의 박스로 취급하도록 코드를 짜 줄 수 있다.
그런데 이 경우에도 결국 박스를 추출한 다음에 하드코딩으로 'if '가맹점' in text 이런 식의 코드를 짜야 하는데,
한글을 완벽히 인지하지 않는 경우가 많아 그럴 수 없었다.
모든 경우의 수를 계산하기란. '가맹점' '가게' '가맴정' '가맴점' '가냉점'...
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels

