Skip to content

czyPL/ImageTextBlockDetectionChallenge

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

2023讯飞开发者大赛图片文本块检测挑战赛方案分享

2023 iFLYTEK DEVELOPER COMPETATION
图片文本块检测挑战赛
A榜:第1 | B榜:第6

图片文本块检测是指检测出图片中完整且位置独立的文本块,并输出对应位置的任务,属于图片文档分析(Document Image Analysis,包括文档版面分析、表格检测等)中的任务之一。 图片文本块检测具有广泛的应用价值,例如:在生活、工作拍照翻译场景中,如果直接利用行粒度的识别结果做下游的翻译任务,会出现单行信息不完整,导致翻译结果信息缺失。

数据分析

既包含行检测类型(广告等),又包含段落检测类型(文档等)。

辅助标注工具

思路:构建辅助标注工具,对爬取的300张包含文本的图像进行半自动化标注,用于训练YOLOv8模型。辅助标注工具以DBNet为基础,参考PSENet的边框合并方法(边框合并),通过手动调整阈值在横纵两方向合并检测框。

About

2023 iFLYTEK DEVELOPER COMPETATION ( Text Segment Detection )

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages