基于CTPN(tensorflow)+CRNN(pytorch)+CTC的不定长文本检测和识别
sh setup.sh
使用环境: python 3.6 + tensorflow 1.10 + pytorch 0.4.1
- 注:CPU环境执行前需注释掉for gpu部分,并解开for cpu部分的注释
python demo.py
下载 预训练模型
将pytorch-crnn.pth放入/train/models中
将checkpoints.zip解压后的内容放入/ctpn/checkpoints中
下载训练集
- 共约364万张图片,按照99:1划分成训练集和验证集
- 数据利用中文语料库(新闻 + 文言文),通过字体、大小、灰度、模糊、透视、拉伸等变化随机生成
- 包含汉字、英文字母、数字和标点共5990个字符
- 每个样本固定10个字符,字符随机截取自语料库中的句子
- 图片分辨率统一为280x32
修改/train/config.py中train_data_root
,validation_data_root
以及image_path
cd train
python train.py
warp-ctc-pytorch
chinese_ocr-(tensorflow+keras)
CTPN-tensorflow
crnn-pytorch