Conformer OCR

Introduction

Conformer OCR is an Optical Character Recognition toolkit built for researchers working on both OCR for both Vietnamese and English. This project only focused on variants of vanilla Transformer and Feature Extraction (CNN-based approach).

This is also the first repo to utilize ConformerNet (https://arxiv.org/abs/2005.08100) for OCR.

Architecture

Key Features

Variants of Transformer (e.g., Vanilla, Conformer) encoder with CTC decoder.
Both naive Pytorch and Pytorch Lightning are provided
Beam search with N-gram Language model
Accumulation gradient training

Install dependencies

cd transformer_ocr
pip install -r requirements/requirements.txt

Directory structure

To modulize the repo, the current structure is adopted as follows:

├── conf # configurations
│   ├── dataset
│   ├── model
│   ├── optimizer
│   ├── pl_params
│   └── config.yaml
├── requirements # Where store different requirements if needed
│   └── requirements.txt
├── scripts # Where start your training/evaluation/testing models 
│   ├── train.py
│   └── train_PT.py
├── transformer_ocr # Main resource
└── README.md

Tutorials

Quick start

Train with naive Pytorch mode

cd scripts
python train.py

Train with Pytorch Lightning mode

cd scripts
python train_PT.py

Pre-trained models

Coming soon...

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
conf		conf
requirements		requirements
scripts		scripts
transformer_ocr		transformer_ocr
visualization		visualization
README.md		README.md
Tutorial.ipynb		Tutorial.ipynb
test_img.png		test_img.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Conformer OCR

Introduction

Architecture

Key Features

Install dependencies

Directory structure

Tutorials

Quick start

Pre-trained models

About

Releases

Packages

Languages

hoangtuanvu/conformer_ocr

Folders and files

Latest commit

History

Repository files navigation

Conformer OCR

Introduction

Architecture

Key Features

Install dependencies

Directory structure

Tutorials

Quick start

Pre-trained models

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages