Skip to content

IlyaBolkisev/Hackathon_employment_records

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

37 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Hackathon_employment_records

Команда: Лебедь, рак и щука
Состав: Илья Болкисев, Матвей Колтунов, Слава Шишаев

Описание проекта:
Веб-сервис с API, способный распозновать ключевые поля в трудовых книжках, визуально парсить их в интерфейс, в котором пользователь (оператор) может редактировать ошибки модели.
На основе исправленных ошибок собирается json файл, который используется для дообучения моделей.

Навигация:
modules - модули функционала:
обернутые модели (localization.py, recognition.py);
CV алгоритмы детекции печатей (stamp_detection.py) и ячеек таблицы (parse_table.py);
формирование json файла (wrapper.py).
app.py - веб-приложение, написанное на Flask.
templates - шаблоны веб-страниц, в которые парсятся данные книжек.
notebooks - ноутбуки с процессом обучения моделей локализации книжек и распознавания текста.

Датасеты:
Развороты книжек в формате yolo (https://drive.google.com/drive/folders/13W-6vfIt0dEH0q_yxsZ7wxAh9qL2M7PD?usp=sharing)
Рукописный русский текст (https://www.kaggle.com/datasets/constantinwerner/cyrillic-handwriting-dataset/data)

Веса обученных моделей:
Yolov8-obb (https://drive.google.com/file/d/1yDUP7-pzwcY-YLgRealOoiUVe2aEq_Uc/view?usp=sharing)
Text Recognition Transformer (https://drive.google.com/file/d/1hu3k1mHYaKF9CCRydBcFlFPaA6BPLChL/view?usp=sharing)
Text Recognition CRNN onxx (https://drive.google.com/file/d/1rS9DB_0ZSRoYJvDgUbpZD2hrQX6CaW2L/view?usp=sharing)
Text Recognition CRNN H5 (https://drive.google.com/file/d/1pnRhqVB_kKya3QWMMHkOWwNsO9RgTvdU/view?usp=sharing)

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •  

Languages