Oracle Bones

本项目取材自 2024 年 MathorCup 数学应用挑战赛 B 题，基于 YOLOv8 的甲骨文原始拓片图像单字分割识别模型。

项目简介

针对原始拓片图像中的甲骨文文字分割识别包括以下两个阶段：

目标检测：基于 YOLOv8 目标检测模型，对甲骨文文字所在的矩形区域进行提取。
字符识别：基于 YOLOv8 图像分类模型，对文字图像进行分类，判断该字形所代表的具体字符内容。

同时基于 PyQt5 制作了一个简单的识别器前端程序。

效果展示

性能评估

本项目训练数据集来自殷契文渊，对原始数据集进行了数据清洗和图像增强，采用 YOLOv8s 模型进行训练，能识别 195 中不同的甲骨文字符，其中目标检测模型各项指标如下：

mAP50	mAP50-95	Precision	Recall
0.928	0.608	0.905	0.865

字符分类模型各项指标如下：

Top1_acc	Top5_acc
0.897	0.969

在 640x640 的图像输入下，采用 PyTorch 平均推理一张图片的耗时约为 190ms，采用 ONNX Runtime 推理平均耗时约为 120ms（CPU：11th Intel Core i5-1155G7 2.50GHz，Model：YOLOv8s）。

使用说明

首先安装环境依赖包，项目目前采用 ONNX Runtime 部署模型推理。

pip install -r requirements.txt

若需要使用 GPU 进行推理，则需要安装：

pip install onnxruntime-gpu

可以在本项目 Releases 中下载我训练好的模型权重文件，解压到项目中相应的位置（位于 inferences/models/ 下），运行 main.py 即可。

python main.py

本项目识别程序的默认配置文件为 configs/inference.yaml，其中各个属性对应的含义如下：

precision: "fp32"                # 推理运算精度，"fp32"（单精度）或 "fp16"（半精度）
providers:                       # ONNX Runtime Providers 参数
  - "CPUExecutionProvider"

conf-threshold: 0.25             # 目标检测置信度阈值
iou-threshold: 0.45              # 目标检测非极大值抑制 IoU 阈值

character-codes:                 # 字符分类编码列表，包含所有字符类别对应的标签
  - "001000"
  - "001001"
  - "001008"
  ...

如果需要使用自己的数据集训练模型，则需要安装 ultralytics 框架，参照 Ultralytics 官方文档进行模型的训练，最后将模型转换为 ONNX 格式进行部署即可。

pip install ultralytics

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
assets		assets
configs		configs
inferences		inferences
views		views
.gitignore		.gitignore
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Oracle Bones

项目简介

效果展示

性能评估

使用说明

About

Releases 1

Packages

Languages

LIU42/OracleBones

Folders and files

Latest commit

History

Repository files navigation

Oracle Bones

项目简介

效果展示

性能评估

使用说明

About

Topics

Resources

Stars

Watchers

Forks

Releases 1

Packages 0

Languages

Packages