------------------------------------------------------动态手势识别流程-------------------------------------------------------------
1.数据采集
2.数据管理
3.数据处理:时间序列原始数据生成、数据清洗
4.特征数据集生成:图像数据集、关键点数据集、关键点融合特征数据集
5.训练:时间序列特征生成、时间序列特征分类
6.评价指标:测试方法、结果对比
7.模型部署:不同模型转换(pt、h5->onnx、tflite)、模型检测方案
数据集获取:本博客只上传小部分数据集,需要整个数据集请邮箱联系fusm@vless.net
详解
数据采集
根据自己相机sdk的要求自行编写采集软件。采集流程如下:
数据管理
制定原始采集数据、训练数据集的存放方式。
数据处理
该步骤将前面录取的原始图像数据采用特定的方式(如滑动串口)生成用于训练集生成的图像数据集,流程如下图。
注:滑动窗口法使用
考虑到人类活动在现实中是如何进行的,我们了解到每一个活动都是几个基本的连续运动的组合。通常情况下,一个人的活动可以在练习中持续几秒钟,在一秒钟内,一些基本的动作就可以参与其中。
1.数据集采集方式:指定某个手势动作在规定时间内做固定的次数手势。
2.数据集制作方式:
利用固定宽度滑动窗口在该视频内进行分割,设置滑动窗口步长s,s越小数据集数量越多。(借鉴UCI-HAR数据集原理
特征数据集生成
该部分是将图像数据集处理成不同网络想要的训练集和验证集。主要分图像训练集和关键点训练集。
图像训练集生成:直接将数据处理步骤的图像数据集作为训练集即可。
关键点训练集:需要编写mediapipe关键点代码,将所有样图片转换成21个关键点或者其他关键点相关的融合特征。
注
:mediaipe c++编译,dll生成与运行下载链接:https://pan.baidu.com/s/1ditBJOPpW7ae_RDSL8GnqA 提取码:6fva
训练
1.cnn-lstm
网络结构:
code:https://github.com/fpeanut/tof-dynamic-gesture-recognition/tree/main/2_ModelTrain/2_model%20training/cnn-lstm
2.mediapipe-lstm
code:https://github.com/fpeanut/tof-dynamic-gesture-recognition/tree/main/2_ModelTrain/2_model%20training/mediapipe-lstm
模型部署
CPP_ONNX:https://github.com/fpeanut/tof-dynamic-gesture-recognition/tree/main/3_ModelDeployment/cpp_onnx
CPP_TFlite:https://github.com/fpeanut/tof-dynamic-gesture-recognition/tree/main/3_ModelDeployment/cpp_tflite
模型检测方案
step1:确定训练模型输入的尺寸(例如18帧的序列尺寸为18)
step2:定义相同尺寸的容器vector。
step3:初始化时,vector全部赋值0,当有新的帧数值进来时,容器进栈,并且选择onnx/tflite进行推理。
优点:能够实时的获得识别结果,避免延迟现象的存在。
-
Notifications
You must be signed in to change notification settings - Fork 1
fpeanut/tof-dynamic-gesture-recognition
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
详述动态手势识别(LSTM)课题训练部署的整个过程,数据集可以使用rgb或者tof的;持续更新...
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published