中文语音识别实验室APP,使用Django构建,包含中文语音转文字与中文语音聊天机器人模块
本项目的语音识别模型为自建:asr-model-ctc
- Django: 后端框架
- Django-Channels: 聊天室组件 (WebSocket)
- MySQL: 数据持久化
- Redis: 消息缓存
- jQuery/Bootstrap5: 前端组件库
- Tensorflow: 语音识别模型
- PaddlePaddle (ppasr): 标点符号预测模型
测试环境:
- Python 3.9 (必须)
- Django == 4.17
- Tensorflow == 2.9.3
使用pip install -r requirements.txt
安装所有依赖
编辑根目录下的config.json
配置文件,写入数据库配置等信息
{
"DATABASE": {
// MySQL数据库配置
"MYSQL": {
// 填写地址, 端口, 用户名, 密码
"HOST": "",
"PORT": 3306,
"USER": "",
"PASSWORD": ""
},
// Redis数据库配置
"REDIS": {
// 填写地址, 端口, 密码
"HOST": "",
"PORT": 6379,
"PASSWORD": ""
}
},
// 邮件服务器配置
"EMAIL": {
// 填写邮件服务器地址, 用户名, 密码
"HOST": "",
"PORT": 25,
"USER": "",
"PASSWORD": ""
},
}
- 在
config.json
中配置好BOT
,填入调用的API路径与授权key
即可
// Bot访问配置
"BOT": {
// 填写OpenAI Chat API调用地址
"API_URL": "",
// 填写OpenAI API授权Key
"API_KEY": ""
}
API_URL
必须是官方的Chat接口,即路径中包含v1/chat/completions
- 默认使用的会话模型是
gpt-3.5-turbo-0301
API_URL
可以使用代理