FAY

Fay数字人助理

Fay数字人助理版是fay开源项目的重要分支，专注于构建智能数字助理的开源解决方案。它提供了灵活的模块化设计，使开发人员能够定制和组合各种功能模块，包括情绪分析、NLP处理、语音合成和语音输出等。Fay数字人助理版为开发人员提供了强大的工具和资源，用于构建智能、个性化和多功能的数字助理应用。通过该版本，开发人员可以轻松创建适用于各种场景和领域的数字人助理，为用户提供智能化的语音交互和个性化服务。

Fay数字人助理版

注：带货版移到分支fay-sales-edition

助理版Fay控制器使用：语音沟通，语音和文字回复；文字沟通，文字回复。

PC远程助理 `PC demo`

手机远程助理 `android demo`

与数字形象通讯（非必须,控制器需要关闭“面板播放”）

控制器与采用 WebSocket 方式与 UE 通讯

下载工程: https://pan.baidu.com/s/1RBo2Pie6A5yTrCf1cn_Tuw?pwd=ck99

下载windows运行包: https://pan.baidu.com/s/1CsJ647uV5rS2NjQH3QT0Iw?pwd=s9s8

工程：https://github.com/xszyou/fay-ue5

重要：

Fay（服务端）与数字人的通讯接口: ws://127.0.0.1:10002（已接通）

消息格式: 查看 WebSocket.md

与远程音频输入输出设备连接（非必须,外网需要配置http://ngrok.cc tcp通道的clientid）

控制器与采用 socket(非websocket) 方式与音频输出设备通讯

内网通讯地址: ws://127.0.0.1:10001

外网通讯地址: 通过http://ngrok.cc获取（有伙伴愿意赞助服务器给社区免费使用吗？）

消息格式: 参考 remote_audio.py

二、Fay控制器核心逻辑

注：

以上每个模块可轻易替换成自家核心产品。

目录结构

.
├── main.py					# 程序主入口
├── fay_booter.py			# 核心启动模块
├── config.json				# 控制器配置文件
├── system.conf				# 系统配置文件
├── ai_module
│   ├── ali_nls.py			# 阿里云 实时语音
│   ├── ms_tts_sdk.py       # 微软 文本转语音
│   ├── nlp_lingju.py       # 灵聚 人机交互-自然语言处理
│   ├── xf_aiui.py          # 讯飞 人机交互-自然语言处理
│   ├── nlp_gpt.py          # gpt api对接
│   ├── nlp_chatgpt.py      # chat.openai.com逆向对接
│   ├── nlp_yuan.py         # 浪潮.源大模型对接
│   ├── nlp_rasa.py         # ChatGLM-6B的基础上前置Rasa会话管理(强烈推荐)
│   ├── nlp_VisualGLM.py    # 对接多模态大语言模型VisualGLM-6B
│   ├── yolov8.py           # yolov8资态识别
│   └── xf_ltp.py           # 讯飞 情感分析
├── bin                     # 可执行文件目录
├── core                    # 数字人核心
│   ├── fay_core.py         # 数字人核心模块
│   ├── recorder.py         # 录音器
│   ├── tts_voice.py        # 语音生源枚举
│   ├── authorize_tb.py     # fay.db认证表管理
│   ├── content_db.py       # fay.db内容表管理
│   ├── interact.py         # 互动（消息）对象
│   ├── song_player.py      # 音乐播放（暂不可用）
│   └── wsa_server.py       # WebSocket 服务端
├── gui                     # 图形界面
│   ├── flask_server.py     # Flask 服务端
│   ├── static
│   ├── templates
│   └── window.py           # 窗口模块
├── scheduler
│   └── thread_manager.py   # 调度管理器
├── utils                   # 工具模块
    ├── config_util.py      
    ├── storer.py
    └── util.py
└── test                    # 都是惊喜

三、升级日志

2023.07.05：

修复无法运行唇型算法而导致的不播放声音问题。

2023.06.28：

重构NLP模块管理逻辑，便于自由扩展；
gpt：拆分为ChatGPT及GPT、更换新的GPT接口、可单独配置代理服务器；
指定yolov8包版本，解决yolo不兼容问题；
修复：自言自语bug、接收多个待处理消息bug。

2023.06.21：

集成灵聚NLP api(支持GPT3.5及多应用)；
ui修正。

2023.06.17：

集成本地唇型算法。

2023.06.14：

解决多声道麦克风兼容问题；
重构fay_core.py及fay_booter.py代码；
ui适应布局调整；
恢复声音选择；
”思考中...“显示逻辑修复。

2023.05.27：

修复多个bug：消息框换行及空格问题、语音识别优化；
彩蛋转正，Fay沟通与ChatGPT并行；
加入yolov8姿态识别；
加入VisualGLM-6B多模态单机离线大语言模型。

2023.05.12：

打出Fay数字人助理版作为主分支（带货版移到分支fay-sales-edition）；
添加Fay助理的文字沟通窗口（文字与语音同步）；
添加沟通记录本地保存功能；
升级ChatGLM-6B的应用逻辑，长文本与语音回复分离。

四、安装说明

环境

Python 3.9、3.10
Windows、macos、linux

安装依赖

pip install -r requirements.txt

配置应用密钥

查看 AI 模块
浏览链接，注册并创建应用，将应用密钥填入 ./system.conf 中

启动

启动Fay控制器

python main.py

AI 模块

启动前需填入应用密钥

代码模块	描述	链接
./ai_module/ali_nls.py	实时语音识别（非必须，免费3个月,asr二选一）	https://ai.aliyun.com/nls/trans
./ai_module/funasr.py	达摩院开源免费本地asr （非必须，asr二选一）	fay/test/funasr/README.MD
./ai_module/ms_tts_sdk.py	微软文本转情绪语音（非必须，不配置时使用免费的edge-tts）	https://azure.microsoft.com/zh-cn/services/cognitive-services/text-to-speech/
./ai_module/xf_ltp.py	讯飞情感分析	https://www.xfyun.cn/service/emotion-analysis
./utils/ngrok_util.py	ngrok.cc 外网穿透（可选）	http://ngrok.cc
./ai_module/nlp_lingju.py	灵聚NLP api(支持GPT3.5及多应用)（NLP多选1）	https://open.lingju.ai 需联系客服务开通gpt3.5权限
./ai_module/yuan_1_0.py	浪潮源大模型（NLP 多选1）	https://air.inspur.com/
./ai_module/chatgpt.py	ChatGPT（NLP多选1）	*******
./ai_module/nlp_rasa.py	ChatGLM-6B的基础上前置Rasa会话管理（NLP 多选1）	https://m.bilibili.com/video/BV1D14y1f7pr
./ai_module/nlp_VisualGLM.py	对接VisualGLM-6B多模态单机离线大语言模型（NLP 多选1）	B站视频

五、使用说明

使用说明

语音助理：fay控制器（麦克风输入源开启、面板播放开启）；
远程语音助理：fay控制器（面板播放关闭）+ 远程设备接入；
数字人互动：fay控制器（麦克风输入源开启、面板播放关闭、填写性格Q&A）+ 数字人；
贾维斯、Her：加入我们一起完成。

语音指令

关闭核心	静音	取消静音
关闭、再见、你走吧	静音、闭嘴、我想静静	取消静音、你在哪呢、你可以说话了

播放歌曲(音乐库暂不可用)	暂停播放	更多
播放歌曲、播放音乐、唱首歌、放首歌、听音乐、你会唱歌吗	暂停播放、别唱了、我不想听了	没有了...

人设

数字人属性，与用户交互中能做出相应的响应。

交互灵敏度

在交互中，数字人能感受用户的情感，并作出反应。最直的体现，就是语气的变化，如开心/伤心/生气等。设置灵敏度，可改变用户情感对于数字人的影响程度。

接收来源

文本输入

通过沟通窗口与助理文本沟通

麦克风

选择麦克风设备，实现面对面交互，成为你的伙伴

socket远程音频输入

可以接入远程音频输入，远程音频输出

Name		Name	Last commit message	Last commit date
Latest commit History 62 Commits
ai_module		ai_module
android_connector_demo		android_connector_demo
bin		bin
core		core
gui		gui
images		images
python_connector_demo		python_connector_demo
scheduler		scheduler
shell		shell
test		test
utils		utils
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
WebSocket.md		WebSocket.md
[Start] PowerShell.bat		[Start] PowerShell.bat
[Start].bat		[Start].bat
config.json		config.json
favicon.ico		favicon.ico
fay_booter.py		fay_booter.py
icon.png		icon.png
main.py		main.py
qa_demo.xlsx		qa_demo.xlsx
requirements.txt		requirements.txt
system.conf		system.conf
yolov8n-pose.pt		yolov8n-pose.pt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

FAY

Fay数字人助理

推荐玩法

Fay数字人助理版

PC远程助理 `PC demo`

手机远程助理 `android demo`

与数字形象通讯（非必须,控制器需要关闭“面板播放”）

与远程音频输入输出设备连接（非必须,外网需要配置http://ngrok.cc tcp通道的clientid）

二、Fay控制器核心逻辑

目录结构

三、升级日志

四、安装说明

环境

安装依赖

配置应用密钥

启动

AI 模块

五、使用说明

使用说明

语音指令

人设

交互灵敏度

接收来源

文本输入

麦克风

socket远程音频输入

相关文章：

About

Releases

Packages

Languages

License

ruiizhi792/Fay

Folders and files

Latest commit

History

Repository files navigation

FAY

Fay数字人助理

推荐玩法

Fay数字人助理版

PC远程助理 PC demo

手机远程助理 android demo

与数字形象通讯（非必须,控制器需要关闭“面板播放”）

与远程音频输入输出设备连接（非必须,外网需要配置http://ngrok.cc tcp通道的clientid）

二、Fay控制器核心逻辑

目录结构

三、升级日志

四、安装说明

环境

安装依赖

配置应用密钥

启动

AI 模块

五、使用说明

使用说明

语音指令

人设

交互灵敏度

接收来源

文本输入

麦克风

socket远程音频输入

相关文章：

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

PC远程助理 `PC demo`

手机远程助理 `android demo`

Packages