受益于人工智能的技术突破和产品落地,对话系统在⼯业界的应⽤呈爆炸式增⻓,本仓库主要收集目前网上公开的一些高质量开放域对话模型(感谢分享资源的个人、团队以及企业),并将持续更新......
注: 😅 huggingface模型下载地址: 1. huggingface官方地址
- LCCC | 文本 |2020 | LCCC数据集分为base和large两个版本,主要用于预训练大规模对话生成模型,其base版本包括了12M个对话,32.9M个对话语句 |
PDF
|数据链接
- PchatbotW | 文本 | 2021 | PchatbotW主要从微博爬取得到,包括了139,448,339个对话、 278,896,678,并且提供了时间戳和用户ID两种个性信息,可以隐式地建模说话者的个性 |
PDF
|数据集链接
- WDC-Dialogue | 文本 | 2021 | WDC是一个超大规模的中文对话数据集,其平均轮次为2.1,包括了1.4B个对话,以及3.0B个语句 |
PDF
|数据集链接
- M3ED | 多模态 | 2022 | M3ED构建了一个大规模高质量的多模态、多场景、多标签情感对话数据集,从56部中文电视剧,大约500集中选取900多个对话片段,并对对话中的每句话进行多情感标签的标注,共标注24,449句话 |
PDF
|数据链接
- CPED | 多模态 | 2022 | CPED由与情感和个性相关的多源知识组成,包括性别、人格特征、13种情绪、19种对话行为和10个场景,包含超过12K段对话 |
PDF
|数据链接
- C3KG | 文本 | 2022 |C3KG是第一个结合了社会常识知识和对话流信息的中文常识对话知识图谱 |
PDF
|数据链接
- MMChat | 多模态 | 2022 | MMChat是一个大规模多模态多轮对话数据集,其中的每个对话都与一个或多个图片相关联 |
PDF
|数据集链接
- 千言中文对话数据集 | 文本 | 千言中文对话数据集包括DeLeMon、Diamante、LUGE-Dialogue、DuConv、DuRecDial、KdConv、PersonaDialog等,内容涵盖闲聊对话、情感对话、画像对话、知识对话、推荐对话等多个方面 |
PDF
|数据集链接
- GlobalWoZ | 文本 | 2022 | GlobalWoZ是利用机器翻译和目标语言的本地实体创建一个新的多语言大规模ToD数据集GlobalWoZ |
PDF
|数据链接
- TikTalk | 多模态 | 2023 | TikTalk数据集从抖音上采集,其抖音拥有超过25个大类的视频,包括38703个视频和相应367670个对话 |
PDF
|数据链接
模型 | 版本 | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|
CDial-GPTLCCC-base | base | huggingface | thu-coai | CDial-GPT | 中文对话 |
CDial-GPT2LCCC-base | base | huggingface | thu-coai | CDial-GPT | 中文对话 |
CDial-GPTLCCC-large | large | huggingface | thu-coai | CDial-GPT | 中文对话 |
GPT2-dialogue | base | yangjianxin1 | GPT2-chitchat | 闲聊对话 | |
GPT2-mmi | base | yangjianxin1 | GPT2-chitchat | 闲聊对话 |
- 2021 | EVA: An Open-Domain Chinese Dialogue System with Large-Scale Generative Pre-Training | Hao Zhou, et al. | arXiv |
PDF
- 2022 | EVA2.0: Investigating Open-Domain Chinese Dialogue Systems with Large-Scale Pre-Training | Yuxian Gu, et al. | arXiv |
PDF
模型 | 版本 | 介绍 | 模型下载 | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
EVA | 28亿参数 | 项目首页 | 模型下载 | thu-coai | github | 中文开放域对话 |
EVA2.0-xLarge | xlarge | 项目首页 | huggingface | thu-coai | github | 中文开放域对话 |
EVA2.0-large | large | 项目首页 | huggingface | thu-coai | github | 中文开放域对话 |
EVA2.0-base | base | 项目首页 | huggingface | thu-coai | github | 中文开放域对话 |
模型 | 版本 | 介绍 | 模型下载 | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
ChatGLM | 6B | 项目首页 | huggingface | THUDM | github | 中英开放域对话 |
BELLE | 7B | 项目首页 | huggingface | 贝壳 | github | 中英开放域对话 |
🤔 体验地址: 手机微信搜索百度PLATO即可体验 (目前已失效)
-
2020 | PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable | Siqi Bao, et al. | arxiv |
PDF
-
2021 | PLATO-2: Towards Building an Open-Domain Chatbot via Curriculum Learning | Siqi Bao, et al. | arxiv |
PDF
-
2021 | PLATO-XL: Exploring the Large-scale Pre-training of Dialogue Generation | Siqi Bao, et al. | arxiv |
PDF
-
2022 | PLATO-KAG: Unsupervised Knowledge-Grounded Conversation via Joint Modeling | Xinxian Huang, et al. | aclanthology |
PDF
-
2022 | Long Time No See! Open-Domain Conversation with Long-Term Persona Memory | Xinchao Xu, et al. | arxiv |
PDF
-
2022 | PLATO-K: Internal and External Knowledge Enhanced Dialogue Generation | Siqi Bao, et al. | arxiv |
PDF
模型 | 版本 | 介绍 | 模型下载 | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
PLATO | base | 项目地址 | PaddlePaddle | github | 中文开放域对话 | |
PLATO-2 | 93M | 项目地址 | PaddlePaddle | github | 中文开放域对话 | |
PLATO-2 | 314M | 项目地址 | PaddlePaddle | github | 中文开放域对话 | |
PLATO-2 | 1.6B | 项目地址 | PaddlePaddle | github | 中文开放域对话 | |
PLATO-XL | 11B | 项目地址 | PaddlePaddle | github | 中文开放域对话 | |
PLATO-KAG | 1.6B | 项目地址 | PaddlePaddle | github | 中文知识型对话 | |
PLATO-LTM | 1.6B | 项目地址 | PaddlePaddle | github | 中文开放域对话 | |
PLATO-K | 22B | PaddlePaddle | 中文开放域对话 | |||
ERNIE Bot | 中英开放域对话 |
- 2022 | PANGU-BOT: Efficient Generative Dialogue Pre-training from Pre-trained Language Model | Fei Mi, et al | arxiv |
PDF
- 2023 | PanGu-Σ: Towards Trillion Parameter Language Model with Sparse Heterogeneous Computing | Xiaozhe Ren, et al | arxiv |
PDF
模型 | 版本 | 介绍 | 模型下载 | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
PanGu-bot | 350M | 项目首页 | huawei-noah | github | 中文开放域对话 | |
PanGu-bot | 2.6B | 项目首页 | 模型下载 | huawei-noah | github | 中文开放域对话 |
PANGU-$\sum$ | 1.085T | huawei-noah | 中文开放域对话 |
模型 | 版本 | 介绍 | 模型下载 | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
OPD | 6.3B | 项目首页 | 模型下载 | thu-coai | github | 中文开放域对话 |
模型 | 版本 | 介绍 | 模型下载 | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
SkyText | 2.6B | 项目首页 | 模型下载 | SkyWork | github | 中文GPT3支持对话 |
SkyText | 13B | 项目首页 | 模型下载 | SkyWork | github | 中文GPT3支持对话 |
SkyChat | - | 项目首页 | - | SkyWork | github | 中文GPT3对话 |
🤔体验地址:moss
模型 | 版本 | 介绍 | 模型下载 | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
MOSS | 百亿级别 | 项目首页 | 模型下载 | 复旦大学自然语言处理实验室 | github | 中文ChatGPT |
🤔体验地址:ChatYuan
模型 | 版本 | 模型大小 | 介绍 | 模型下载 | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|---|
ChatYuan | large-v1 | 770M | 项目首页 | 模型下载 | ClueAI | github | 元语功能型对话大模型 |
🤔 体验地址(目前仅支持US用户): BlenderBot
-
2021 | BlenderBot 2.0: An open source chatbot that builds long-term memory and searches the internet | Moya Chen, et al. | parl.ai |
PDF
-
2022 | BlenderBot 3: a deployed conversational agent that continually learns to responsibly engage | Kurt Shuster | arxiv |
PDF
模型 | 版本 | 介绍 | 模型下载 | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
BlenderBot 2.0 | 400M | 项目地址 | 模型下载 | ParIAI | blenderbot2 | 英文开放域对话 |
BlenderBot 2.0 | 2.7B | 项目地址 | 模型下载 | ParIAI | blenderbot2 | 英文开放域对话 |
BlenderBot 3.0 | 3B | 项目地址 | 模型下载 | ParIAI | blenderbot3 | 英文开放域对话 |
BlenderBot 3.0 | 30B | 项目地址 | 模型下载 | ParIAI | blenderbot3 | 英文开放域对话 |
BlenderBot 3.0 | 175B | 项目地址 | 模型下载 | ParIAI | blenderbot3 | 英文开放域对话 |
🤔 体验地址(支持中英等多种语言): Character.AI
- 2022 | LaMDA: Language Models for Dialog Applications | Romal Thoppilan, et al. | arxiv |
PDF
模型 | 版本 | 介绍 | 模型下载 | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
LaMDA | 2B | 项目地址 | - | - | LaMDA-pytorch | 英文开放域对话 |
LaMDA | 8B | 项目地址 | - | - | LaMDA-pytorch | 英文开放域对话 |
LaMDA | 137B | 项目地址 | - | - | LaMDA-pytorch | 英文开放域对话 |
🤔体验地址(支持中英等多种语言)参考网站:参考
- 2022 | Training language models to follow instructions with human feedback | Long Ouyang, et al. | arxiv |
PDF
- 2023 | GPT-4 Technical Report | OpenAI* |
PDF
模型 | 版本 | 介绍 | 模型下载 | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
ChatGPT | - | 项目地址 | - | OpenAI | ChatGPT | 通用生成模型 |
InstructGPT | - | 项目地址 | - | OpenAI | InstructGPT | 通用生成模型 |
GPT4 | - | 项目地址 | - | OpenAI | GPT4 | 通用生成模型 |
[1] 常见对话生成数据集整理
[2] Awesome Pretrained Chinese NLP Models
[3] 千言中文对话
- 2023.03.21 增加PANGU-$\sum$,PANGU-$\sum$是一个在Ascend 910 AI处理器和MindSpore框架的集群上训练的一个万亿参数的语言模型
- 2023.03.21 增加BELLE,BELLE是一个开源的中文对话大模型,基于Stanford Alpaca,并对中文做了优化
- 2023.03.20 增加ERNIE Bot,ERNIE Bot是百度团队发布的一个人工智能语言模型,中文名是文心一言,可以回答用户的问题,为用户提供有用的信息,并帮助用户完成创作
- 2023.03.15 增加GPT4,GPT-4是OpenAI最先进的模型,能够产生更安全、更有用的回复
- 2023.03.14 增加ChatGLM, ChatGLM是一个开源的、支持中英双语的对话语言模型,是一个初具问答和对话功能的千亿中英语言模型
- 2023.03.06 增加ChatYuan,ChatYuan是业内首个功能型对话开源中文大模型,可以用于回答问题、可以结合上下文做对话、做各种生成任务,包括创意性写作,也能回答法律、新冠等领域类问题
- 2023.02.21 增加MOSS,MOSS是复旦大学自然语言处理实验室发布的一个具备 ChatGPT 能力的语言模型
- 2023.01.31 增加TikTalk,TikTalk是一个真实闲聊中文多模态数据集,共包括38703个视频和相应367670个对话
- 2022.12.27 增加SkyChat, SkyChat是一款基于中文GPT-3 API研发的聊天机器人项目,它除了基本的聊天、对话、你问我答外,还能支持中英文互译、内容续写、对对联、写古诗、生成菜谱、第三人称转述、创建采访问题等多种功能
- 2022.12.19 增加SkyText,SkyText是由奇点智源发布的中文GPT3预训练大模型,可以进行聊天、问答、中英互译等不同的任务
- 2022.12.13 增加InstructGPT,InstructGPT和ChatGPT在模型结构,训练方式上都完全一致,都采用了指示学习和人工反馈的强化学习来指导模型的训练
- 2022.12.04 增加ChatGPT,ChatGPT是一个由 OpenAI 训练的大型语言模型,ChatGPT 支持和用户通过对话的形式“回答问题”,并且赋予了一些简单的智能化行为
- 2022.11.23 增加PLATO-K,PLATO-K提出了同时结合知识内化和知识外用的全面知识增强策略,参数规模达到了220亿,是当前最大规模的中文对话模型
- 2022.11.17 增加GlobalWoZ,GlobalWoZ是面向全球通用的人机对话系统多语言任务型对话数据
- 2022.11.16 增加PLATO-XL、LaMDAa和Blender体验地址,可以与闲聊机器人面对面聊天
- 2022.11.09 增加OPD,OPD是一个中文开放域对话预训练模型,拥有63亿参数,在70GB高质量对话数据上进行训练而成
- 2022.11.04 增加LaMDA,LaMDA 通过微调一系列专门用于对话的、基于 Transformer 的神经语言模型构建的,具有多达 137B 个参数,模型还可以利用外部知识源进行对话
- 2022.10.25 增加Blender系列模型,Facebook下一系列对话模型
- 2022.10.15 增加PanGu系列模型,PanGu-Dialog是以大数据和大模型为显著特征的大规模开放域对话生成模型,充分利用大规模预训练语言模型的知识和语言能力,构建可控、可靠可信、有智慧的自然人机对话模型
- 2022.09.30 增加PLATO系列模型,百度自主研发的集闲聊、任务、知识于一身的对话机器人
- 2022.09.25 增加EVA系列模型,EVA 是目前最大的开源中文预训练对话模型
- 2022.09.17 初始化中文CDial-GPT系列模型,最早开源的中文对话模型,同时还开源了闲聊对话数据集LCCC
- 2022.08.17 增加中文开放域对话数据集