Skip to content

SCUT-DLVCLab/TongGu-VL

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 

Repository files navigation

中文  |  English

通古大模型

介绍

通古大模型是华南理工大学深度学习与视觉计算实验室(SCUT-DLVCLab)开发的古籍多模态模型,具备较强大的古籍文字识别和理解能力。

开源清单

数据集

CCS358K: 35.8万古籍多模态微调数据,涵盖古籍文字识别、阅读理解、文言文翻译等任务。

CCS358K数据集只能用于非商业研究目的。对于想要使用CCS358K数据集的学者或组织,请先填写此申请表并通过电子邮件发送给我们。向我们提交申请表时,请列出或附上您近6年发表的论文1-2篇,以表明您(或您的团队)在古籍领域进行研究。 我们收到并批准您的申请后,将为您提供下载链接和解压密码。 所有用户必须遵守所有使用条件;否则,将撤销授权。

模型

TongGu-VL-2B-Instruct将在近期开源(1-2周)

About

A Multimodal large language model for Classical Chinese Studies

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published