Skip to content

神骏的生信机器人(ShenJun‘s Bioinformatics Bot)是基于大语言模型(LLM)的生物信息领域智能机器人。其主要特色在于在LLM基础上,增加生信领域的知识库,提高专业度。

License

Notifications You must be signed in to change notification settings

conanyangqun/shenjun_bot_release

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

神骏的生信机器人-v2.0.0

神骏的生信机器人(ShenJun‘s Bioinformatics Bot)是基于大语言模型(LLM)的生物信息领域智能机器人。其主要特色是在LLM基础上,增加了生信领域的知识库,提高专业度。

该机器人的特点如下:

  • 大语言模型。即,你可以把它当成一个大语言模型来用。
  • 内嵌生信知识库(自动调用)。

v2.0.0版本在v1.0.0的基础上进行了更新,主要更新点如下:

  • 生信知识库由v1.0.0-2024-04-06升级到v2.0.0-2025-05-02。覆盖2020-2023年全部笔记文件,笔记文件数目从1366升级到1797。
  • 国内版本,底层大模型由字节的云雀大模型切换为月之暗面的moonshot(128k)大模型,输出文本更长,性能更佳。

以下为基本介绍

该机器人分成国内版、国外版两个版本,区别如下:

  • 国内版。底层基于月之暗面的moonshot(128k)大模型,内嵌生信知识库,发布到微信订阅号(神骏的生信)。
  • 国外版。底层基于GPT-4 Turbo 128k,内嵌生信知识库,发布到Telegram(电报)。

注意,使用国外版一般需要有国外的IP

两者的性能各有千秋,见后文的性能测试。

大语言模型

国内版基于月之暗面的moonshot(128k)大模型,国外版基于GPT-4 Turbo 128k。即,这个机器人本身就是大语言模型。

生信知识库

当前内嵌了生信知识库v2.0.0版本(版本号: kb.v2.0.0.2024-05-02)。该知识库基于1797个笔记文档(2020年至2023年)制作,涵盖生物信息学、Linux运维、笔记和知识体系、项目管理、投资理财等诸多方面,特别是在人类遗传学、病原微生物、Linux运维方面具有大量的专业文档,可有效提升大模型的专业度

国内版使用方法

国内版无需特殊的上网方式,可以通过微信订阅号(神骏的生信)、扣子、豆包等方式使用。推荐使用豆包app搜索添加本机器人

  • 豆包。浏览器打开豆包,登录后即可使用。
  • 扣子。浏览器打开此处,登录后即可使用。

微信访问

微信扫描下方的二维码或搜索“神骏的生信”,关注后,后台留言即可。注意,此种方式为微信私信,公众号作者可以看到留言内容

wechat

国外版使用方法

国外版需要特殊的上网方式,可以通过Telegram(电报)机器人、coze、Cici使用。

  • telegram机器人。点击此处,打开电报客户端即可使用。
  • coze。浏览器访问此处
  • Cici。浏览器访问Cici(无法分享?),登录账号即可使用

后续计划

后续的更新计划有:

  • 知识库更新。增加2023年(✅)、2024年的笔记,之后考虑半年/1年更新1次。
  • 拆分不同领域的知识库。
  • 嵌入各种搜索插件。
  • 尝试AI的各种应用场景。

项目地址

github地址: https://github.com/conanyangqun/shenjun_bot_release

喜欢本项目的话,欢迎分享给你的朋友。有什么问题,请开issue

访问地址

应对微信公众号防外链

性能测试

使用了以下5个问题测试了国内-不带知识库、国内-带知识库、国外-不带知识库、国外-带知识库的性能,总体来说:

  • 有知识库好于没有知识库。
  • 国内、国外版本各有优劣。国内版本更贴近知识库,国外版本在知识库的基础上又进行了总结。

benchmarks

About

神骏的生信机器人(ShenJun‘s Bioinformatics Bot)是基于大语言模型(LLM)的生物信息领域智能机器人。其主要特色在于在LLM基础上,增加生信领域的知识库,提高专业度。

Resources

License

Stars

Watchers

Forks

Packages

No packages published