神骏的生信机器人(ShenJun‘s Bioinformatics Bot)是基于大语言模型(LLM)的生物信息领域智能机器人。其主要特色是在LLM基础上,增加了生信领域的知识库,提高专业度。
该机器人的特点如下:
- 大语言模型。即,你可以把它当成一个大语言模型来用。
- 内嵌生信知识库(自动调用)。
v2.0.0版本在v1.0.0的基础上进行了更新,主要更新点如下:
- 生信知识库由v1.0.0-2024-04-06升级到v2.0.0-2025-05-02。覆盖2020-2023年全部笔记文件,笔记文件数目从1366升级到1797。
- 国内版本,底层大模型由字节的云雀大模型切换为月之暗面的moonshot(128k)大模型,输出文本更长,性能更佳。
以下为基本介绍。
该机器人分成国内版、国外版两个版本,区别如下:
- 国内版。底层基于月之暗面的moonshot(128k)大模型,内嵌生信知识库,发布到微信订阅号(神骏的生信)。
- 国外版。底层基于GPT-4 Turbo 128k,内嵌生信知识库,发布到Telegram(电报)。
注意,使用国外版一般需要有国外的IP。
两者的性能各有千秋,见后文的性能测试。
国内版基于月之暗面的moonshot(128k)大模型,国外版基于GPT-4 Turbo 128k。即,这个机器人本身就是大语言模型。
当前内嵌了生信知识库v2.0.0版本(版本号: kb.v2.0.0.2024-05-02)。该知识库基于1797个笔记文档(2020年至2023年)制作,涵盖生物信息学、Linux运维、笔记和知识体系、项目管理、投资理财等诸多方面,特别是在人类遗传学、病原微生物、Linux运维方面具有大量的专业文档,可有效提升大模型的专业度。
国内版无需特殊的上网方式,可以通过微信订阅号(神骏的生信)、扣子、豆包等方式使用。推荐使用豆包app搜索添加本机器人。
微信扫描下方的二维码或搜索“神骏的生信”,关注后,后台留言即可。注意,此种方式为微信私信,公众号作者可以看到留言内容。
国外版需要特殊的上网方式,可以通过Telegram(电报)机器人、coze、Cici使用。
后续的更新计划有:
- 知识库更新。增加2023年(✅)、2024年的笔记,之后考虑半年/1年更新1次。
- 拆分不同领域的知识库。
- 嵌入各种搜索插件。
- 尝试AI的各种应用场景。
github地址: https://github.com/conanyangqun/shenjun_bot_release
喜欢本项目的话,欢迎分享给你的朋友。有什么问题,请开issue。
应对微信公众号防外链。
- 神骏的生信(微信公众号)。
- github地址:https://github.com/conanyangqun/shenjun_bot_release
- telegram机器人:https://t.me/shenjun_bot
- 扣子地址:https://www.coze.cn/store/bot/7354218993512742921
- coze地址:https://www.coze.com/store/bot/7354239448428642312
- 豆包地址:https://doubao.com/bot/uvereSti
使用了以下5个问题测试了国内-不带知识库、国内-带知识库、国外-不带知识库、国外-带知识库的性能,总体来说:
- 有知识库好于没有知识库。
- 国内、国外版本各有优劣。国内版本更贴近知识库,国外版本在知识库的基础上又进行了总结。