自己写过的一些技术博客,有些文章被国内平台无理由删除,因此搬到GitHub存档。
文章1-4是上学期间写的,当时比较喜欢机器学习理论,看完《PRML》有一些心得,因此记录。
文章5是工作之后写的,自己在某大厂做推荐算法工程师,深感自己的产出都要依赖公司的基础建设,因此使用全开源的组件构建了一个推荐系统全栈demo,完善知识体系。
文章6-7是大模型时代的个人项目,国内第一批大模型基本只支持中英文,自己很喜欢日语且有一定的日语能力,因此就想试着为大模型增加日语能力。其中文章6的扩词表部分比较成功,但是文章7的预训练+sft因为没有太多精力洗数据,效果一般。在这个项目的过程中,对日语支持很好的Qwen2和GLM-4发布了(本项目更加失去了意义...),在生产环境有需求的朋友可以尝试。但作为入门大模型的项目,还是能学到一些东西。
存档日期:2024-06-29,数据:453 赞同 + 793 收藏。
链接:https://github.com/akiragy/my_blog/blob/master/blog1.md
原文链接:https://zhuanlan.zhihu.com/p/42123894
发表时间:2018-08-15
数据:220 赞同 + 331 收藏
链接:https://github.com/akiragy/my_blog/blob/master/blog2.md
原文链接:https://zhuanlan.zhihu.com/p/42238953
发表时间:2018-08-16
数据:31 赞同 + 51 收藏
链接:https://github.com/akiragy/my_blog/blob/master/blog3.md
原文链接:https://www.zhihu.com/question/51500780/answer/482442236
发表时间:2018-08-31
数据:102 赞同 + 117 收藏
链接:https://github.com/akiragy/my_blog/blob/master/blog4.md
原文链接:https://zhuanlan.zhihu.com/p/45242701
发表时间:2018-09-24
数据:12 赞同 + 22 收藏
5 【缝合向】PyTorch + Redis + Elasticsearch + Feast + Triton + Flask构建推荐系统,倒排/向量召回 + DeepFM排序 + 推理引擎 + 后端服务
链接:https://github.com/akiragy/my_blog/blob/master/blog5.md
原文链接:https://zhuanlan.zhihu.com/p/646840039
发表时间:2023-08-06
数据:69 赞同 + 233 收藏
链接:https://github.com/akiragy/my_blog/blob/master/blog6.md
原文链接:https://zhuanlan.zhihu.com/p/700603377
发表时间:2024-06-01
数据:14 赞同 + 25 收藏
链接:https://github.com/akiragy/my_blog/blob/master/blog7.md
原文链接:https://zhuanlan.zhihu.com/p/699975223
发表时间:2024-06-09
数据:6 赞同 + 3 收藏