Skip to content

akiragy/my_blog

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

个人博客存档

自己写过的一些技术博客,有些文章被国内平台无理由删除,因此搬到GitHub存档。

文章1-4是上学期间写的,当时比较喜欢机器学习理论,看完《PRML》有一些心得,因此记录。

文章5是工作之后写的,自己在某大厂做推荐算法工程师,深感自己的产出都要依赖公司的基础建设,因此使用全开源的组件构建了一个推荐系统全栈demo,完善知识体系。

文章6-7是大模型时代的个人项目,国内第一批大模型基本只支持中英文,自己很喜欢日语且有一定的日语能力,因此就想试着为大模型增加日语能力。其中文章6的扩词表部分比较成功,但是文章7的预训练+sft因为没有太多精力洗数据,效果一般。在这个项目的过程中,对日语支持很好的Qwen2和GLM-4发布了(本项目更加失去了意义...),在生产环境有需求的朋友可以尝试。但作为入门大模型的项目,还是能学到一些东西。

存档日期:2024-06-29,数据:453 赞同 + 793 收藏。

1 概率PCA与变分自编码器VAE

链接:https://github.com/akiragy/my_blog/blob/master/blog1.md

原文链接:https://zhuanlan.zhihu.com/p/42123894

发表时间:2018-08-15

数据:220 赞同 + 331 收藏

2 教科书上的LDA为什么长这个样子?

链接:https://github.com/akiragy/my_blog/blob/master/blog2.md

原文链接:https://zhuanlan.zhihu.com/p/42238953

发表时间:2018-08-16

数据:31 赞同 + 51 收藏

3 感知机(perceptron)和支持向量机(svm)是一种东西吗? 如果不是那他们的区别和关系是什么?

链接:https://github.com/akiragy/my_blog/blob/master/blog3.md

原文链接:https://www.zhihu.com/question/51500780/answer/482442236

发表时间:2018-08-31

数据:102 赞同 + 117 收藏

4 从正则化角度理解为什么需要特征归一化

链接:https://github.com/akiragy/my_blog/blob/master/blog4.md

原文链接:https://zhuanlan.zhihu.com/p/45242701

发表时间:2018-09-24

数据:12 赞同 + 22 收藏

5 【缝合向】PyTorch + Redis + Elasticsearch + Feast + Triton + Flask构建推荐系统,倒排/向量召回 + DeepFM排序 + 推理引擎 + 后端服务

链接:https://github.com/akiragy/my_blog/blob/master/blog5.md

原文链接:https://zhuanlan.zhihu.com/p/646840039

发表时间:2023-08-06

数据:69 赞同 + 233 收藏

6 日语大模型ChatGLM3-Japanese:(一)扩词表

链接:https://github.com/akiragy/my_blog/blob/master/blog6.md

原文链接:https://zhuanlan.zhihu.com/p/700603377

发表时间:2024-06-01

数据:14 赞同 + 25 收藏

7 日语大模型ChatGLM3-Japanese:(二)模型训练

链接:https://github.com/akiragy/my_blog/blob/master/blog7.md

原文链接:https://zhuanlan.zhihu.com/p/699975223

发表时间:2024-06-09

数据:6 赞同 + 3 收藏

About

个人技术博客

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published