Learning LLM is all you need.
👉 点击 LearnLLM.AI | 学习大模型,从这里开始
精选大模型面试题库:覆盖从基础到前沿的实战题目,助您高效备战求职,抓住职业机遇;
系统化论文研读:从2017年Transformer奠基性论文出发,按清晰的知识体系梳理技术演进,适合不同基础的开发者循序渐进地深度提升。
专属优惠码
我们为Github用户准备了限时专属优惠码:GITHUB50 ,期待在 LearnLLM.AI 与您继续同行,共同成长!
配套视频教程(持续更新中):
👉 点击这里 bilibili
👉 点击这里 YouTube
如有疑问,欢迎随时联系我们。
Happy Learning!
LearnLLM.AI 团队
| 时间 | 论文 | 介绍 | 视频 | 开始学习 |
|---|---|---|---|---|
| 2017-06-12 | Transformer | 提出自注意力与 Transformer 架构 | ![]() |
|
| 2018-06-11 | GPT-1 | 预训练 + 微调的生成式 Transformer | ![]() |
|
| 2018-10-11 | BERT | 双向编码器:MLM + NSP | ![]() |
|
| 2019-02-14 | GPT-2 | 大规模无监督文本生成 | ![]() |
|
| 2019-10-23 | T5 | 文本到文本统一框架 | ![]() |
|
| 2020-05-28 | GPT-3 | 大模型与少样本学习能力 | ![]() |
|
| 2021-07-07 | CodeX | 面向代码生成的 GPT 系列模型 | ![]() |
|
| 2022-02-08 | AlphaCode | 竞赛级代码生成系统 | ![]() |
|
| 2022-03-04 | InstructGPT | 人类反馈对齐与指令微调 | ![]() |
|
| 2023-02-27 | LLaMA-1 | 高效开源预训练基座模型 | ||
| 2023-07-18 | LLaMA-2 | LLaMA 升级版,开放商用 | ||
| 2023-09-28 | Qwen 1 | 通义千问第一代基座模型 | ||
| 2023-10-10 | Mistral 7B | 高效 7B 级开源模型 | ||
| 持续更新中... |
点击展开/收起
- 🐳序-AGI之路
- 🐱第一章-大模型之Pre-Training
- 🐶第二章-大模型之部署与推理
- 🐯第三章-大模型微调
- 🐻第四章-大模型量化
- 🐼第五章-显卡与大模型并行
- 🐨第六章-Prompt-Engineering
- 🦁第七章-Agent
- 🐷RAG
- 🐘第八章-大模型企业落地
- 🐰第九章-大模型评估指标
- 🐷第十章-热点
- 🦁第十一章-数学
Pre-Training预训练Llama-3.1 405B超大杯,需要多少算力资源?
10分钟搞清楚为什么Transformer中使用LayerNorm而不是BatchNorm
神经网络的激活函数(二)Sigmiod、Softmax和Tanh
神经网络的激活函数(五)门控系列-GLU、Swish和SwiGLU
看懂FlashAttention需要的数学储备是?高考数学最后一道大题
为什么会发展出Multi-Query-Attention和Group-Query-Attention
模型部署不求人!从TTFT到Throughput的性能估算终极公式
大模型output-token为什么比input-token贵
如何评判大模型的输出速度?首Token延迟和其余Token延迟有什么不同?
大模型的latency(延迟)和throughput(吞吐量)有什么区别
vLLM使用PagedAttention轻松、快速且廉价地提供LLM服务(中文版翻译)
DevOps,AIOps,MLOps,LLMOps,这些Ops都是什么?
大模型推理框架(三)Text generation inference (TGI)
大模型微调之Soft prompts(二)Prompt Tuning
大模型微调之Soft prompts(三)Prefix-Tuning
大模型微调之Soft prompts(五)Multitask prompt tuning
Transformer架构的GPU并行和之前的NLP算法有什么不同?
万字长文Prompt-Engineering-解锁大模型的力量
如何设计智能体架构:参考OpenAI还是Anthropic?
GraphRAG:解锁大模型对叙述性私人数据的检索能力(中文翻译)
大模型应用涌现出的新工作机会-红队测试Red-teaming
大模型性能评测之大海捞针(Needle In A Haystack)
韩国“N 号房”事件因Deep Fake再现,探究背后的技术和应对方法
用Exploit and Explore解决不知道吃什么的选择困难症
0基础学习AI大模型必备数学知识之概率统计(一)贝叶斯定理和概率分布










