ml-notes/240426.md at main · gxmzuai/ml-notes · GitHub

This repository has been archived by the owner on Jul 5, 2024. It is now read-only.

title	outline
词向量、seq2seq	deep

1、课堂要点

词嵌入（word2vec）基本概念
跳字模型（skip-gram）
连续词袋模型（cbow）
近似训练
word2vec
子词嵌入
全局向量嵌入（GloVe）
seq2seq
评测指标BLEU
在训练过程中先清零梯度再更新梯度

# 将优化器的梯度缓存清零
optimizer.zero_grad()

# 计算损失函数的梯度
loss.backward()

# 使用优化器更新模型参数
optimizer.step()

2、课后作业

p1、p2是怎么计算出来的？