title | outline |
---|---|
词向量、seq2seq |
deep |
-
词嵌入(word2vec)基本概念
-
跳字模型(skip-gram)
-
连续词袋模型(cbow)
-
近似训练
-
word2vec
-
子词嵌入
-
全局向量嵌入(GloVe)
-
seq2seq
-
评测指标BLEU
-
在训练过程中先清零梯度再更新梯度
# 将优化器的梯度缓存清零
optimizer.zero_grad()
# 计算损失函数的梯度
loss.backward()
# 使用优化器更新模型参数
optimizer.step()
p1、p2是怎么计算出来的?