Skip to content
This repository has been archived by the owner on Jun 17, 2024. It is now read-only.

Commit

Permalink
feat: update 24/04/02 note
Browse files Browse the repository at this point in the history
  • Loading branch information
real-jiakai committed Apr 2, 2024
1 parent a1692bf commit 1dcd35c
Show file tree
Hide file tree
Showing 3 changed files with 79 additions and 1 deletion.
40 changes: 40 additions & 0 deletions docs/240326.md
Original file line number Diff line number Diff line change
Expand Up @@ -32,4 +32,44 @@

- pos

各名词解释:

```
- TDGAT (Target-dependent Graph Attention Network, 目标依赖图注意力网络)
TDGAT 是一种利用图注意力机制来处理与特定目标相关的数据的神经网络结构。它通过构建一个图,其中节点代表数据中的元素,而边则根据元素之间的关系或相互作用来建立。TDGAT 特别关注于分析和理解与指定目标相关的复杂结构和关系。
- GloVe (Global Vectors for Word Representation, 全局词向量表示)
GloVe 是一种用于词嵌入的无监督学习算法,旨在将单词映射到一个空间中,其中语义相似的单词在该空间中的距离也相近。它通过共现矩阵和矩阵分解技术捕捉单词间的全局统计信息。
- BERT (Bidirectional Encoder Representations from Transformers, 双向编码器表示转换器)
BERT 是一种预训练的深度学习模型,用于自然语言处理任务。它基于Transformer架构,通过预训练在大量文本数据上学习单词之间的关系,然后可以被微调应用于各种NLP任务中,如文本分类、问答系统等。
- 词嵌入 (Word Embedding)
词嵌入是NLP中的一种技术,它将词汇映射为实数向量。这些向量能够捕捉到单词之间的语义关系,比如相似性和共现关系,使得机器可以处理文本数据。
- NL (Natural Language, 自然语言)
自然语言是人类交流的语言,包括口语和书面语。在计算机科学中,自然语言处理(NLP)是研究如何使计算机能够理解、解析和模拟人类语言的领域。
- PL (Programming Language, 编程语言)
编程语言是用于与计算机交流,创建程序以执行特定任务的形式化语言。它们包括高级语言如Python、Java等,以及低级语言如汇编语言。
- ML (Machine Learning, 机器学习)
机器学习是人工智能的一个分支,它使计算机能够通过经验自我改进和学习,而无需明确编程。机器学习模型能够从数据中学习模式并作出预测。
- QA (Question Answering, 问答系统)
问答系统是一种人工智能系统,旨在理解自然语言中的问题并提供回答。这些系统通常依赖于大量的数据和先进的NLP技术来理解问题的上下文和意图。
- QC (Quality Control, 质量控制)
质量控制是确保产品或服务满足一定标准和质量要求的过程。在软件开发中,它可以指代码审核、测试等确保软件质量的活动。
- LSTM (Long Short-Term Memory, 长短期记忆)
LSTM 是一种特殊的循环神经网络(RNN),能够学习长期依赖信息。它通过使用门控机制(包括输入门、遗忘门和输出门)来避免传统RNN的梯度消失问题。LSTM常用于序列数据处理,如时间序列分析、语言模型等。
- GRU (Gated Recurrent Unit, 门控循环单元)
GRU 是LSTM的一个变种,同样是为了解决传统RNN梯度消失问题。它通过较为简化的门控机制来控制信息的流动,既减少了计算量,也保持了长期依赖信息的学习能力。
- POS (Part Of Speech, 词性标注)
词性标注是自然语言处理中的一项任务,目的是为文本中的每个单词分配一个词性,如名词、动词、形容词等。这是理解句子结构和含义的重要步骤。
```

5、java gui 斯坦福句法分析器:https://nlp.stanford.edu/software/lex-parser.shtml
37 changes: 37 additions & 0 deletions docs/240402.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,37 @@
## 语义分析与篇章分析

1、课后要求:

- 尽快完成自然语言处理作业。【不要调库,语法树是啥样】

- 重视小论文,5月初要交初稿

- 之后的课堂讲解,要带上论文原文

2、课堂关键词

- msc

- word2vec

- cbow

- bio、命名实体识别

名词解释:


```
- MSC (Master of Science, 理学硕士)
理学硕士是一种研究生学位,授予完成了科学或技术领域深入学习和研究的学生。在某些领域,它也可能与工程或其他专业相关联。
- Word2Vec
Word2Vec 是一种用于学习词嵌入的计算模型,旨在将单词转换为向量形式,使得这些向量能够捕捉单词之间的语义和语法关系。Word2Vec 模型通过训练神经网络学习单词的表示,有两种主要的训练架构:CBOW(Continuous Bag of Words)和Skip-gram。
- CBOW (Continuous Bag of Words, 连续词袋模型)
CBOW 是Word2Vec的一种训练模式,它预测当前单词基于其上下文。具体来说,模型试图根据上下文中的单词来预测目标单词,这有助于捕捉单词之间的关系和上下文信息。
- Bio/Named Entity Recognition (生物命名实体识别/命名实体识别)
命名实体识别(NER)是自然语言处理中的一个任务,旨在从文本中识别具有特定意义的实体,如人名、地名、机构名等。在生物医药领域,命名实体识别可能特别指向生物实体的识别,如基因、蛋白质等的名称。
```
3 changes: 2 additions & 1 deletion mkdocs.yml
Original file line number Diff line number Diff line change
Expand Up @@ -3,4 +3,5 @@ site_url: https://nlp.gujiakai.top/
nav:
- 绪论: index.md
- 词汇分析与句法分析: 240319.md
- 路路师姐分享: 240326.md
- 路路师姐分享: 240326.md
- 语义分析与篇章分析: 240402.md

0 comments on commit 1dcd35c

Please sign in to comment.