텍스트 분포를 이용한 텍스트의 벡터화 방법들(BoW, DTM, TF-IDF, LSA, LDA)을 실습을 통해 익혀보고, 텍스트 분포 기반으로 구현된 토큰화 기법에 대해서도 살펴본다.
- | 목차 | ⏲ 270분 |
---|---|---|
3-1 | 들어가며 | 5분 |
3-2 | 단어 빈도를 이용한 벡터화 (1) Bag of Words | 10분 |
3-3 | 단어 빈도를 이용한 벡터화 (2) Bag of Words 구현해보기 | 10분 |
3-4 | 단어 빈도를 이용한 벡터화 (3) DTM과 코사인 유사도 | 20분 |
3-5 | 단어 빈도를 이용한 벡터화 (4) DTM의 구현과 한계점 | 10분 |
3-6 | 단어 빈도를 이용한 벡터화 (5) TF-IDF | 25분 |
3-7 | 단어 빈도를 이용한 벡터화 (6) TF-IDF 구현하기 | 20분 |
3-8 | LSA와 LDA (1) LSA | 20분 |
3-9 | LSA와 LDA (2) LSA 실습 | 30분 |
3-10 | LSA와 LDA (3) LDA | 40분 |
3-11 | LSA와 LDA (4) LDA 실습 | 30분 |
3-12 | 텍스트 분포를 이용한 비지도 학습 토크나이저 (1) 형태소 분석기와 단어 미등록 문제 | 20분 |
3-13 | 텍스트 분포를 이용한 비지도 학습 토크나이저 (2) soynlp | 30분 |
- 단어 빈도를 이용한 벡터화
- (1) Bag of Words
- (2) Bag of Words 구현해보기
- (3) DTM과 코사인 유사도
- (4) DTM의 구현과 한계점
- (5) TF-IDF
- (6) TF-IDF 구현하기
- LSA와 LDA
- (1) LSA
- (2) LSA 실습
- (3) LDA
- (4) LDA 실습
- 텍스트 분포를 이용한 비지도 학습 토크나이저
- (1) 형태소 분석기와 단어 미등록 문제
- (2) soynlp