Skip to content

Latest commit

 

History

History
43 lines (36 loc) · 1.6 KB

README.md

File metadata and controls

43 lines (36 loc) · 1.6 KB

3. 텍스트의 분포로 벡터화 하기

텍스트 분포를 이용한 텍스트의 벡터화 방법들(BoW, DTM, TF-IDF, LSA, LDA)을 실습을 통해 익혀보고, 텍스트 분포 기반으로 구현된 토큰화 기법에 대해서도 살펴본다.


- 목차 ⏲ 270분
3-1 들어가며 5분
3-2 단어 빈도를 이용한 벡터화 (1) Bag of Words 10분
3-3 단어 빈도를 이용한 벡터화 (2) Bag of Words 구현해보기 10분
3-4 단어 빈도를 이용한 벡터화 (3) DTM과 코사인 유사도 20분
3-5 단어 빈도를 이용한 벡터화 (4) DTM의 구현과 한계점 10분
3-6 단어 빈도를 이용한 벡터화 (5) TF-IDF 25분
3-7 단어 빈도를 이용한 벡터화 (6) TF-IDF 구현하기 20분
3-8 LSA와 LDA (1) LSA 20분
3-9 LSA와 LDA (2) LSA 실습 30분
3-10 LSA와 LDA (3) LDA 40분
3-11 LSA와 LDA (4) LDA 실습 30분
3-12 텍스트 분포를 이용한 비지도 학습 토크나이저 (1) 형태소 분석기와 단어 미등록 문제 20분
3-13 텍스트 분포를 이용한 비지도 학습 토크나이저 (2) soynlp 30분

목차

  1. 단어 빈도를 이용한 벡터화
    • (1) Bag of Words
    • (2) Bag of Words 구현해보기
    • (3) DTM과 코사인 유사도
    • (4) DTM의 구현과 한계점
    • (5) TF-IDF
    • (6) TF-IDF 구현하기
  2. LSA와 LDA
    • (1) LSA
    • (2) LSA 실습
    • (3) LDA
    • (4) LDA 실습
  3. 텍스트 분포를 이용한 비지도 학습 토크나이저
    • (1) 형태소 분석기와 단어 미등록 문제
    • (2) soynlp