- 데이터: 네이버 뉴스 크롤링
- 기간 : 2020.10 ~ 2020.12
- 데이터 셋 확보
- 전처리 관련 코드
- 한국어 전처리 패키지(Py-Hanspell)
- 한국어 품사 태깅(Mecab)
- BERT
(주무관님의 추가 요청)
- 원하는 섹션별로 전문 가져오기

- 경향(블로그 코드설명)
- 중앙(블로그 코드설명)
- Bert.ipynb -> Bert 모델 학습_1
- Bert_3.ipynb -> Bert 모델 학습_2
- BoW,keras_분노.ipynb -> BoW,keras_분노.ipynb -> bag of words에서 상위 n개의 단어로 keras 학습 모델
- glove.ipynb -> glove로 임베딩 후 keras에서 weight 부여
- word2vec으로.ipynb -> word2vec통해 임베딩 후 keras 모델 적용
- word2vec을_통한_단어별_좌표이용.ipynb -> word2vec통해 임베딩 후 머신러닝과 keras 모델 적용
- 저장된_모델을_불러와_테스트.ipynb -> 저장된 Bert 모델을 불러와 TEST
- 과제 책임자
- 김도연
- 김주영
- 박다원
- 피드백
- 김학준(서울특별시 빅데이터담당관 주무관님)