본 프로젝트는 네이버 뉴스의 데이터를 크롤링하고, 이를 분석하는 작업을 포함하고 있습니다. 텍스트 데이터의 전처리, TF-IDF 분석, 워드클라우드 시각화 등의 작업을 통해 데이터 분석을 수행합니다.
- 네이버 뉴스 크롤링: Python을 사용하여 네이버 뉴스 데이터를 크롤링하고 수집합니다.
- 데이터 전처리: 수집된 데이터를 정리 및 전처리합니다.
- 텍스트 분석: TF-IDF와 같은 기법을 사용하여 텍스트 데이터를 분석합니다.
- 시각화: 워드클라우드를 사용하여 주요 키워드를 시각화합니다.
- Python
- BeautifulSoup: HTML 파싱 및 크롤링
- Pandas: 데이터 처리
- Scikit-learn: TF-IDF 분석
- WordCloud: 텍스트 시각화
- 필수 패키지 설치:
pip install -r requirements.txt