Skip to content

Jacob-9909/Naver_crawling

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 

Repository files navigation

Naver News Scraper and Analysis

본 프로젝트는 네이버 뉴스의 데이터를 크롤링하고, 이를 분석하는 작업을 포함하고 있습니다. 텍스트 데이터의 전처리, TF-IDF 분석, 워드클라우드 시각화 등의 작업을 통해 데이터 분석을 수행합니다.

프로젝트 개요

  1. 네이버 뉴스 크롤링: Python을 사용하여 네이버 뉴스 데이터를 크롤링하고 수집합니다.
  2. 데이터 전처리: 수집된 데이터를 정리 및 전처리합니다.
  3. 텍스트 분석: TF-IDF와 같은 기법을 사용하여 텍스트 데이터를 분석합니다.
  4. 시각화: 워드클라우드를 사용하여 주요 키워드를 시각화합니다.

사용된 기술

  • Python
  • BeautifulSoup: HTML 파싱 및 크롤링
  • Pandas: 데이터 처리
  • Scikit-learn: TF-IDF 분석
  • WordCloud: 텍스트 시각화

설치 및 사용 방법

  1. 필수 패키지 설치:
    pip install -r requirements.txt

About

naver_news_crawling

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published