Skip to content

ChaeyeonHan/IPS_crawling

Repository files navigation

IPS_crawling

  1. 주요 정당들의 정보를 모아 한눈에 비교하며 볼 수 있는 웹사이트
  2. 주요 정당들인 더불어민주당/국민의 힘/국민의 당/정의당 총 4개의 정당 게시판에서 키워드에 따라 분류된 정보를 나열하고, 네이버 뉴스에서 핵심 키워드에 관해 검색했을 때 나오는 뉴스 기사를 크롤링해서 가져왔음.
  3. html, css, js를 이용하였으며, 제이쿼리 라이브러리를 이용하여 동적으로 웹사이트 제작
  4. python을 이용해 웹크롤링을 하였으며 원하는 정보를 가져오기 위해 beautifulsoup과 selenium을 사용하였음.
  5. flask를 이용해 웹사이트에 크롤링한 정보를 나타내 주었음.

웹사이트 구조

-> 메인페이지는 정당별페이지와 안건별페이지로 나눠져 있음.

  1. 정당별 페이지는 정당별로 크게 정책pdf, 논평브리핑, 보도자료, 기타 총 4가지 항목으로 나누어 정보를 나타냄. (pdf리더기 사용)
  2. 안건별 페이지는 네이버 뉴스 사이트에 '정당+안건'의 키워드로 검색하였을 때 맨 첫 페이지에서 기사를 10개씩 가져와 뉴스헤드라인 제목과 링크를 가져왔음. => 한 페이지에서 안건별로 정당별 정책 비교가 가능하고, 관심있는 기사 제목 클릭시 뉴스 기사 원문으로 이동 가능.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published