-
Notifications
You must be signed in to change notification settings - Fork 2
Open
Description
Background
- TMDb API (The Movie Database API) 를 이용한 크롤링
- IMDb 크롤링
TMDb 선택 이유
- IMDb와 다르게 영화만 있는 게 아니라 TV 프로그램 메타데이터도 있음
- 학습 시 사용하는 데이터셋이 포스터 / 이미지가 없는 경우가 있는데 이 또한 포함하고 있음
IMDb 변경 이유
- IMDb에도 TV 프로그램 메타데이터도 있었고
- 제목이 clean하지 않은 경우가 많았는데 IMDb가 더 검색이 잘됐음
To Do (TMDb)
- API Key 발급
- API 호출 테스트 (테스트용 포스터 정보 요청)
- 포스터 이미지 크롤링
- 출연진, 감독 크롤링
To Do (IMDb)
- 크롤링 코드 작성
- 포스터 이미지 / 출연진 / 감독 크롤링
- json으로 저장 (하는 중)
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
enhancementNew feature or requestNew feature or request