Skip to content

DUChae/DataAnalysis_IMDB

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 

Repository files navigation

IMDB 데이터 대시보드 프로젝트: 데이터 기반 콘텐츠 전략 수립

목차

  1. 프로젝트 개요
  2. 목표와 주요 과제
  3. 데이터 분석 및 설계 과정
  4. 주요 인사이트 도출
  5. 성과와 배운 점
  6. 향후 개선 방향
  7. 결론: 영화 산업의 데이터 중심 전략 도구

imdb


프로젝트 개요

본 프로젝트는 세계 최대 영화 및 TV 콘텐츠 데이터베이스인 IMDB 데이터를 바탕으로 영화 산업의 핵심 트렌드와 성공 요인을 시각화하고 분석하여 데이터 기반의 전략적 의사결정 도구를 개발하는 데 목적을 두었습니다.

이를 통해 제작사, 스트리밍 플랫폼, 투자자가 시장 이해를 심화하고, 효율적인 콘텐츠 전략을 수립할 수 있는 기반을 제공하고자 했습니다.


목표와 주요 과제

  1. 영화 및 TV 콘텐츠 트렌드 분석

    • 연도별 콘텐츠 제작량, 장르별 선호도, 성공적인 콘텐츠의 특성을 파악하여 데이터로 뒷받침된 시장 동향을 이해.
  2. 데이터 시각화와 통찰 제공

    • 주요 지표(평점, 투표 수, 장르, 연도 등) 간의 관계를 명확히 시각화하여 사용자가 직관적으로 데이터를 해석할 수 있도록 지원.
  3. 사용자 중심 대시보드 설계

    • 필터링 및 상호작용이 가능한 대시보드 설계를 통해, 다양한 사용자(경영진, 마케팅 팀, 제작자)의 목적에 맞는 데이터 탐색을 가능하게 함.

데이터 분석 및 설계 과정

  1. 데이터 준비 및 정제

    • 데이터셋: IMDB 데이터에서 평균 평점(Average Rating), 투표 수(Num Votes), 장르(Genres), 제작 연도(Release Year) 등의 필드를 선별.
    • 데이터 정제: 중복 데이터 제거, Null 값 처리, 데이터 클렌징 과정을 통해 분석 신뢰도를 높임.
  2. 대시보드 구성 및 설계

    • 상단 KPI 영역:
      • 총 영화 수, 평균 평점, 총 투표 수 등 산업 전반의 상태를 요약적으로 시각화.
    • 다양한 차트 구성:
      • 막대 그래프: 상위 10개 영화의 투표 수 및 장르별 평균 평점 비교.
      • 박스 플롯: 장르별 평균 평점 분포를 상세히 표현하여, 장르 간 성과 차이를 명확히 드러냄.
      • 라인 차트: 연도별 영화 제작 수 및 평균 평점 변화 추이를 분석해, 영화 산업 성장과 관객 반응의 상관관계를 도출.
      • 산점도: 투표 수와 평점 간 상관관계를 통해 성공적인 콘텐츠의 특징을 확인.
      • 워드 클라우드: 장르별 콘텐츠 비율을 직관적으로 표현하여 주요 장르의 비중 및 시장 지배력을 한눈에 파악.
  3. 사용자 경험 설계

    • 필터링 기능 강화:
      • 제목(Title), 장르(Genre), 연도(Year) 필터를 제공해 사용자가 특정 데이터를 빠르게 탐색 가능하도록 설계.
      • 드롭다운 형식의 필터 UI를 도입하여, 복잡한 대시보드의 가독성을 높임.
    • 일관성 있는 테마 적용:
      • 어두운 테마와 조화로운 색상 배치를 통해 데이터 탐색 시 시각적 피로를 최소화하고, 중요한 정보를 강조.
  4. 데이터 분석 모델링

    • 상관 분석: 평점과 투표 수 간의 상관관계를 통해 관객의 참여도와 콘텐츠 품질 간의 연관성을 수치화.
    • 추세 분석: 특정 시점에서의 콘텐츠 증가율 및 장르별 변화를 통해 OTT 플랫폼 등 외부 요인의 영향을 도출.

주요 인사이트 도출

  1. 장르별 콘텐츠 성공 요인

    • Documentary(다큐멘터리) 장르가 평균 평점 7.259로 가장 높은 관객 만족도를 기록.
      → 실질적 정보 전달과 정서적 연결이 관객에게 강하게 어필했음을 시사.
    • Horror(공포) 장르는 평균 평점 4.877로 가장 낮아, 관객 기대치와 제작 품질 간의 괴리를 보여줌.
      → 공포 장르에서의 품질 관리 강화 및 타깃 관객 맞춤형 마케팅 필요.
  2. 연도별 영화 산업 성장

    • 1970년대 이후 영화 제작 수가 급격히 증가했으며, 2010년대 OTT 플랫폼 확산과 함께 정점을 기록.
      → 디지털 기술의 발전과 관객의 콘텐츠 소비 방식 변화에 따른 결과로, 스트리밍 중심의 콘텐츠 제작 전략 강화 필요.
  3. 평점과 투표 수의 상관관계

    • 평점 8.0 이상 작품은 투표 수가 높은 경향을 보여, 콘텐츠 품질이 관객 참여와 인지도로 이어짐.
      → 초기 마케팅 단계에서 긍정적 리뷰 관리와 평점 기반 프로모션 전략의 중요성을 강조.
  4. 평점과 제작량의 변화

    • 제작량이 급증한 2010년대에는 평균 평점이 다소 하락, 이는 과잉 제작과 콘텐츠 품질 저하의 위험성을 반영.
      → 제작사와 플랫폼은 콘텐츠 수보다 품질에 중점을 둔 전략적 투자 필요.

성과와 배운 점

  1. 데이터 분석 역량

    • 대규모 데이터셋에서 의미 있는 지표를 추출하고, 이를 시각화하여 전략적 통찰을 제공할 수 있는 분석 역량을 심화.
  2. 사용자 친화적 대시보드 설계

    • 사용자 요구를 반영한 필터 및 상호작용 설계로, 다양한 이해관계자가 데이터에 접근하고 활용할 수 있는 환경 조성.
  3. Tableau 활용 능력 심화

    • 고급 시각화 기능(박스 플롯, 동적 필터 등)을 활용하며, 데이터와 비즈니스 목표를 효과적으로 연결하는 법을 학습.

향후 개선 방향

  1. 실시간 데이터 통합

    • API를 연동해 IMDB의 최신 데이터로 자동 업데이트되는 대시보드로 발전.
  2. 심화 데이터 분석 추가

    • 감독, 배우별 성공 지표, 예산 대비 수익 분석을 통해 대시보드의 활용성을 확장.
  3. 사용자 개인화 강화

    • 맞춤형 필터 및 보고서 생성 기능을 추가하여 각 사용자별 목표에 부합하는 분석 환경 제공.

결론: 영화 산업의 데이터 중심 전략 도구

이 프로젝트는 IMDB 데이터를 활용해 영화 및 TV 콘텐츠 산업의 트렌드와 성공 요인을 데이터 기반으로 시각화한 사례입니다.

대시보드는 단순히 데이터를 시각적으로 표현하는 것을 넘어, 콘텐츠 제작사, 스트리밍 플랫폼, 투자자가 전략적 결정을 내릴 수 있는 강력한 도구로 설계되었습니다.

본 프로젝트를 통해 데이터 분석 및 시각화 역량을 한층 심화하였으며, 데이터를 통해 비즈니스적 가치를 창출하는 방법론을 실질적으로 구현할 수 있었습니다.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages