Skip to content

Una plataforma de streaming para el hogar, con presencia en todo el mundo, necesita impulsar su rendimiento utilizando datos de tendencias en el sector de manera estratégica.

License

Notifications You must be signed in to change notification settings

luceldasilva/Movie_Analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

18 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Movie Analysis

Note

Este es un proyecto que pretende, en base a un análisis de los datos oficiales de peliculas y series, generar insight de negocio para una empresa de stremaming que busca entrar al mercado.

Problema del negocio

Una plataforma de streaming para el hogar, con presencia en todo el mundo, necesita impulsar su rendimiento utilizando datos de tendencias en el sector de manera estratégica.

Tecnologías Usadas

Python Pandas NumPy Matplotlib

Objetivos

  1. ¿Cual es la evolución del rating por tipo de contenido?

  2. ¿Cual es el rating promedio por género?

  3. ¿Cuáles son los géneros que proporcionan mayor ROI?

  4. ¿Cuáles son los países con mayor producción de contenido?

  5. Series de TV más vistos

  6. Sugerencia de películas a traer al catálogo

Análisis Exploratorio de los Datos(EDA)

Tiempo de duración en Minutos

Tiempo de duración en Minutos

Encontramos valores atípiocos/extremos con cantidad de miles de minutos, por eso observamos una gráfica donde la mayor concentración de datos esta en 0 en teoría, lo que pasa es que tenemos valores extremos tan grandes que parece que esto, pero la realidad es que las peliculas suelen tener duración de entre 1 hora(60 min) a 2 horas(120min) normalmente, algunas otras suelen durar entre las 2 y 3 horas, pero estas son un poco más excepcionales, es decir si establecemos como un maximo(180min) en cuanto a minimo 15min, ya que hay series que sus capitulos rondan los 15-20min de duración, vemos como mejora el boxplot en gran medida, donde ya no observamos datos atípicos.

Estrenos porcentaje de estrenos por año/Cantidad de estrenos por año

Tiempo de duración en Minutos

Podemos observar que la mayoría de las películas y series han sido producidas y estrenadas en el siglo 21, en estos ultimos 20 años se han lanzado aproximadamente unos 300mil titulos lo que representa un 62% de nuestros datos, dividos la primera decada de los 2000 con un 33% de estos lanzamientos y en la segunda epoca, en este caso incluyendo los ultimos 4 años un 29% de lanzamientos, parece que con el paso de tiemp disminuyo un poco la cantidad de producciones realizadas, como la compañia es de streaming y los tiempos van cambiando constantemente, limitaremos el análisis de las producciones entre el año 1990 hasta el presente año 2024, el resto no las consideraremos porque aunque fueron de gran impacto en su epoca, hoy en día pueden que no tengan el mismo impacto debido a los grandes cambios culturales que hemos tenido en estas dos ultimas decadas.

Distribución del promedio del ranking/Boxplot Cantidad de votos

Tiempo de duración en Minutos

Encontramos que la mayoría de las Producciones tienen un ranking de entre 6 y 8 aproximadamente, aquí se concentran aproximadamente la mayoría de los datos en el histograma. Observamos que es difícil ver producciones con ratings de 1, 2, 3 y e incluso 4, pero las hay.

Insights

Pregunta 1: ¿Cuál es la evolución del rating por tipo de contenido?

EVOLUCIÓN RATING

El análisis del contenido indica que históricamente el público consume más películas que series de TV.

El público prefiere más las series deTV con un rating superior a los 7 puntos hasta los 7.4. En cuanto a las películas tuvo una subida desde el 2020 hasta el 2023 a un promedio de 6,4.

Desde el 1990 se han producido muchas más películas que series de TV.

RECOMENDACIONES

Recomendamos invertir en contenido con un rating promedio de 6 en adelante en películas y en series desde 6.8 en adelante, por ultimo se recomienda que la proporción sea 80% películas y 20% series.

Pregunta 2: ¿Cual es el rating promedio por género?

RATING PROMEDIO POR GENERO

El análisis de los géneros nos indica que el público prefiere contenidos relacionados a Documentales, Guerra, Talks Show, Romance y Acción.

Sin embargo, son contenidos con pocas producciones, por tanto, no es un nicho explorado y explotado.

RECOMENDACIONES

Recomendamos invertir en estos contenidos, pero teniendo en cuenta ciertos parámetros como el rating, en el caso por ejemplo del Talks Show, esto es un tipo de tvserie, es recomendable invertir como se vio anteriormente en aquellas con ranking superiores a los 6.8, por supuesto esto no será el límite, también recomendamos invertir en las demás categorías sólo que la inversión tiene que ser menor y más selectiva.

Pregunta 3: ¿Cuáles son los géneros que proporcionan mayor ROI?

ROI POR GENERO

El análisis del ROI nos indica que los géneros relacionados con Aventuras, Ciencia Ficción, Acción y Fantasía son los que generan mayor Roi.

Seguidos de cerca por los géneros de Misterio, Animación y Romance.

RECOMENDACIONES

Invertir en las producciones de estas categorías que generaron más dividendos, las que fueron más vistas por el público y que tenga un rating superior a 6.4, teniendo en cuenta que como observamos, aunque estás generan más ROI no son las que más se buscan cuando tenemos en consideración el insight anterior.

Pregunta 4: ¿Cuáles son los países con mayor producción de contenido?

PAÍSES QUE MÁS PRODUCEN

El país con la mayor producción de contenidos es USA y el Reino unido sin embargo observamos que su ROI suele rondar entre 0.8 y 1 mientras que países como China, Japón y la India, producen mucho menos contenido y generan mayores ganancias con respecto al presupuesto invertido.

RECOMENDACIONES

Como sugerencia al negocio proponemos seguir adquiriendo y sumando a la plataforma series y películas de países como USA y UK en mayor medida, pero dejando un espacio para traer contenido de China, India y Japón realizando primero un estudio del contenido a traer, basados en los géneros y tomar una muestra de individuos primero, que hagan una evaluación del contenido para ver si es de calidad para el consumidor de la plataforma.

Pregunta 5: ¿Cuáles son las series más votadas desde el año 2000?

Series mejor rating

Estas son las top 10 series más votadas en esta últimas dos décadas, esto nos indica que obtuvo una gran cantidad de espectadores.

RECOMENDACIONES

Evaluar en la medida de lo posible la factibilidad de incluir estas series a nuestra plataforma, teniendo en consideración que muchas de estas pueden ser exclusivas de sus compañías para su distribución o pueden tener un alto costo los derechos para poder distribuirla.

Pregunta 6: ¿Cuáles han sido las series y temporadas con mejor rating desde el año 2000?

Series mejor rating

Observamos un top 10 de las series y temporadas de series(en el caso de algunas) y podemos ver que tiene conherencia con la cantidad de votos que han recibido algunas series estas ultimas 2 decadas

RECOMENDACIONES

Como se menciono anteriormente se recomienda buscar la forma de integrar estas series a la plataforma con el fin de incentivar a los futuros clientes a suscribirse con nosotros.

Conclusiones y sugerencias

A raíz de los objetivos planteados, hicimos con la hipótesis de determinar si ciertos actores, que aportan mayor ROI , o mayor cantidad de contenidos a su vez son los que tienen mayor cantidad de votos por la audiencia. y/o viceversa. Por ello presentamos unas sugerencias de películas que son prácticamente nuevas y no están en el catálogo de la plataforma de streaming con la que trabajamos filtrandos por los tres géneros más destacados Aventuras, Ciencia Ficción y Acción. Lo presentamos en una carpeta llamada output que tiene esta estructura.

  ├── output
      	├── actors_common_title_basics.csv
      	├── genre_actors_tmdb_df.csv
      	├── title_basics_"genre"_actors.csv      <- "genre" es el género de la lista
        ├── tmdb_"genre"_actors.csv              <- "genre" es el género de la lista
        └── tmdb_movies_genre_common.csv

Important

En este proyecto participamos Lucel, Mario y Mirna como miembros del Bootcamp Xperience del canal.

About

Una plataforma de streaming para el hogar, con presencia en todo el mundo, necesita impulsar su rendimiento utilizando datos de tendencias en el sector de manera estratégica.

Resources

License

Stars

Watchers

Forks

Contributors 3

  •  
  •  
  •