O desafio foi realizado no Jupyter Notebook utilizando bibliotecas do Python para análise de dados.
Trata-se de análises em duas bases de dados mescladas (netflix_titles.csv e amazon_prime_titles.csv).
O intuito foi criar 7 tratativas para filtrar informações relevantes:
1- Top 10 atores/atrizes considerando todos os dados
2- Top 5 países produtores de conteúdos considerando todos os dados e comparando as duas plataformas
3- Mês no qual há mais adições de filmes na plataforma Netflix
4- Quantidade de filmes listados como comédia.
5- Lista de todos os gêneros de filmes.
6- A frequência de "TV Show" de todos os dados e comparativamente em relação as duas plataformas.
7- A frequência de "Movies" de todos os dados e comparativamente em relação as duas plataformas.
Linguagem: Python
Bibliotecas: Pandas, Numpy
Aplicação: Jupyter Notebook
Para instalar e usar o projeto, é necessário:
1 - Baixar e instalar o 'Anaconda': https://www.anaconda.com/
2 - Criar um ambiente dentro do seu computador com um diretório dos arquivos de importação(csv, excel etc) e os arquivos de extensão .ipynb que são os arquivos próprios do Jupyter Notebook.
3 - Pesquise na barra de pesquisa por Jupyter Notebook e execute o arquivo.
4 - Após executar o arquivo do Jupyter Notebook, o mesmo irá abrir em seu navegador. Desta forma, verifique o diretório correto para o arquivo listado como 'Data Challenge 20221121.ipynb' e execute ele.