Este projeto apresenta uma análise exploratória dos dados do MovieLens usando o dataset recomendado para educação e desenvolvimento, o qual possui 100 mil avaliações de 9 mil filmes, feitas por 600 usuários.
O objetivo era explorar a distribuição das notas de cada filme usando tabelas de frequência, medidas de tendência central — moda, média e mediana — e visualizações com histogramas e box-plots.
Além disso, fiz uma análise exploratória dos dados do TMDB 5000 a fim de comparar as quantidades de filmes produzidos em uma determinada língua. Essas comparações foram feitas através da construção de tabelas de frequência e gráficos de barras.
Por fim, fiz uma análise da distribuição das notas dos cinco primeiros filmes do dataset para descobrir quais os mais amados e os mais odiados.
Este relatório foi construído com base no conteúdo do curso Data Science: analise e visualização de dados da Escola de Data Science da Alura.
Fiz algumas modificações com a finalidade de enriquecer não somente os relatórios, mas também meu aprendizado.
Navegue para a pasta em que deseja clonar este projeto. Em seguida, digite o comando a seguir:
git clone https://github.com/diego-torres-coder/Analise-Exploratoria-de-Dados-com-o-TMDB-5000.git
Navegue para a pasta recém-criada:
cd Analise-Exploratoria-de-Dados-com-o-TMDB-5000/
Crie um ambiente conda para o projeto:
conda create -n tmdb python=3.11
Ative o ambiente virtual com o seguinte comando:
conda activate tmdb
Instale as dependências do projeto:
conda install numpy openpyxl pandas matplotlib seaborn jupyterlab
Execute o Jupyter Lab:
jupyter-lab
Por fim, execute todas as células do notebook.