Este projeto visa realizar uma análise detalhada de uma planilha de dados bancários para entender o comportamento de churn (saída de clientes) de um banco. O dataset contém diversas informações relevantes sobre os clientes, como pontos de crédito, estado, gênero, idade, bens, saldo na conta, tipo de produto, posse de cartão, status de atividade, salário e se o cliente saiu ou não do banco.
Exploração e Limpeza de Dados:
- Identificar e tratar valores faltantes e incongruentes.
- Verificar e remover duplicatas.
- Realizar uma análise descritiva das variáveis.
Análise Exploratória de Dados (AED):
- Visualizar a distribuição das variáveis.
- Identificar padrões e relações entre variáveis.
- Detectar e tratar outliers.
Análise de Churn:
- Entender os fatores que contribuem para a saída de clientes.
- Analisar a relação entre variáveis demográficas e comportamentais com o churn.
-
Coleta de informações técnicas acerca do conjunto de dados para tratamento posterior:
-
Limpeza e tratamento dos dados::
-
Análise Descritiva:
- Pandas: Manipulação e análise de dados.
- NumPy: Operações numéricas e cálculo de estatísticas.
- Matplotlib e Seaborn: Visualização de dados.
- Scikit-learn: Tratamento de valores nulos e análise de outliers.
A análise revelou insights importantes sobre os fatores que influenciam o churn de clientes em um banco. Compreender esses fatores pode ajudar o banco a desenvolver estratégias mais eficazes para retenção de clientes, ajustando suas políticas e serviços para melhor atender às necessidades de seus clientes.
- Modelagem Preditiva: Desenvolver modelos preditivos para identificar clientes em risco de churn.
- Análise Detalhada de Outliers: Explorar os casos atípicos para entender melhor suas características.
- Estratégias de Retenção: Propor ações concretas para reduzir a taxa de churn com base nos insights obtidos.
Para mais informações sobre o projeto ou qualquer dúvida, sinta-se à vontade para entrar em contato:
- Email: gabriel.gvss@gmail.com
- LinkedIn: Gabriel Silveira
Agradeço ao programa Trilhas Inova - Ciência de Dados pela oportunidade de desenvolver este projeto e aprimorar minhas habilidades em análise de dados.
Este projeto está licenciado sob a MIT License.