Este notebook implementa uma análise estatística e visual para dados de ansiedade pré e pós-intervenção. Ele foi desenvolvido para processamento em Google Colab, utilizando uma abordagem que combina visualizações em estilo neon com análises estatísticas robustas para avaliar mudanças nos níveis de ansiedade entre diferentes grupos de participantes.
O notebook oferece as seguintes funcionalidades:
- Processamento e validação de dados de ansiedade
- Geração de resumos estatísticos
- Visualizações especializadas com tema escuro e cores neon:
- Gráficos de densidade (KDE) para níveis de ansiedade
- Gráficos de violino para comparação entre grupos
- Gráficos de dispersão para análise de correlação
- Árvores de decisão para previsão de ansiedade pós-intervenção
O código está organizado em seções funcionais:
- Importações e Configurações: Importa bibliotecas essenciais (pandas, matplotlib, seaborn, scikit-learn) e define constantes para análise.
- Funções de Visualização: Implementa funções especializadas para geração de gráficos com estética neon sobre fundo preto.
- Script Principal: Orquestra o carregamento de dados, processamento e geração de resultados.
OUTPUT_PATH
: Diretório para armazenamento dos resultadosPARTICIPANT_ID_COLUMN
: Coluna para identificação dos participantesGROUP_COLUMN
: Coluna que identifica os grupos de intervençãoANXIETY_PRE_COLUMN
eANXIETY_POST_COLUMN
: Colunas com medidas de ansiedadeBOOTSTRAP_RESAMPLES
: Número de reamostragens para intervalos de confiançaN_CLUSTERS
: Número de clusters para análises de agrupamentoRANDOM_STATE
: Semente para reprodutibilidade
- Análise Descritiva: Resumos estatísticos dos dados de ansiedade
- Visualização de Distribuições: Gráficos KDE para visualizar distribuições pré e pós-intervenção
- Comparação Entre Grupos: Visualizações específicas para comparar resultados entre grupos
- Modelagem Preditiva: Árvore de decisão para identificar fatores que influenciam mudanças na ansiedade
O notebook gera e salva as seguintes visualizações:
kde_plot.png
: Distribuição geral dos níveis de ansiedade pré e pósgrouped_kde_plot.png
: Distribuições separadas por grupo de intervençãoviolin_plot.png
: Comparação da distribuição de ansiedade entre gruposscatter_plot.png
: Correlação entre medidas de ansiedade pré e pós por grupodecision_tree.png
: Modelo de árvore de decisão para previsão de ansiedade pós-intervenção
- Python 3.x
- pandas
- matplotlib
- seaborn
- scikit-learn
- statsmodels
- numpy
- scipy
- Google Colab (para execução original)
- Monte o Google Drive utilizando
drive.mount('/content/drive')
- Configure o diretório de saída em
OUTPUT_PATH
- Execute o notebook para processar os dados e gerar visualizações
- Consulte os resultados no diretório especificado em
OUTPUT_PATH
O notebook inclui dados sintéticos para demonstração, contendo:
- IDs de participantes
- Grupos de intervenção (Grupo A, Grupo B, Controle)
- Medidas de ansiedade pré e pós-intervenção
Para utilizar seus próprios dados, substitua a string synthetic_data
ou modifique o código para carregar dados externos. Certifique-se de que seu conjunto de dados contenha as colunas necessárias conforme definido nas constantes.
Hélio Craveiro Pessoa Júnior