Este repositório contém um notebook Python que implementa uma análise avançada de intervenções para ansiedade utilizando SHAP (SHapley Additive exPlanations) para quantificar a importância de diferentes características na predição dos níveis de ansiedade pós-intervenção.
O notebook adapta uma estrutura de Mixture of Experts (MoE) para integrar valores SHAP, permitindo uma compreensão granular dos fatores que impulsionam o sucesso de intervenções para ansiedade. Este método possibilita identificar quais características (como grupo de tratamento e nível de ansiedade pré-intervenção) contribuem mais significativamente para os resultados observados após a intervenção.
-
Carregamento e Validação de Dados
- Carregamento de dados sintéticos de intervenção para ansiedade
- Validação rigorosa da estrutura, conteúdo e tipos de dados
- Tratamento adequado de possíveis erros durante o processo
-
Cálculo de Valores SHAP
- Computação de valores SHAP para avaliar a importância das características
- Explicações detalhadas e tratamento de erros durante o cálculo
- Visualização dos resultados de valores SHAP
-
Visualização de Dados
- Geração de gráficos KDE (Kernel Density Estimation)
- Criação de gráficos Violin Plot para distribuição por grupos
- Implementação de gráficos de Coordenadas Paralelas
- Desenvolvimento de Hipergrafos para análise de relacionamentos
- Tratamento detalhado de erros de visualização
-
Resumo Estatístico
- Realização de análise bootstrap para robustez estatística
- Geração de estatísticas descritivas
- Validação de resultados estatísticos
-
Relatório de Insights via LLMs
- Síntese de descobertas utilizando múltiplos modelos (Grok, Claude, Grok-Enhanced)
- Ênfase em insights baseados nos valores SHAP
- Validação das saídas dos LLMs e tratamento de erros potenciais
pandas
: Manipulação e processamento de dadosmatplotlib
eseaborn
: Visualização de dadosshap
: Cálculo e visualização de valores SHAPscikit-learn
: Modelagem preditiva (RandomForestRegressor)plotly
: Visualizações interativas avançadasnetworkx
: Criação e visualização de grafos/hipergrafosscipy
: Análises estatísticas (bootstrap)
O notebook inclui uma implementação simplificada de um agente DDQN (Double Deep Q-Network) como demonstração de caso de uso potencial para otimização adaptativa de intervenções.
- Codificação one-hot de variáveis categóricas
- Escalonamento de características numéricas
- Validação extensiva de dados de entrada
- Gráficos SHAP para interpretabilidade do modelo
- Visualizações KDE para distribuições
- Violin plots para comparações entre grupos
- Coordenadas Paralelas para visualização multidimensional
- Hipergrafos para análise de relacionamentos complexos
- Bootstrap para estimativas de intervalos de confiança
- Estatísticas descritivas detalhadas
- Quantificação de efeitos de intervenção
- Execute o notebook em um ambiente Python com as dependências instaladas
- Os resultados serão salvos no diretório especificado em
OUTPUT_PATH
- As visualizações geradas incluem gráficos SHAP, KDE, Violin, Coordenadas Paralelas e Hipergrafos
- Um relatório de insights consolidado será gerado combinando análises de múltiplos modelos LLM
- O notebook inclui tratamento abrangente de erros para robustez
- Cores neon são utilizadas para melhorar a visualização em fundo escuro
- A constante
BOOTSTRAP_RESAMPLES
controla o número de reamostragens para análise estatística - Para ambientes Google Colab, o notebook detecta automaticamente e adapta os caminhos
Hélio Craveiro Pessoa Júnior