- Linguagens: Python, SQL, R, JavaScript, Ruby, TypeScript.
- Engenharia de Dados & Cloud: Pipelines ETL/ELT, orquestração de workflows, AWS (S3, Glue, DMS, RDS, Redshift, Athena, Lambda, Batch, CloudWatch, SNS), dbt, Airflow (MWAA), Mage.ai, Docker, Terraform, Kafka, Spark.
- Bancos de Dados: PostgreSQL, MySQL, MongoDB, Neo4j, Redis.
- Machine Learning & AI: Machine Learning, Deep Learning, NLP, LLMs, RAG, GenAI, Pinecone, TensorFlow, scikit-learn, PyTorch, XGBoost, MLflow, CI/CD para ML.
- Visualização & Dashboards: Plotly, Dash, Metabase, Grafana, Tableau.
- Qualidade & Testes: QA de software, testes Front-end e Back-end, Postman, Cypress, RSpec, Robot Framework, Pytest, New Relic.
- Ferramentas & Outras Skills: Git/GitHub, Anaconda, Pandas, NumPy, Prefect, GraphQL, metodologias ágeis (Scrum, Kanban), documentação técnica.
Neste GitHub, apresento projetos que envolvem Engenharia de Dados, Ciência de Dados, MLOps e GenAI. Eles incluem desde pipelines completos de dados, aplicações de machine learning e soluções de governança e automação em nuvem, até análises avançadas aplicadas às áreas de saúde, finanças e ciência.
Data Engineering & Pipelines
- ifood-data-governance-pipeline – Solução de Data Governance com foco em LGPD, qualidade e rastreabilidade (Airflow, dbt, Streamlit, Redis).
- youtube-2025-data-pipeline – Pipeline para métricas do YouTube 2025 (AWS S3, PostgreSQL, Airflow, dbt, Metabase).
- spotify-data-pipeline – Solução de ponta a ponta com API do Spotify, PostgreSQL, dbt e Metabase.
- cnpj-data-pipeline – ETL para processamento de dados públicos da Receita Federal.
- dock-financial-data-pipelines – Automação de relatórios Dock com Airflow, SFTP, S3 e Lambda.
- redshift-to-s3-unload-dag – DAG para exportação diária de dados do Redshift para S3 em Parquet.
- datamart-tables-data-type-validation – Validação de tipos de dados em tabelas de DataMart (PostgreSQL, Mage.ai).
MLOps & Machine Learning
- credit-decision-LLM-RAG-platform – Plataforma enterprise de decisões de crédito com LLMs + RAG.
- mlops-zoomcamp-project-paris-price-house – Predição de preços de imóveis em Paris com Flask, Docker e Grafana.
- vercel-app-mlops-zoomcamp-project-paris-price-house – Aplicação Vercel para housing price prediction.
- stocks-analytics-2025 – Pipeline de análise de ações e extração de dados financeiros, análise de séries temporais e automação de trades.
- transaction_fraud_prevention_pipeline – Sistema de prevenção de fraudes financeiras com ML, TensorFlow e dashboards.
- mlops-zoomcamp – Curso prático de MLOps (MLflow, Mage, Flask, Grafana, Terraform).
- machine-learning-zoomcamp – Curso avançado de ML com TensorFlow, XGBoost, Docker, AWS, Kubernetes.
- llm-zoomcamp – Curso prático sobre LLMs, RAG, OpenAI API, Elasticsearch, HuggingFace.
- biophenotype-rag – Aplicação RAG para responder questões sobre fenótipos com dados biológicos/genômicos.
Saúde & Genômica
- cliniccare-medical-clinic-management-system – Sistema de gestão para clínicas (agendamento, prontuários, relatórios).
- analise-de-fenotipos-com-R – Análises fenotípicas em R (Shiny, Plotly, Random Forest).
- rna_seq_dac_project – Análise de expressão gênica diferencial em pacientes com DAC via RNA-Seq.
- genotrack-genomic-phenotypic-data-validation-system – Sistema de validação e visualização de dados genômicos.
- health-tracker – Aplicação de monitoramento de indicadores de saúde e histórico gráfico.
- acmr-rag-rename-mbausp – TCC MBA USP Especialização em Ciência de Dados: ACMR – IA de Consulta de Medicamentos da RENAME.
Automação & Infraestrutura
- AWS-DMS-task-restart-and-status-checker – Script para reinício e monitoramento de tarefas AWS DMS.
- DMS-CDC-task-status-validator – Monitoramento e validação de integridade em tasks CDC no AWS DMS.
- DMS-missing-or-duplicate-data-validation-script – Validação de dados ausentes ou duplicados em replicações AWS DMS.
- S3-folder-cleanup – Automação de limpeza de buckets S3 com Boto3 e Mage.ai.
- airflow-tableau-ec2-maintenance – DAG para manutenção automatizada de servidor Tableau em EC2.
- data-engineering-zoomcamp – Curso prático de Engenharia de Dados (BigQuery, Kafka, Spark, Terraform).
- healthAPI-quality-assurance-framework – Framework de QA para APIs de saúde com Grafana, SonarQube, automação de testes.