Data Scientist | Data Analyst | Machine Learning Enthusiast
I am a Data Professional passionate about transforming raw data into strategic intelligence. With a degree in Data Science, my focus is on building solutions that solve real-world business problems.
I combine a solid academic foundation in statistical modeling with data manipulation and visualization skills, always striving to create efficient pipelines and reports that drive decision-making.
- Languages & Libraries: Python (Pandas, NumPy, Scikit-Learn, Matplotlib)
- Databases: SQL
- Specialties: Exploratory Data Analysis (EDA), Predictive Modeling, Clustering, Process Optimization.
In this section, I highlight projects that demonstrate my end-to-end capabilities: from data extraction and cleaning to the implementation of Machine Learning models.
A robust analytical framework developed for the diagnosis and monitoring of educational performance, focused on mitigating dropout risks and improving systemic efficiency.
- 💡 The Core Business Value: Transitioning from intuition-based management to evidence-based management. This project doesn't just describe the past; it uses unsupervised clustering and risk modeling to classify units into real operational profiles, allowing for the strategic prioritization of interventions.
- ⚙️ Stack: Python, Scikit-learn, Pandas.
- 🌍 Applications: Institutional management, public policy formulation, and strategic planning.
A collaborative, open-source project aimed at logistics optimization, simulating real-world delivery environments.
- 💡 The Core Business Value: The practical application of a Machine Learning pipeline (using Random Forest Regressor) to solve a classic business problem: time and cost reduction. The model predicts delivery times based on dynamic variables (traffic levels, time of day, stops, and distance), mathematically selecting the most efficient route.
- 🤝 My Contribution: As an advocate for the Open Source ecosystem, this project highlights my collaborative abilities and my skill in building clean, modular ML pipelines (
generate_dataset.py,train_route_model.py,predict_route.py) that are ready for community contribution. - ⚙️ Stack: Python, Scikit-learn (Machine Learning Pipeline), Pandas, Joblib.
I am always open to discussing innovation, open-source Machine Learning projects, and opportunities in the Data Analytics and Data Science fields.
📫 Find me on LinkedIn: Poliana Gouveia | LinkedIn
Data Scientist | Data Analyst | Machine Learning Enthusiast
Sou uma profissional de Dados apaixonada por transformar informações brutas em inteligência estratégica. Graduada em Ciência de Dados, meu foco é construir soluções que resolvam problemas reais de negócios.
Combino uma base acadêmica sólida em modelagem estatística com habilidades em manipulação de dados e visualização, buscando sempre criar pipelines eficientes e relatórios que guiem a tomada de decisão.
- Linguagens & Bibliotecas: Python (Pandas, NumPy, Scikit-Learn, Matplotlib)
- Banco de Dados: SQL
- Especialidades: Análise Exploratória de Dados (EDA), Modelagem Preditiva, Clustering, Otimização de Processos.
Nesta seção, destaco projetos que demonstram minha capacidade de ir de ponta a ponta: da extração e limpeza dos dados até a implementação de modelos de Machine Learning.
Um framework analítico robusto desenvolvido para o diagnóstico e monitoramento do desempenho educacional, focado em mitigar riscos de evasão e melhorar a eficiência sistêmica.
- 💡 O maior valor do projeto: A transição de uma gestão baseada em intuição para uma gestão baseada em evidências. O projeto não apenas descreve o passado, mas utiliza clustering não supervisionado e modelagem de risco para classificar unidades em perfis operacionais reais, permitindo a priorização estratégica de intervenções.
- ⚙️ Stack: Python, Scikit-learn, Pandas.
- 🌍 Aplicações: Gestão institucional, formulação de políticas públicas e planejamento estratégico.
Um projeto colaborativo e de código aberto voltado para a otimização logística, simulando ambientes reais de entrega.
- 💡 O maior valor do projeto: A aplicação prática de um pipeline de Machine Learning (utilizando Random Forest Regressor) para resolver um problema clássico de negócios: redução de custos e tempo. O modelo prevê o tempo de entrega com base em variáveis dinâmicas (nível de trânsito, horários, paradas e distância), selecionando matematicamente a rota mais eficiente.
- 🤝 Minha Contribuição: Como entusiasta do ecossistema Open Source, este projeto evidencia minha capacidade colaborativa e minha habilidade em criar pipelines de ML limpos, modulares (
generate_dataset.py,train_route_model.py,predict_route.py) e prontos para contribuição da comunidade. - ⚙️ Stack: Python, Scikit-learn (Machine Learning Pipeline), Pandas, Joblib.
Estou sempre aberta a discutir inovação, projetos open source envolvendo Machine Learning e oportunidades na área de Análise e Ciência de Dados.
📫 Me encontre no LinkedIn: Poliana Gouveia | LinkedIn