Incendios Forestales México 2015-2023 | Python | Data Science

Descripción: 📄

El presente proyecto muestra el procedimiento para calcular con herramientas de análisis y ciencia de datos, aquellos registros en que las causas de los incendios son desconocidas, convirtiendolo en un procedimiento de clasificación.
De la misma manera, este set de datos será compartido en la plataforma de Kaggle para observar a mas personas conseguir diferentes soluciones al mismo problema.

Enlace: Forest Fire Registry of Mexico

Obtención de datos: 💾

Los datos fueron obtenidos del set de datos abiertos proporcionados por CONAFOR
Fuente Original: CONAFOR, 2024

Configuración del ambiente: 💻

En este proyecto se emplearon los siguientes programas:

Exploración Inicial:

Microsoft Excel

Análisis de datos:

Visual Studio Code
Para empezar, se puede utilizar cualquier entorno de Python, tan sólo asegúrate que sea una versión 3.X, el base para este proyecto es Jupyter Notebook aunque tu puedes usar el Notebook de tu preferencia como: Google Colab, Anaconda, DeepNote, Azure, entre otros.
También necesitarás instalar algunas librerías de Python que son esenciales para este proyecto, como:
- Pandas
- Numpy
- Matplotlib
- Scikit-learn
- Seaborn

Base de datos:

Microsoft SQL Server

Visualización de resultados:

Power BI

Procedimiento: ✔️

Este proyecto de Ciencia de Datos se llevó a cabo en varias etapas diseñadas para garantizar la precisión y la eficacia.

1.- Inspección de Datos:

La primera etapa implicó una inspección exhaustiva de los datos, durante la cual se exploró la estructura y la composición de los datos.

Para este caso en particular debido a que el archivo original es un .CSV, fue utilizado Excel para una primera exploración.

El uso de tablas dinámicas es una excelente herramienta para realizar exploraciones rápidas de datos.

2.- Limpieza de Datos:

Tras la inspección inicial, se realizó una limpieza de datos integral. Este proceso incluyó la normalización de los datos, la sustitución de valores y otros procedimientos necesarios para garantizar la validez de los datos para los análisis posteriores.

Para la limpieza de datos se opto por usar Python con Notebooks de Jupiter, esto debido a que el siguiente paso del análisis de datos es dependiente de este mismo.

3.- Implementación de Machine Learning:

Una vez limpios los datos, se implementaron modelos de Machine Learning para predecir los datos faltantes. Esto permitió la conformación de un conjunto de datos válido y completo para el análisis de datos.

4.- Consolidación de Datos:

Los datos se consolidaron posteriormente en una base de datos relacional. Para los propósitos de este proyecto, se optó por SQL Server debido a su integración sencilla con Power Apps.

5.- Creación de un Tablero de Control:

Finalmente, se creó un tablero de control en Power BI para visualizar los resultados obtenidos a través de este procedimiento.

El Panel de control puede ser encontrando en la siguiente dirección: Incendios Forestales 2015-2023

Conclusiones: 💡

Este proyecto de Ciencia de Datos ha demostrado ser un ejercicio exhaustivo y valioso en el manejo y análisis de datos. A través de una serie de pasos cuidadosamente diseñados, desde la inspección y limpieza de datos hasta la implementación de modelos de Machine Learning y la consolidación de datos, logrando transformar un conjunto de datos crudos en información significativa y utilizable.
La integración exitosa con SQL Server y Power Apps ha permitido una visualización efectiva de los resultados, lo que facilita la interpretación y el uso de los datos. El tablero de control creado proporciona una representación visual intuitiva de los resultados obtenidos.

Desarrollador 😉

Francisco Valam Cortes
_GitHub
_Linkedin
_Twitter

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
data		data
Incendios_forestales.ipynb		Incendios_forestales.ipynb
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Incendios Forestales México 2015-2023 | Python | Data Science

Descripción: 📄

Obtención de datos: 💾

Configuración del ambiente: 💻

Procedimiento: ✔️

1.- Inspección de Datos:

2.- Limpieza de Datos:

3.- Implementación de Machine Learning:

4.- Consolidación de Datos:

5.- Creación de un Tablero de Control:

Conclusiones: 💡

About

Releases

Packages

Languages

Valamca/Fires_Mexico_2015-2023

Folders and files

Latest commit

History

Repository files navigation

Incendios Forestales México 2015-2023 | Python | Data Science

Descripción: 📄

Obtención de datos: 💾

Configuración del ambiente: 💻

Procedimiento: ✔️

1.- Inspección de Datos:

2.- Limpieza de Datos:

3.- Implementación de Machine Learning:

4.- Consolidación de Datos:

5.- Creación de un Tablero de Control:

Conclusiones: 💡

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages