El objetivo principal de este proyecto es realizar web scraping de páginas web seleccionadas para extraer datos relevantes, los cuales serán almacenados en una base de datos relacional SQLite. Se implementará un enfoque de análisis de HTML utilizando la biblioteca Beautiful Soup, y las solicitudes HTTP serán manejadas mediante la librería Requests en Python. Este proyecto permitirá la recopilación sistemática de datos de múltiples fuentes en línea para su posterior análisis y uso.
- Extracción de datos de páginas web utilizando web scraping.
- Almacenamiento de los datos extraídos en una base de datos SQLite.
- Implementación de análisis de HTML con Beautiful Soup.
- Manejo de solicitudes HTTP con la librería Requests.
- Beautiful Soup: Para analizar el contenido HTML de las páginas web y extraer los datos deseados.
- Requests: Para realizar solicitudes HTTP y obtener el contenido HTML de las páginas web.
- SQLite3: Para interactuar con la base de datos SQLite y almacenar los datos extraídos.
- Clona este repositorio en tu máquina local.
- Asegúrate de tener instaladas las dependencias de Python, incluyendo las bibliotecas mencionadas anteriormente.
- Ejecuta el script principal de Python para iniciar el proceso de web scraping y almacenamiento de datos.
Para ejecutar este proyecto, asegúrate de tener instaladas las siguientes dependencias:
- SQLite (versión 3.45.2)
- Requests (versión 2.31.0)
- Beautiful Soup (versión 4.12.3)
- Pandas (versión 2.2.1)
Puedes acceder al reporte interactivo de Tableau aquí.
Si deseas contribuir a este proyecto, por favor abre un issue en este repositorio para discutir los cambios propuestos.