Skip to content

En este repositorio encontrarás un proyecto de web scraping desarrollado en Python, enfocado en la extracción de datos de páginas web. Estos datos serán almacenados en una base de datos relacional SQLite, permitiendo un acceso rápido y organizado a la información extraída. 🌐🐍

Notifications You must be signed in to change notification settings

Fabrilennart5/diplomado_ingenieria_datos_practica_5

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Web Scraping con Python y SQLite

Descripción del Proyecto 📝

El objetivo principal de este proyecto es realizar web scraping de páginas web seleccionadas para extraer datos relevantes, los cuales serán almacenados en una base de datos relacional SQLite. Se implementará un enfoque de análisis de HTML utilizando la biblioteca Beautiful Soup, y las solicitudes HTTP serán manejadas mediante la librería Requests en Python. Este proyecto permitirá la recopilación sistemática de datos de múltiples fuentes en línea para su posterior análisis y uso.

Tareas Realizadas ✔️

  • Extracción de datos de páginas web utilizando web scraping.
  • Almacenamiento de los datos extraídos en una base de datos SQLite.
  • Implementación de análisis de HTML con Beautiful Soup.
  • Manejo de solicitudes HTTP con la librería Requests.

Herramientas Utilizadas 🛠️

  • Beautiful Soup: Para analizar el contenido HTML de las páginas web y extraer los datos deseados.
  • Requests: Para realizar solicitudes HTTP y obtener el contenido HTML de las páginas web.
  • SQLite3: Para interactuar con la base de datos SQLite y almacenar los datos extraídos.

Instrucciones de Ejecución ▶️

  1. Clona este repositorio en tu máquina local.
  2. Asegúrate de tener instaladas las dependencias de Python, incluyendo las bibliotecas mencionadas anteriormente.
  3. Ejecuta el script principal de Python para iniciar el proceso de web scraping y almacenamiento de datos.

Requisitos del Proyecto 📋

Para ejecutar este proyecto, asegúrate de tener instaladas las siguientes dependencias:

  • SQLite (versión 3.45.2)
  • Requests (versión 2.31.0)
  • Beautiful Soup (versión 4.12.3)
  • Pandas (versión 2.2.1)

Reporte de Tableau

Puedes acceder al reporte interactivo de Tableau aquí.

Contribución 💻

Si deseas contribuir a este proyecto, por favor abre un issue en este repositorio para discutir los cambios propuestos.

About

En este repositorio encontrarás un proyecto de web scraping desarrollado en Python, enfocado en la extracción de datos de páginas web. Estos datos serán almacenados en una base de datos relacional SQLite, permitiendo un acceso rápido y organizado a la información extraída. 🌐🐍

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages