Skip to content

Web scraping a la página de Cúspide Libros para obtener el listado de los 100 libros más vendidos de la semana.

License

Notifications You must be signed in to change notification settings

FreddyPinto/cuspide-bookstore-scraping

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Contributors Forks Stargazers Issues MIT Licencia LinkedIn


Logo

Scraping Cuspide's Bookstore Website

Scraper de los 100 libros más vendidos de la semana en Cúspide Libros
Explorar docs »

Reportar Bug · Request Feature

Tabla de contenido
  1. Acerca del Proyecto
  2. Getting Started
  3. Uso
  4. Roadmap
  5. Contribuciones
  6. Licencia
  7. Contacto

Acerca del Proyecto

screenshot

Este proyecto realiza web scraping en la página web de Cúspide Libros para obtener el listado de los 100 libros más vendidos de la semana. Los datos recopilados incluyen el título del libro, la URL del libro, el precio en pesos, el precio en dólares y el precio en dólares considerando la cotización del dólar blue de Argentina. Los datos se almacenan en una base de datos MySQL. Este proyecto se desarrolló como parte del Proyecto Integrador correspondiente al Módulo 3 del bootcamp en Data Science de SoyHenry.

(volver arriba)

Desarrollado con:

  • Python
  • Pandas
  • MySQL
  • Jupiter
  • VSC
  • BeautifulSoup

(volver arriba)

Getting Started

Para ejecutar este proyecto localmente sigue estos pasos para configurarlo:

Instalación

  1. Clona el repositorio:
    git clone https://github.com/FreddyPinto/cuspide-bookstore-scraping.git
  2. Crea un entorno virtual de Python:
    python -m venv venv
  3. Activa el entorno virtual:
    • En Windows:
      .\env\Scripts\activate
    • Unix o MacOS:
      env/bin/activate
  4. Instala las dependencias:
    pip install -r requirements.txt
  5. Crea un archivo .env en el directorio raíz del proyecto y añade las siguientes variables de entorno:
    DB_HOST=tu_host
    DB_PORT=tu_puerto
    DB_USERNAME=tu_usuario
    DB_PASSWORD=tu_contraseña

(volver arriba)

Uso

Para ejecutar el script de web scraping, usa el siguiente comando:

python src/scripts/main.py

Esto realizara el scraping de la página web de Cúspide Libros, obtendra los datos de los 100 libros más vendidos de la semana y los almacenara en una base de datos MySQL.

screenshot

Tabla books

screenshot

Tabla errors

(volver arriba)

Roadmap

Este proyecto se realizó como un Producto Mínimo Viable, por lo que se podrían mejorar algunos aspectos en el futuro, con la finalidad de lograr un producto más completo y robusto. Algunas de las posibles mejoras son:

  • Mejorar la eficiencia del web scraping, explorando técnicas para acelerar la extracción de datos.

  • Implementar un manejo de errores más robusto para manejar posibles fallos durante el web scraping.

  • Implementar pruebas automatizadas para asegurar que el código funciona como se espera después de cada cambio.

  • Explorar otras bibliotecas o herramientas para el web scraping que podrían ofrecer mejores prestaciones o facilidades de uso.

  • Mejorar la documentación del proyecto, incluyendo más detalles sobre cómo se realiza el web scraping y cómo se pueden utilizar los datos extraídos.

Consulta los issues abiertos para proponer características (y problemas conocidos).

(volver arriba)

Contribuciones

Las contribuciones son lo que hacen que la comunidad de código abierto sea un lugar increíble para aprender, inspirarse y crear. Cualquier contribución que hagas será muy apreciada.

Si tienes una sugerencia para mejorar este proyecto, haz un fork del repositorio y crea un pull request. También puedes simplemente abrir un issue con la etiqueta “enhancement”. ¡No olvides darle una estrella al proyecto! Gracias de nuevo.

  1. Haz un fork del Proyecto
  2. Crea tu feature Branch (git checkout -b feature/AmazingFeature)
  3. Haz commit de tus cambios (git commit -m 'Add some AmazingFeature')
  4. Push a la Branch (git push origin feature/AmazingFeature)
  5. Abre un Pull Request

(volver arriba)

Licencia

Distribuido bajo la licencia MIT. Consulta el archivo LICENSE para más información.

(volver arriba)

Contacto

Freddy Pinto - freddypinto@outlook.com

LinkedIn

(volver arriba)

About

Web scraping a la página de Cúspide Libros para obtener el listado de los 100 libros más vendidos de la semana.

Topics

Resources

License

Stars

Watchers

Forks