Skip to content

arthbraveheart/scrapy_api

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 

Repository files navigation

scrapy_api

Scrape retail web pages with Scrapy and GraphQL


Scrapy with API

Objective

O objetivo desse projeto é mostrar habilidades com o básico de scrapy, uma poderosa ferramenta para scrapers de alta performance. Os dados coletados nos site são referentes aos produtos vendidos (preço, EAN, URL do produto).

Key concepts

Primeiramente é importante destacar a forma com que isso foi feito. Alguns sites possuem API's públicas para consultas GraphQL. É o caso dos sites em questão. Outro ponto importante é que o Scrapy possui uma robusta arquitetura para conseguir muitas consultas rápidas e assíncronas. Dessa forma, conseguir extrair informações sobre todos os preços do site se torna muito mais rápida e prática por nãoprecisar de um webdriver.

About

Scrape retail web pages with Scrapy and GraphQL

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages