Aplicação para extrair informações da internet de forma estruturada.
Clone o projeto
git clone git@github.com:kritgarb/web-scraping.git
Instale as dependências
pip install requests beautifulsoup4
Inicie o servidor
python web_scraping.py
-
Envio de Requisição HTTP: Utiliza a biblioteca requests para enviar uma requisição HTTP para o site alvo.
-
Análise de HTML: Utiliza a biblioteca BeautifulSoup para analisar o conteúdo HTML da página e criar uma representação estruturada do DOM (Document Object Model).
-
Localização de Elementos HTML: Usa métodos fornecidos pelo BeautifulSoup para localizar elementos HTML específicos com base em tags, classes ou outros atributos.
-
Extração de Dados: Extrai dados específicos (citações, no exemplo) dos elementos HTML localizados.
-
Impressão dos Resultados: Exibe os dados extraídos no console ou em outro formato desejado.