ScrapyPEP-парсер
- парсер документов PEP на базе фреймворка Scrapy
- Python 3.11
- Scrapy 2.5.1
Парсер собирает информацию с сайтов документации Python и документов PEP.
Информация выводится в виде двух файлов .csv:
- первый файл содержит список всех PEP: номер, название и статус.
- второй файл содержит сводку по статусам PEP — сколько найдено документов в каждом статусе.
$ scrapy crawl pep
После запуска парсера будет создана папка results с двумя csv-файлами.
- Клонировать репозиторий c GitHub на компьютер
$ git clone https://github.com/DashaMalva/scrapy_parser_pep.git
- Создать и активировать виртуальное окружение
$ python -m venv venv
$ source venv/Scripts/activate
- Обновить менеджер пакетов pip
$ python -m pip install --upgrade pip
- Установить зависимости из requirements.txt
$ pip install -r requirements.txt
The MIT License (MIT)
Студент Яндекс.Практикум,
Дарья Матвиевская