Парсер документов PEP на базе фреймворка Scrapy.
- Собирает номер, название и статус всех PEP.
- Подсчитывает общее количество каждого статуса, а также общую сумму всех статусов.
Парсер собирает данные с сайта https://www.python.org/
Вся собранная информация сохраняется в файлах csv
в папке results/...
- Клонировать репозиторий:
git clone https://github.com/Skrapivn/scrapy_parser_pep.git
- Создать виртуальное окружение:
python -m venv venv
- Активировать виртуальное окружение, обновить версию
pip
и установить зависимости изrequirements.txt
:
source venv/bin/activate
python -m pip install -–upgrade pip.
pip install -r requirements.txt
- Запустить в консоле:
scrapy crawl pep