Асинхронный парсер PEP

Парсер документов PEP на базе фреймворка Scrapy.

Описание

Собирает номер, название и статус всех PEP.
Подсчитывает общее количество каждого статуса, а также общую сумму всех статусов.

Парсер собирает данные с сайта https://www.python.org/

Вся собранная информация сохраняется в файлах csv в папке results/...

git clone https://github.com/Skrapivn/scrapy_parser_pep.git

python -m venv venv

Активировать виртуальное окружение, обновить версию pip и установить зависимости из requirements.txt:

source venv/bin/activate

python -m pip install -–upgrade pip.

pip install -r requirements.txt

scrapy crawl pep

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
pep_parse		pep_parse
results		results
tests		tests
.flake8		.flake8
.gitignore		.gitignore
License		License
README.md		README.md
pytest.ini		pytest.ini
requirements.txt		requirements.txt
scrapy.cfg		scrapy.cfg