Skip to content

A crawler for collecting guidelines from Center For Medical Device Evaluation . NMPA

License

Notifications You must be signed in to change notification settings

Snoopy1866/guidelines-crawler

Repository files navigation

Guidelines

本仓库收集来自国家药品监督管理局医疗器械技术审评中心发布的指导原则(含征求意见稿)。

你可以前往 List of Guidences 查询。

example

Usage

  1. Clone this repository

    git clone https://github.com/Snoopy1866/guidelines-crawler.git
  2. Install requirements

    pip install -r requirements.txt
  3. Run crawler

    python -m crawler --page 0

Tip

If you want to crawler page x, just pass the --page argument. For example, if you want to crawl from https://www.cmde.org.cn/flfg/zdyz/index_8.html, run python -m crawler --page 8.

Pickle 文件

guidences.pickle 文件是一个持久化的 GuidencePublishPage 列表,你可以使用 Python 的内置库 pickle 查看具体数据。

GuidencePublishPage 的定义如下:

@dataclass
class GuidencePublishPage:
    title: str # 指导原则发布页标题
    url: str # 指导原则发布页链接
    date: datetime.date #指导原则发布页日期
    accessories: list[Accessory] #指导原则发布页附件,一个 `Accessory` 列表

@dataclass
class Accessory:
    anchor_title: str #附件标题
    anchor_href: str #附件链接
    anchor_content: str #备选标题 1
    content: str #备选标题 2
    anchor_text_value: str #备选标题 3

声明

本仓库 guidences 目录下的所有文件均为官方公开发布的文件,仅供学习和参考之用。本仓库不对这些文件的准确性、完整性或适用性做任何保证或承担任何责任。使用者应自行核实相关信息,并对使用本仓库内容所产生的任何后果负责。

About

A crawler for collecting guidelines from Center For Medical Device Evaluation . NMPA

Topics

Resources

License

Stars

Watchers

Forks