From ad4169c93fd6e81117e8a72fc5008a572b184b43 Mon Sep 17 00:00:00 2001 From: ubuntu-home Date: Sun, 29 Dec 2019 12:02:05 +0800 Subject: [PATCH] =?UTF-8?q?=E3=80=90doc=E3=80=91=E6=9B=B4=E6=96=B0todo?= =?UTF-8?q?=E9=A1=B9?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- README.md | 6 +++--- 1 file changed, 3 insertions(+), 3 deletions(-) diff --git a/README.md b/README.md index ff5e918..78694dd 100644 --- a/README.md +++ b/README.md @@ -43,9 +43,9 @@ 抓取的目的性较强时,可以采用关键词抓取。 # TODO: -- [] 豆瓣的URL设计是比较符合RESTful规范的。根据豆瓣的id即可抓取其他相关的资源 -- [] 由于豆瓣的反爬虫机制,id是稀疏。可以考虑筛选一些没有内容的id以提高命中率。 -- [] 由于豆瓣限制了每个IP允许抓取的访问次数,可以使用代理IP[proxymesh](https://proxymesh.com/)来提升抓取速度 +- [ ] 豆瓣的URL设计是比较符合RESTful规范的。根据豆瓣的id即可抓取其他相关的资源 +- [ ] 由于豆瓣的反爬虫机制,id是稀疏。可以考虑筛选一些没有内容的id以提高命中率。 +- [ ] 由于豆瓣限制了每个IP允许抓取的访问次数,可以使用代理IP[proxymesh](https://proxymesh.com/)来提升抓取速度 - [x] 更新包依赖 影评:https://movie.douban.com/subject/26366465/reviews