Skip to content

Latest commit

 

History

History
9 lines (5 loc) · 316 Bytes

ReadMe.md

File metadata and controls

9 lines (5 loc) · 316 Bytes

网络爬虫之最基本的爬虫:爬取网易新闻排行榜

一些说明:

  • 使用urllib2或requests包来爬取页面。

  • 使用正则表达式分析一级页面,使用Xpath来分析二级页面。

  • 将得到的标题和链接,保存为本地文件。