bilibili_comment_spider

正大杯比赛帮他们做的一个b站视频的爬取工具，包括词频分析，词云图生成
生成的文件会在src目录里面
里面有之前爬取过评论的示例
但是这个无法爬取楼中楼的评论

第一次请求视频评论接口时，它会返回一个session_id
后面请求需要带上这个session_id
请求翻页是通过时间戳来实现的（也就是翻页的时候，当前时间戳必须要大于之前请求的时间戳，这样服务器默认翻到下一页）
1. 因为时间戳给的是秒为单位的，所以即使是恶意的爬虫也必须要像正常的刷评论一样等待时间
请求头的部分信息进行md5加密后得到w_rid（包括转义字符也要带上）
服务器会校验w_rid是否正确，才会进行响应

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
pkg		pkg
src		src
README.md		README.md
analyze.py		analyze.py
cloud.py		cloud.py
comment.py		comment.py
config.yaml		config.yaml

Provide feedback