douban-data-analysis

Python Data Analysis 's project.

Based on Python 3.6

我用Django把这个简陋的推荐系统实现成了Web项目啦！

--- 更新 --- 删掉了爬到的电影数据，想要使用请发issue/给我发邮件吧

函数介绍

Spide.py为爬取电影数据函数，运行时会有IP被封的风险

Spide.py运行时由于爬取数据量过大因此在运行时可以在主函数的相应注释位置修改每次爬取的数据量，休息一会多爬几次换换IP即可

DataPreprocess.py为保存每个进程爬取数据的函数可以不用运行

Movie.py保存并打印电影信息功能

Recommend.py进行协同过滤，算法输入需要data.csv,及用户id,针对该用户的观影习惯进行电影推荐，在main函数中设置的随机选取一个用户列表中用户进行输入预测，因此不需额外输入用户ID，如需进行其他测试可自行修改