contributor: datamonday
github repo: https://github.com/datamonday/BigDataAnalysis
csdn: datamonday
公众号:datazero
数据分析和数据预处理相关。
可视化工具的用法,包括:
- Matplotlib
- Seaborn
- Plotly
关联数据挖掘算法的Pipeline。
常用的分类和回归算法Pipeline。
常用的聚类算法总结及代码实现。
- 12种常用的距离度量原理及代码实现
异常检测算法实现。
降维与度量学习。
包含一些Kaggle、天池的比赛Kernel,主要涉及预测、聚类和异常检测。