Skip to content

Coffeeps/BigDataAnalysis

Repository files navigation

BigDataAnalysis

contributor: datamonday

github repo: https://github.com/datamonday/BigDataAnalysis

csdn: datamonday

公众号:datazero

qrcode


1. Data Analysis and Pre-processing

数据分析和数据预处理相关。

1.1 Visualization

可视化工具的用法,包括:

  • Matplotlib
  • Seaborn
  • Plotly

2. Association Data Mining

关联数据挖掘算法的Pipeline。


3. Classification and Regression

常用的分类和回归算法Pipeline。


4. Clustering

常用的聚类算法总结及代码实现。

4.1 Distance Metrics

  • 12种常用的距离度量原理及代码实现

4.2 K-Means


5. Anomaly Detection

异常检测算法实现。

5.1 One-Class SVM

5.2 Isolation Forest

5.3 Histogram

5.4 Kernel Density


6. Dimention Reduction

降维与度量学习。


Competition Kernel

包含一些Kaggle、天池的比赛Kernel,主要涉及预测、聚类和异常检测。

About

数据挖掘、大数据分析及可视化

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published