-
UCR Time Series UCR时间序列数据集是时序领域的“Imagnet”,涵盖医疗/电力/地理 等诸多领域,目前全量数据有128种。涉及时间序列预测、回归、聚类等诸多任务,可以说是发Paper必跑数据集,由加州大学河滨分校计算机系的教授 Eamonn Keogh 所在的课题组维护。
-
Awesome Public Datasets 包含各个细分领域的数据资源,自然科学和社会科学的覆盖都很全面
-
服务监控数据集 由人工神经网络公司Numenta所提供的,包含互联网服务场景下的各种流式数据与评测脚本。NAB是用于评估数据流实时应用中异常检测算法的新颖基准,它由50多个带有标签的真实世界和人工时间序列数据文件以及为实时应用程序设计的新颖评分机制组成。
-
音乐数据库 包含了海量的公开音乐数据库,适用于包含音乐推荐、分类在内的各种任务
-
国家经济数据库 数据来源中华人民共和国国家统计局,包含了我国经济民生等多个方面的数据,并且在月度、季度、年度都有覆盖,较为全面
-
CEIC 涵盖超过195个国家400多万个时间序列的数据源,最完整的一套超过128个国家的经济数据,能够精确查找GDP、CPI、进口、出口、外资直接投资、零售、销售以及国际利率等深度数据。
-
中国统计信息网 国家统计局的官方网站,汇集了全国各级政府各年度的国民经济和社会发展统计信息,建立了以统计公报为主,统计年鉴、阶段发展数据、统计分析、经济新闻、主要统计指标排行等。
-
政府开放数据
- multivariate-time-series-data
- The Numenta Anomaly Benchmark(NAB) 包括electricity、exchange_rate、solar-energy、traffic等时序数据
- Alibaba Cluster Trace Program
- AzurePublicDataset
- VM Traces
- Azure Functions Traces
- Google/cluster-data
- Yahoo: A Labeled Anomaly Detection Dataset
- 港中文loghub数据集
- 时序数据异常检测工具/数据集大列表 包括一些异常检测软件、相关软件和基准数据集等
- Unsupervised real-time anomaly detection for streaming data