Skip to content

Latest commit

 

History

History
35 lines (19 loc) · 998 Bytes

README.md

File metadata and controls

35 lines (19 loc) · 998 Bytes

Bigdataanalytics

Burrito

Assignment 1: spam analysis

  • 下載SPAM ARCHIVE從2010~2015年的資料
  • 使用LogStash進行資料拋轉的工作
  • 匯入至ElasticSearch
  • 使用Kibana做統計圖表
  • 取出5種屬性,轉成data matrix
  • 部署分散式Hadoop,執行K-means演算法

Team member

資工碩一 m10315095 張清鈞

四資工四 b10015016 吳柏毅

四資工四 b10015027 李信融

Result document

Link: https://docs.google.com/document/d/1PsJUfUK5neryj133OTf85cEcQ706xtJddM78eA4tSus/edit?usp=sharing

Kibana result

Link: https://github.com/hwaohung/spam-analysis/blob/master/kibana-result.png?raw=true