Skip to content

YoYo860224/spark-kafka-tutorial

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Spark Kafka Tutorial

專案簡介

此專案利用 Apache Spark 和 Kafka 進行串流數據處理,並使用 Jupyter Notebook 作為開發環境。專案包含 Docker 容器化設置,方便快速啟動和測試。

功能

  1. 使用 Spark 讀取 Kafka 串流數據。
  2. 進行數據的批次和串流處理。
  3. Kafka 數據的聚合統計分析。
  4. 提供 Kafka UI 介面進行數據管理。

使用方式

1. 啟動 Docker 容器

執行以下指令啟動所有服務:

cd docker
docker-compose up -d

2. 啟動 Jupyter Notebook

利用 docker logs 查看 Jupyter Notebook 的啟動資訊,並在瀏覽器中打開 Jupyter Notebook:

docker logs spark-driver

3. 遵循 Notebook 指示

在 Jupyter Notebook 中遵循指示執行即可

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published