Spark Kafka Tutorial

專案簡介

此專案利用 Apache Spark 和 Kafka 進行串流數據處理，並使用 Jupyter Notebook 作為開發環境。專案包含 Docker 容器化設置，方便快速啟動和測試。

功能

使用 Spark 讀取 Kafka 串流數據。
進行數據的批次和串流處理。
Kafka 數據的聚合統計分析。
提供 Kafka UI 介面進行數據管理。

使用方式

1. 啟動 Docker 容器

執行以下指令啟動所有服務：

cd docker
docker-compose up -d

2. 啟動 Jupyter Notebook

利用 docker logs 查看 Jupyter Notebook 的啟動資訊，並在瀏覽器中打開 Jupyter Notebook：

docker logs spark-driver

3. 遵循 Notebook 指示

在 Jupyter Notebook 中遵循指示執行即可

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
docker		docker
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
main.ipynb		main.ipynb
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Spark Kafka Tutorial

專案簡介

功能

使用方式

1. 啟動 Docker 容器

2. 啟動 Jupyter Notebook

3. 遵循 Notebook 指示

About

Uh oh!

Releases

Packages

Languages

YoYo860224/spark-kafka-tutorial

Folders and files

Latest commit

History

Repository files navigation

Spark Kafka Tutorial

專案簡介

功能

使用方式

1. 啟動 Docker 容器

2. 啟動 Jupyter Notebook

3. 遵循 Notebook 指示

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages