Workshop: Analytics on AWS

Contributors:

Design serverless data lake architecture
Build a data processing pipeline and Data Lake using Amazon S3 for storing data
Use Amazon Kinesis for real-time streaming data
Use AWS Glue to automatically catalog datasets
Run interactive ETL scripts in an Amazon SageMaker Jupyter notebook connected to an AWS Glue development endpoint
Use EMR to run a Spark transformation job
Load data to Amazon Redshift from Glue
Intro into Amazon Redshift Best design practices.
Query data using Amazon Athena & visualize it using Amazon QuickSight

Pre-requisites:

Please do check on the pre-requisites for each module before starting the activities within the module.

Also, do not forget to clean up the resources at the end of the workshop!

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
img		img
modules		modules
scripts		scripts
ArchitectureDiagrams.pptx		ArchitectureDiagrams.pptx
analytics-demo-notebook.ipynb		analytics-demo-notebook.ipynb
analytics-demo-redshift-notebook.ipynb		analytics-demo-redshift-notebook.ipynb
readme.md		readme.md
tracks_list.json		tracks_list.json