- F1: F1.md
- Pagamentos Bolsa Família:
TBD
- Baby Names Challenge:
TBD
- Docker Desktop
- Git Bash
- Windows: https://gitforwindows.org/
├── docker-compose.yml
├── Dockerfile
├── confs
│ ├── config
│ ├── core-site.xml
│ ├── hdfs-site.xml
│ ├── mapred-site.xml
│ ├── requirements.req
│ ├── slaves
│ ├── spark-defaults.conf
│ └── yarn-site.xml
├── datasets
│ ├── alice_in_wonderland.txt
│ └── iris.csv
│ └── 202001_BolsaFamilia_Pagamentos.csv
│ └── f1
│ |── circuits.csv
│ |── constructorResults.csv
│ |── constructorStandings.csv
│ |── constructors.csv
│ |── driverStandings.csv
│ |── drivers.csv
│ |── lapTimes.csv
│ |── pitStops.csv
│ |── qualifying.csv
│ |── races.csv
│ |── results.csv
│ |── seasons.csv
│ └── status.csv
├── notebooks
│ ├── Bash-Interface.ipynb
│ ├── Dask-Yarn.ipynb
│ ├── Python-Spark.ipynb
│ └── Scala-Spark.ipynb
└── script_files
└── bootstrap.sh
202001_BolsaFamilia_Pagamentos.csv
alice_in_wonderland.txt
F1
iris.csv
Baby Names USA
docker build . -t cluster-base
docker-compose up -d
Parâmetro -d
inicializa a aplicação em background
docker ps
Acesse a interface gráfica de gereciamento Yarn através do link: http://localhost:8088/cluster/nodes
Acesse o Jupyter Notebook através do link: http://localhost:8888/
docker-compose down
Caso queira apagar todos os volumes associados ao projeto, basta inserir o parâmetro -v
no comando acima
Cuidado que isso faz com que todo o projeto seja baixado e configurado do ZERO!
- Micro-Cluster Lab Using Docker, To Experiment With Spark & Dask on Yarn (base project)