Nesse Lab falaremos um pouco sobre como montar um DataWarehouse/LakeHouse para estudos!
Na pasta data estão presentes os arquivos .csv que iremos utilizar Na pasta conf está o arquivo .env utilizado como variaveis de ambiente Na pasta volumes encontram-se os volumes utilizados pelo container
https://git-scm.com/download/win
git config --global user.name USER git config --global user.email EMAIL
https://chocolatey.org/install PowerShell as ADMIN: Set-ExecutionPolicy AllSigned PowerShell as ADMIN: Set-ExecutionPolicy Bypass -Scope Process -Force; [System.Net.ServicePointManager]::SecurityProtocol = [System.Net.ServicePointManager]::SecurityProtocol -bor 3072; iex ((New-Object System.Net.WebClient).DownloadString('https://community.chocolatey.org/install.ps1'))
Quando instalar um pacote pelo Choco, a seguinte mensagem será exibida Do you want to run the script?([Y]es/[A]ll - yes to all/[N]o/[P]rint): Nesse caso, digitar A e pressionar Enter para permitir que todos os scripts de instalações sejam executados
Na Windows VM: Criar a máquina, executar o Power Shell como ADMIN e Set-VMProcessor -VMName -ExposeVirtualizationExtensions $true Iniciar a máquina, ir em Ativar ou Desativar recursos do Windows, ativar HyperV. Reiniciar a Maquina
PowerShell as ADMIN: wsl --install -d ubuntu PowerShell as ADMIN: choco install kind
No primeiro momento, deve-se iniciar o MinIO, para criação dos Buckets (bronze, silver, gold) e Chaves de acesso: ''' docker-compose up minio '''
Feito isso, pode-se dropar o container (Ctrl+C) e inicia-lo por completo usando ''' docker-compose up '''
Após a conclusão de download de todas a imagens e o container estar rodando é possível acessar os serviços atrvés das urls abaixo:
Nessie Dremio MinIO PGAdmin/Postgres Jupyter/Spark
Ao acessar a interface do dremio pela primeira vez, deve-se realizar o cadastro. Agora vamos adicionar a conexão com o Nessie e MinIO, com as configurações abaixo: Add Source Nessie configuration
- Name NessieDataCatalog
- Nessie Endpoint URL:
http://nessie:19120/api/v2
- Nessie Authentication Type:
None
- Authentication Type:
AWS Access Key
- AWS Access Key:
Adicionar a access key criada no minio
- AWS Access Secret:
Adicionar a secret key criada no minio
- AWS Root Path:
/bronze/
Adicionar as propriedades abaixo:
fs.s3a.path.style.access
=true
fs.s3a.endpoint
=minio:9000
dremio.s3.compat
=true
- Desmarcar Encrypt connection
https://www.dremio.com/blog/intro-to-dremio-nessie-and-apache-iceberg-on-your-laptop/
https://blog.min.io/uncover-data-lake-nessie-dremio-iceberg/