- Установить Docker Desktop и DBeaver
- Скачать репозиторий и разархивировать, либо склонировать его себе с помощью git-клиента (рекомендую fork)
- Перейти в папку clickhouse
cd ./clickhouse
- Запустить контейнер с Clickhouse командой
docker-compose up -d
- Подключиться к Clickhouse с помощью DBeaver:
- Тип подключения: Clickhouse
- Хост: localhost
- База данных: raw_layer
- Имя пользователя: admin
- Пароль: admin
- Выполнить скрипт
clickhouse_data.sql
для загрузки исходных данных в слойraw_layer
- Выполнить скрипт
clickhouse_lecture.sql
по шагам для закрепления материала - Остановить и удалить контейнер можно c помощью интерфейса Docker Desktop (вкладка Containers)
- Установить Python 3.11
- Установить необходимые библиотеки Python
pip install soda-core==3.0.54 soda-core-postgres==3.0.54
- Перейти в папку soda-demo
cd ./soda-demo
- Протестировать соединение с Clickhouse командой
soda test-connection -d dwh -c configuration.yml
- Запустить data quality проверки командой
soda scan -d dwh -c configuration.yml dwh.yml