Webinar: "ML in Production" on practice

Webinar and discord

For a video lecture explaining this code, watch this webinar
For support and questions, join this Discord server

Tools to install

Setup end2end

bash ./script/build_docker.sh
bash ./script/start_all.sh

Clean up

./script/start_all.sh

Setup development

python -m venv ~/env/
source ~/env/bin/activate
pip install -r requirements.txt

Observe

k9s -A

kubectl port-forward --address 0.0.0.0 svc/data-labeling 6900:6900
kubectl port-forward --address 0.0.0.0 svc/monitoring-custom 8081:8080
kubectl port-forward --address 0.0.0.0 svc/monitoring-open 8082:8080
kubectl port-forward --address 0.0.0.0 svc/serving-custom-model 8001:80
kubectl port-forward --address 0.0.0.0 svc/serving-open-model 8002:80

Setup creds

export ARGILLA_URI=http://0.0.0.0:6900
export ARGILLA_KEY=adminadmin
export ARGILLA_NAMESPACE=admin
expoer HF_TOKEN=hf_your_token

Data

python end2end/data.py load-text-to-sql-dataset
python end2end/data.py load-data-for-labeling --dataset-name text2sql --sample --num-sample 10000

Reference

Experiments

python end2end/experiments.py --model_name google/flan-t5-small --dataset_name text2sql-workshop --api_url ${ARGILLA_URI} --api_key ${ARGILLA_KEY} --workspace ${ARGILLA_NAMESPACE} --output_dir result-flan-t5-small --overwrite_output_dir --do_train --do_eval --evaluation_strategy steps --per_device_train_batch_size 16 --per_device_eval_batch_size 16 --learning_rate 1e-3 --num_train_epochs 1000 --hub_model_id kyryl-opens-ml/flan-t5-small-sql --hub_token ${HF_TOKEN}

accelerate launch end2end/experiments.py --model_name google/flan-t5-small --dataset_name text2sql-workshop --api_url ${ARGILLA_URI} --api_key ${ARGILLA_KEY} --workspace ${ARGILLA_NAMESPACE} --output_dir result-flan-t5-small --overwrite_output_dir --do_train --do_eval --evaluation_strategy steps --per_device_train_batch_size 16 --per_device_eval_batch_size 16 --learning_rate 1e-3 --num_train_epochs 1000 --hub_model_id kyryl-opens-ml/flan-t5-small-sql --hub_token ${HF_TOKEN}

Reference

Pipeline

dagster dev -f end2end/pipeline.py -p 3000 -h 0.0.0.0

Reference

https://dagster.io/blog/finetuning-llms

Serving

docker run --shm-size 1g -p 8080:80 ghcr.io/huggingface/text-generation-inference:1.4 --model-id kyryl-opens-ml/flan-t5-small-sql

Reference

Monitoring

streamlit run --server.port 8080 --server.address 0.0.0.0 end2end/monitoring_ui.py

Reference

https://docs.argilla.io/en/latest/getting_started/quickstart_workflow_feedback.html

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.github/workflows		.github/workflows
docs		docs
end2end		end2end
k8s		k8s
script		script
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
requirements-data.txt		requirements-data.txt
requirements-experiments.txt		requirements-experiments.txt
requirements-monitoring.txt		requirements-monitoring.txt
requirements-pipeline.txt		requirements-pipeline.txt
requirements-serving.txt		requirements-serving.txt
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Webinar: "ML in Production" on practice

Webinar and discord

Tools to install

Setup end2end

Clean up

Setup development

Observe

Setup creds

Data

Experiments

Pipeline

Serving

Monitoring

About

Releases

Packages

Languages

License

kyryl-opens-ml/webinar-end2end

Folders and files

Latest commit

History

Repository files navigation

Webinar: "ML in Production" on practice

Webinar and discord

Tools to install

Setup end2end

Clean up

Setup development

Observe

Setup creds

Data

Experiments

Pipeline

Serving

Monitoring

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages