MLFlow を用いた Iris データセットの 2 値分類モデル学習パイプラインです。
- Python 3.8 以上
- Docker
- MLFlow
- カレントディレクトリ
$ pwd
~/ml-system-in-actions/chapter2_training/iris_binary
- ライブラリインストール 本プログラムで仕様するライブラリはrequirements.txtに示すとおりです。
$ make dev
# 実行されるコマンド
# pip install -r requirements.txt
# 出力は省略
- 学習用 Docker イメージのビルド 学習で使用する Docker イメージをビルドします。
$ make d_build
# 実行されるコマンド
# docker build \
# -t shibui/ml-system-in-actions:training_pattern_iris_binary_0.0.1 \
# -f Dockerfile .
# 出力は省略
# dockerイメージとしてshibui/ml-system-in-actions:training_pattern_iris_binary_0.0.1がビルドされます。
- 学習パイプラインの実行 mlflow で学習パイプラインを実行します。
$ make train
# 実行されるコマンド
# mlflow run . --no-conda
# 出力例
# 2021/02/11 11:19:57 INFO mlflow.projects.docker: === Building docker image iris_binary:6fa928e ===
# 2021/02/11 11:20:08 INFO mlflow.projects.utils: === Created directory /var/folders/v8/bvkzgn8j1ws6y76t4z5nt6280000gn/T/tmptboh_ho_ for downloading remote URIs passed to arguments of type 'path' ===
# 2021/02/11 11:20:08 INFO mlflow.projects.backend.local: === Running command 'docker run --rm -v ~/book/ml-system-in-actions/chapter2_training/iris_binary/mlruns:/mlflow/tmp/mlruns -v ~/book/ml-system-in-actions/chapter2_training_patterns/iris_binary/mlruns/0/45a2f7c5aebc49519d21f1fe6e2033c7/artifacts:~/book/ml-system-in-actions/chapter2_training_patterns/iris_binary/mlruns/0/45a2f7c5aebc49519d21f1fe6e2033c7/artifacts -e MLFLOW_RUN_ID=45a2f7c5aebc49519d21f1fe6e2033c7 -e MLFLOW_TRACKING_URI=file:///mlflow/tmp/mlruns -e MLFLOW_EXPERIMENT_ID=0 iris_binary:6fa928e python -m iris_train \
# --test_size 0.3 \
# --target_iris virginica' in run with ID '45a2f7c5aebc49519d21f1fe6e2033c7' ===
# 2021/02/11 11:20:15 INFO mlflow.projects: === Run (ID '45a2f7c5aebc49519d21f1fe6e2033c7') succeeded ===
学習は数分以内に完了します。