在混合模式下运行 NNI 意味着 NNI 将在多种培训平台上运行试验工作。 例如,NNI 可以同时将试用作业提交到远程计算机和 AML。
对于混合模式,NNI 目前支持的平台有 本地平台,远程平台, PAI 和 AML。 使用这些模式开始 Experiment 之前,用户应为平台设置相应的环境。 有关环境设置的详细信息,请参见相应的文档。
以 examples/trials/mnist-tfv1
为例。 NNI 的 YAML 配置文件如下:
experimentName: example_mnist
searchSpacePath: search_space.json
command: python3 mnist.py
codeDir: .
trialConcurrency: 2
gpuNum: 1
maxExecDuration: 1h
maxTrialNum: 10
tuner:
builtinTunerName: TPE
classArgs:
optimize_mode: maximize
trainingServicePlatforms:
- remote
machineList:
- ip: 10.1.1.1
username: bob
passwd: bob123
- local
要使用混合训练平台,用户应在 trainingService 字段中将训练平台设置为列表。 目前,混合训练平台只支持 local, remote, pai 和 aml 训练平台。