教程：使用 NNI API 在本地创建和运行 Experiment

本教程会使用 [~/examples/trials/mnist-pytorch] 示例来解释如何在本地使用 NNI API 来创建并运行 Experiment。

在开始前

要有一个使用卷积层对 MNIST 分类的代码，如 mnist_before.py。

第一步：更新模型代码

对代码进行以下改动来启用 NNI API：

1.1 声明 NNI API 在 Trial 代码中通过 import nni 来导入 NNI API。

1.2 获取预定义参数

使用一下代码段：

tuner_params = nni.get_next_parameter()

获得 tuner 分配的超参数值。 tuner_params 是一个对象，例如：

{"batch_size": 32, "hidden_size": 128, "lr": 0.01, "momentum": 0.2029}

1.3 导出 NNI results API：nni.report_intermediate_result(accuracy) 发送 accuracy 给 assessor。使用 API: nni.report_final_result(accuracy) 返回 accuracy 的值给 Tuner。

将改动保存到 mnist.py 文件中。

注意：

accuracy - 如果使用内置的 Tuner/Assessor，那么 `accuracy` 必须是数值（如 float, int）。在定制 Tuner/Assessor 时 `accuracy` 可以是任何类型的 Python 对象。
Assessor（评估器）- 会根据 Trial 的历史值（即其中间结果），来决定这次 Trial 是否应该提前终止。
Tuner（调参器） - 会根据探索的历史（所有 Trial 的最终结果）来生成下一组参数、架构。

第二步：定义搜索空间

在 Step 1.2 获取预定义的参数 中使用的超参定义在 search_space.json 文件中：

{
    "batch_size": {"_type":"choice", "_value": [16, 32, 64, 128]},
    "hidden_size":{"_type":"choice","_value":[128, 256, 512, 1024]},
    "lr":{"_type":"choice","_value":[0.0001, 0.001, 0.01, 0.1]},
    "momentum":{"_type":"uniform","_value":[0, 1]}
}

参考 define search space 进一步了解搜索空间。

第三步：定义 Experiment

3.1 启用 NNI API 模式

要启用 NNI 的 API 模式，需要将 useAnnotation 设置为 false，并提供搜索空间文件的路径（即第一步中定义的文件）：

useAnnotation: false
searchSpacePath: /path/to/your/search_space.json

在 NNI 中运行 Experiment，只需要：

可运行的 Trial 的代码
实现或选择 Tuner
准备 YAML 的 Experiment 配置文件
（可选）实现或选择 Assessor

准备 trial:

安装 NNI 之后，NNI 的样例已经在目录 nni/examples 下，运行 ls nni/examples/trials 可以看到所有的 examples。

以一个简单的 trial 来举例。 NNI 提供了 mnist 样例。安装 NNI 之后，NNI 的样例已经在目录 ~/nni/examples下，运行 ls ~/nni/examples/trials 可以看到所有的 examples。执行下面的命令可轻松运行 NNI 的 mnist 样例：

python ~/nni/examples/trials/mnist-annotation/mnist.py

上面的命令会写在 YAML 文件中。参考这里来写出自己的 Experiment 代码。

准备 Tuner： NNI 支持多种流行的自动机器学习算法，包括：Random Search（随机搜索），Tree of Parzen Estimators (TPE)，Evolution（进化算法）等等。也可以实现自己的 Tuner（参考这里）。下面使用了 NNI 内置的 Tuner：

tuner:
  builtinTunerName: TPE
  classArgs:
    optimize_mode: maximize

builtinTunerName 用来指定 NNI 中的 Tuner，classArgs 是传入到 Tuner 的参数（内置 Tuner 在这里），optimization_mode 表明需要最大化还是最小化 Trial 的结果。

准备配置文件：实现 Trial 的代码，并选择或实现自定义的 Tuner 后，就要准备 YAML 配置文件了。 NNI 为每个 Trial 示例都提供了演示的配置文件，用命令 cat ~/nni/examples/trials/mnist-annotation/config.yml 来查看其内容。大致内容如下：

authorName: your_name
experimentName: auto_mnist

# 同时运行的 trial 数量
trialConcurrency: 1

# 实验最大运行时长
maxExecDuration: 3h

# 此项设置为 empty 意为无限大
maxTrialNum: 100

# choice: local, remote
trainingServicePlatform: local

# search space file
searchSpacePath: search_space.json

# choice: true, false
useAnnotation: true
tuner:
  builtinTunerName: TPE
  classArgs:
    optimize_mode: maximize
trial:
  command: python mnist.py
  codeDir: ~/nni/examples/trials/mnist-annotation
  gpuNum: 0

因为这个 Trial 代码使用了 NNI Annotation 的方法（参考这里），所以 useAnnotation 为 true。 command 是运行 Trial 代码所需要的命令，codeDir 是 Trial 代码的相对位置。命令会在此目录中执行。同时，也需要提供每个 Trial 进程所需的 GPU 数量。

完成上述步骤后，可通过下列命令来启动 Experiment：

nnictl create --config ~/nni/examples/trials/mnist-annotation/config.yml

参考这里来了解 nnictl 命令行工具的更多用法。

查看 Experiment 结果

Experiment 应该一直在运行。除了 nnictl 以外，还可以通过 NNI 的网页来查看 Experiment 进程，进行控制和其它一些有意思的功能。

使用多个本地 GPU 加快搜索速度

以下步骤假定在本地安装了4个 NVIDIA GPU，并且具有 GPU 支持的 tensorflow。演示启用了 4 个并发的 Trial 任务，每个 Trial 任务使用了 1 块 GPU。

准备配置文件：NNI 提供了演示用的配置文件，使用 cat examples/trials/mnist-annotation/config_gpu.yml 来查看。 trailConcurrency 和 gpuNum 与基本配置文件不同：

...

# how many trials could be concurrently running
trialConcurrency: 4

...

trial:
  command: python mnist.py
  codeDir: ~/nni/examples/trials/mnist-annotation
  gpuNum: 1

用下列命令运行 Experiment：

nnictl create --config ~/nni/examples/trials/mnist-annotation/config_gpu.yml

可以用 nnictl 命令行工具或网页界面来跟踪训练过程。 nvidia_smi 命令行工具能在训练过程中查看 GPU 使用情况。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

LocalMode.rst

LocalMode.rst

教程：使用 NNI API 在本地创建和运行 Experiment

查看 Experiment 结果

使用多个本地 GPU 加快搜索速度

Files

LocalMode.rst

Latest commit

History

LocalMode.rst

File metadata and controls

教程：使用 NNI API 在本地创建和运行 Experiment

查看 Experiment 结果

使用多个本地 GPU 加快搜索速度