Гиперпараметры – это параметры в схеме обучения любого алгоритма предсказания. Сама по себе схема в общем случае выглядит следующим образом:
- На вход алгоритма обучения модели
$a$ мы подаём гиперпараметры, которые задают поведение алгоритма, и набор данных$X$ . -
$a$ возвращает некие параметры$\delta$ . - Далее, на вход алгоритма предсказания
$a_{\delta}$ мы подаём$\delta$ и объект$x$ . -
$a_{\delta}$ возвращает некое предсказание$y$ .
Исходя из этого, гиперпараметры – это:
- параметры алгоритма обучения;
- параметры, которые не меняются во время обучения;
- параметры, которые можно установить до наблюдения набора данных;
- структурные параметры.
Задача настройки гиперпараметров – найти такие параметры
Они отличаются от параметров – внутренних параметров, получаемых автоматически в процессе обучения и не настраиваемых специалистами по данным.