Предоставлены данные Яндекс Практикумом о заказах такси в аэропортах. Чтобы привлекать больше водителей в период пиковой нагрузки, нужно спрогнозировать количество заказов такси на следующий час. Постройте модель для такого предсказания. Целевая переменная ("количество заказов") находится в столбце num_orders
.
Размер тестовой выборки должен быть 0.1 от общей выборки.
Значение метрики RMSE на тестовой выборке должно быть не больше 48.
- Осуществлен исследовательский анализ данных, добавлены различные признаки - календарные, отстающие и скользящее среднее по 24-м объектам;
- Обучены 6 ML-моделей, качество которых определялось метрикой RMSE. Наилучшее значение метрики показала Нейронная сеть;
- Осуществлено тестирование Нейронной сети. Значение RMSE на тестовой выборке составило 43.132;
- Выведен график "Факт-Прогноз" лучшей модели, а также определены наиболее важные для моделей признаки. Рекомендовано использование Нейронной сети, поскольку ее значение метрики наименьшее.

math
, matplotlib
, numpy
, pandas
, random
, sklearn
, statsmodels
, pytorch
.