1. Описание проекта
2. Какой кейс решаем?
3. Краткая информация о данных
4. Этапы работы над проектом
5. Результат
6. Выводы
Построение модели по базде данных ресторанов с сайта Tripadvisor.com
Проанализировать данные о рестаранах с сайта Tripadvisor.com для создания модели прогнозирования рейтинга ресторанов
Вход:
- База данных с информацией о ресторанах с сайта Tripadvisor.com
- Проанализировать исходный датасет
- Загрузить дополнительные данные из веншних источников
- Произвести очистку данных
- Сформировать дополнительные признаки из имеющихся
- Сформировать данные для обучения модели
- Обучить модель
- Произвести оценку полученного результата
Результат: Модель на основании подготовленных данных выдает среднюю абсолюную ошибку в размере 0,217, что меньше чем погрешность измерения рейтинга - шаг рейтинга 0,5 деленый пополам - 0,25. Таким образом, обученную на обработанных данных модель можно использовать для предсказания рейтинга ресторана.
При выполнении проекта закреплены навыки работы с pandas DataFrame, графическими библиотеками для построения графиков, а также навыками разведывательного анализа, выявление пропусков, выбросов и их очистка. А также подгрузки данных со сторонних источников и формаирования новых признаков. Оценка информативности признаков.
Если информация по этому проекту покажется вам интересной или полезной, то я буду очень вам благодарен, если отметите репозиторий и профиль ⭐️⭐️⭐️-дами