solved task by trojanof · Pull Request #171 · sima-land/intern-test

trojanof · 2023-08-14T20:05:57Z

Привет. Тут ноутбук с выполненным тестовым заданием.

danilfromekb · 2023-08-16T05:19:07Z

data-science/model/recsys.ipynb

+    {
+     "data": {
+      "text/plain": [
+       "0.0034842071949627938"


Как можно улучшить качество кода?
Назовите примеры того как можно увеличить метрику с использованием дополнительных данных.
Что можете сказать про получившуюся метрику map@10 ?

Как можно улучшить качество кода?

Обернуть код создания разреженных матриц в функцию. Или вообще создать класс Dataset, в конструктор передавать датафрейм и дату для разбиения на трейн и тест; сразу разделять на трейн и тест и создавать матрицы, которые записывать в атрибуты созданного объекта класса Dataset.

Назовите примеры того как можно увеличить метрику с использованием дополнительных данных.

Если доступны данные лайков, то использовать их вместо процентного времени просмотра, потому что это явное указание релевантности для пользователя. Или использовать взвешенную комбинацию налиция/отсутствия лайка и процента времени просмотра - предполагая, что если пользователь не поставил лайк, но время просмотра большое (скажем, близко к 100%), то контент оказался релевантным.

Векторизовать метаданные об объектах; взять наиболее популярный объект для данного пользователя (по суммарному времени просмотра) и найти топ 10 схожих с ним векторов

Векторизовать данные о пользователях, найти для данного пользователя наиболее близкого к нему в векторном пространстве и порекомендовать топ объектов от этого похожего пользователя (фильтруя те, с которым пользователь уже взаимодействовал)

Что можете сказать про получившуюся метрику map@10 ?

Значение метрики низкое. Значение в районе 0.1 означало бы что первый объект из предсказанных, как правило, оказывается релевантным. По полученному значению 0.00348 можно сделать вывод, что лишь некоторые объекты в рекомендациях оказываются релевантными.

solved task

b395d53

danilfromekb reviewed Aug 16, 2023

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Comments

solved task#171

solved task#171
trojanof wants to merge 1 commit intosima-land:masterfrom
trojanof:master

trojanof commented Aug 14, 2023

Uh oh!

danilfromekb Aug 16, 2023

Uh oh!

trojanof Aug 16, 2023 •

edited

Loading

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Comments

Conversation

trojanof commented Aug 14, 2023

Uh oh!

danilfromekb Aug 16, 2023

Choose a reason for hiding this comment

Uh oh!

trojanof Aug 16, 2023 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

trojanof Aug 16, 2023 •

edited

Loading