Skip to content

Denis-Mukhanov/prosept_compare_service

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Реализация ML-решения

Хакатон PROSEPT: 1-е место в номинации "Лучшая работа DS"

Заказчик: ООО «ПРОСЕПТ» — российская производственная компания, специализирующаяся на выпуске профессиональной химии. Производство и логистический центр расположены в непосредственной близости от Санкт-Петербурга.

Описание проекта: Заказчик производит несколько сотен различных товаров, а затем продаёт эти товары через дилеров. Дилеры, в свою очередь, занимаются розничной продажей товаров в крупных сетях магазинов и на онлайн площадках. Для оценки ситуации, управления ценами и бизнесом в целом, заказчик периодически собирает информацию о том, как дилеры продают их товар. Для этого они парсят сайты дилеров, а затем сопоставляют товары и цены. Зачастую описание товаров на сайтах дилеров отличаются от того описания, что даёт заказчик. Например, могут добавляться новый слова (“универсальный”, “эффективный”), объём (0.6 л -> 600 мл). Поэтому сопоставление товаров дилеров с товарами производителя делается вручную.

Цель проекта: Разработка решения, на основе технического задания которое отчасти автоматизирует процесс сопоставления товаров. Основная идея - предлагать несколько товаров заказчика, которые с наибольшей вероятностью соответствуют размечаемому товару дилера. Предлагается реализовать это решение, как онлайн сервис, открываемый в веб- браузере. Выбор наиболее вероятных подсказок делается методами машинного обучения.

Основные методы, примененные при реализации проекта:

  • Streamlit
  • NLTK
  • TfidfVectorizer
  • BERT
  • SentenceTransformer

Результаты: В рамках проекта был разработан ML-продукт, автоматизирующих процесс сопоставления товаров, в частности:

  • Проанализированы данные, проведен инжиниринг признаков и подготовка их для обучения модели,
  • Настроены и обучины модели, выбрана оптимальная и оценино качество прогноза,
  • Реализована сборка и финализирован ML-продукт для запуска в продуктовое использование.

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 80.2%
  • Python 11.2%
  • TypeScript 8.1%
  • Other 0.5%