Skip to content

Latest commit

 

History

History

vk_hse_hack

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 

Классификация новостных текстов с присвоением тегов

Задача

Разработать сервис для автоматической классификации новостей на 21 класс.

Решение

Обогатили датасет, добавив 56 000 новостных статей агентства «Интерфакс». Подготовили псевдо-разметку с использованием zero-shot классификации, обучили небольшую модель. Также использовали LLM Saiga3 8b для оценки соответствия статей каждому из 21 тегов. На основе обоих подходов развернули сервис с REST API для классификации текстов.

Моя роль

  • обогащение датасета
  • эксперименты с zero-shot classification моделями
  • обучение модели-классификатора
  • создание REST API
  • координация работы команды
  • презентация результатов

(презентация) (диплом победителя) (репозиторий)