Михаил Васильев

Портфолио Data Science проектов


Project maintained by onixlas Hosted on GitHub Pages — Theme by mattgraham

Классификация новостных текстов с присвоением тегов

Задача

Разработать сервис для автоматической классификации новостей на 21 класс.

Решение

Обогатили датасет, добавив 56 000 новостных статей агентства «Интерфакс». Подготовили псевдо-разметку с использованием zero-shot классификации, обучили небольшую модель. Также использовали LLM Saiga3 8b для оценки соответствия статей каждому из 21 тегов. На основе обоих подходов развернули сервис с REST API для классификации текстов.

Моя роль

(презентация) (диплом победителя) (репозиторий)