Портфолио Data Science проектов
Разработать сервис для автоматической классификации новостей на 21 класс.
Обогатили датасет, добавив 56 000 новостных статей агентства «Интерфакс». Подготовили псевдо-разметку с использованием zero-shot классификации, обучили небольшую модель. Также использовали LLM Saiga3 8b
для оценки соответствия статей каждому из 21 тегов. На основе обоих подходов развернули сервис с REST API для классификации текстов.