Цифровой прорыв 2024 (всероссийский)

В рамках хакатона был разработан интеллектуальный помощник оператора службы поддержки RuTube

Задача

Разработать RAG-систему для автоматизации работы технической поддержки RuTube

Команда проекта

  • Михаил Васильев
  • старший специалист по машинному обучению
  • Маквес
  • @LaHundo
  • Александр Евдокимов
  • ведущий разработчик-лингвист
  • Эвотор
  • @snakerzr
  • Ольга Иванова
  • data scientist
  • open to work
  • @oakarabut
  • Анастасия Юдина
  • эксперт по исследованию данных
  • Сбер
  • @hug_asya02

Технологии

gpt, mistral nemo, fastapi, aiogram

Решение

Расширили датасет синтетическими данными, созданными GPT-4o. Обучили на полученных данных две модели-классификатора. Также произвели файн-тюнинг модели-эмбеддера. Развернули RAG-систему на базе модели Mistral-Nemo. Развернули REST API и телеграм-бота для получения результатов генерации.

Моя роль

  • обучил модели-классификаторы
  • произвёл файн-тюнинг модели-эмбеддера
  • развернул REST API
  • презентовал результаты

Презентация