Резюме
Основное
| Имя | Михаил Васильев |
| Специальность | Data Scientist |
| gnu.xinm@gmail.com | |
| Телефон | +7 (916) 198-81-83 |
| Телеграм | @LaHundo |
| Сайт | https://onixlas.github.io/ |
| О себе | Deep learning инженер. NLP, CV, anomaly detection. Организатор DS-сообщества. Победитель хакатонов. Open source contributor |
Работа
-
2025.07 - н. в. Москва, Россия
-
2023.01 - 2025.07 Москва, Россия
старший специалист по машинному обучению
Makves
Проект: разработка и внедрение RAG-системы
Инструменты: LangChain, Ollama, Saiga, GigaChat, HuggingFace, FastAPI, Ragas
- разработал и внедрил RAG-систему для автоматизации обработки запросов заказчиков
- оптимизировал гиперпараметры системы с использованием библиотеки Ragas и LLM GigaChat
Проект: создание комплексного решения для обеспечения безопасности в корпоративной сети на основе неструктурированных данных
Инструменты: HuggingFace, YOLO, PyOD, Pandas, Sklearn, PyTorch, Lightning, NumPy, ONNX, FastAPI, Uvicorn, PyInstaller, Optimum, CatBoost, CVAT, natasha, BERT
- реализовал нейросетевой модуль для поиска нарушений закона о персональных данных, количество детектируемых классов увеличено с 14 до 36, accuracy top 1 увеличена до 98.9
- подготовил модуль для анализа содержимого отсканированных документов: поиск текста, таблиц, печатей, подписей и корпоративных бланков, количество классов увеличено с 5 до 19, mAP@.5 улучшен с .89 до .94
- реализовал поиск чувствительных данных в текстовых файлах, добавил модуль NER
- создал ансамбль алгоритмов для поиска аномалий на табличных данных, в том числе на временных рядах
- реализовал поиск чувствительных данных в аудио-файлах
- собрал и организовал разметку 8 датасетов для задач классификации и object detection
Пет-проекты
- 2024.05 - 2024.10
CheckDocAI
Телеграм-бот с ИИ модулем для контроля качества оформления документов для ООО «Гольфстрим», позволяет значительно сократить время на проверку и улучшить точность.
Инструменты: aiogram, YOLO, ONNX, Albumentations, CVAT
- Руководил командой из двух дата-сайентистов и бекенд-разработчика, отвечал за разработку и внедрение проекта.
- Проект успешно внедрён в коммерческую эксплуатацию, ежемесячная экономия — 40 человеко-часов.
Технологии
| Deep Learning | |
| PyTorch | |
| Lightning | |
| ONNX | |
| HuggingFace | |
| Optimum |
| NLP | |
| RAG | |
| LLM | |
| ragas | |
| Ollama | |
| Label Studio | |
| transformers | |
| natasha |
| Computer Vision | |
| object detection | |
| segmentation | |
| autoencoders | |
| UNet | |
| YOLO | |
| CVAT | |
| OpenCV | |
| PIL |
| Anomaly Detection | |
| PyOD | |
| PySAD | |
| ECOD | |
| HBOS | |
| iForest | |
| Exact-STORM | |
| Half-space Trees | |
| RRCF |
| Machine Learning | |
| scikit-learn | |
| CatBoost | |
| XGBoost | |
| faiss |
| Data analysis | |
| python | |
| SQL | |
| PostgreSQL | |
| MySQL | |
| pandas | |
| polars |
| Audio | |
| whisper | |
| hubert | |
| Common Voice |
| Data visualisation | |
| seaborn | |
| matplotlib | |
| plotly |
| MLOps & Deployment | |
| MLFlow | |
| AirFlow | |
| Docker | |
| Linux | |
| FastAPI | |
| pywin32 | |
| uvicorn | |
| pyinstaller |
Выступления
-
2025.05.24 Поиск аномалий с использованием Python: от теории к практике
Positive Hack Days
Доклад «Поиск аномалий с использованием Python: от теории к практике» представляет обзор ключевых алгоритмов обнаружения аномалий, их сильных и слабых сторон, и демонстрирует практическую ценность подхода на примере из области корпоративной безопасности.
-
2025 Серия докладов: Поиск аномалий в данных, алгоритмы
Moscow Python Meetup
В серии докладов наглядно описываются принципы работы основных алгоритмов поиска аномалий: HBOS, ECOD, Isolation Forest, PCA, kNN и LOF.
-
2024 NLP и CV нейросети в защите данных: опыт Makves DCAP
Moscow Python Meetup
В этом докладе я расскажу, как мы использовали алгоритмы CV и NLP для улучшения DCAP системы компании Makves, преодолевая вызовы обработки неструктурированных данных и продуктивизации моделей. Доклад будет полезен как пример реального внедрения нейросетей в работающий продукт.
Образование
-
2024.07 - 2024.10 Москва, Россия
-
2022.09 - 2023.03 Москва, Россия
-
2022.03 - 2022.11 Москва, Россия
-
2021.10 - 2022.03 Москва, Россия
повышение квалификации
Московский Авиационный Институт
Deep Learning
- Введение в искусственный интеллект и нейросети для авиационных приложений
-
2005.09 - 2008.05 Москва, Россия
-
2003.09 - 2009.02 Москва, Россия
Сертификаты
| Поколение Python. Базы данных и SQL | ||
| Stepik | 2025-01-17 |
| Асинхронный Python | ||
| Stepik | 2024-09-22 |
| Поколение Python. Курс для профессионалов | ||
| Stepik | 2024-06-30 |
| MLOps Bootcamp | ||
| ФКН НИУ ВШЭ | 2023-10-20 |
| Добрый, добрый Python ООП | ||
| Stepik | 2023-05-21 |
| SQL для Анализа Данных с Глебом Михайловым | ||
| Stepik | 2022-11-06 |
| Data Science с Глебом Михайловым | ||
| Stepik | 2022-09-16 |
| Feature Engineering | ||
| Kaggle | 2022-06-30 |
| Data Visualization | ||
| Kaggle | 2022-06-26 |
| Intermediate Machine Learning | ||
| Kaggle | 2022-06-02 |
| Основы статистики | ||
| Stepik | 2022-06-02 |
| Intro to Machine Learning | ||
| Kaggle | 2022-05-28 |
| Введение в Data Science и машинное обучение | ||
| Stepik | 2022-04-16 |
| Поколение Python. Курс для продвинутых | ||
| Stepik | 2022-04-02 |
Языки
| русский | |
| родной |
| английский | |
| B2 |
| немецкий | |
| B2 |
| эсперанто | |
| B2 |