+{"основное":{"имя":"Михаил Васильев","специальность":"Data Scientist","image":"mvasiljev.jpg","email":"gnu.xinm@gmail.com","телефон":"+7 (916) 198-81-83","телеграм":"LaHundo","сайт":"https://onixlas.github.io/","о себе":"Deep learning инженер. NLP, CV, anomaly detection. Организатор DS-сообщества. Победитель хакатонов. Open source contributor","location":{"city":"Москва","countryCode":"RU"}},"работа":[{"name":"Маквес Групп","position":"старший специалист по машинному обучению","location":"Москва, Россия","url":"https://makves.ru","startDate":"2023-01","summary":"<p>Проект: создание комплексного решения для обеспечения безопасности в корпоративной сети на основе неструктурированных данных</p><p>Инструменты: python, transformers, EfficientNet, MobileNet, YOLO, PyOD, pySAD, pandas, sklearn, pytorch, lightning, catboost, numpy, matplotlib, plotly, huggingface, onnx, fastapi, uvicorn, pyinstaller, pywin32, optimum, airflow, mlflow, cvat, natasha, deeppavlov, BERT, whisper, Ollama</p>","highlights":["реализовал нейросетевой модуль для поиска нарушений закона о персональных данных, количество детектируемых классов увеличено с 14 до 36, accuracy top 1 увеличена до 98.9","подготовил модуль для анализа содержимого отсканированных документов: поиск текста, таблиц, печатей, подписей и корпоративных бланков, количество классов увеличено с 5 до 19, mAP@.5 улучшен с .89 до .94","реализовал поиск чувствительных данных в текстовых файлах, добавил модуль NER","создал ансамбль алгоритмов для поиска аномалий на табличных данных, в том числе на временных рядах","реализовал поиск чувствительных данных в аудио-файлах","собрал и организовал разметку 8 датасетов для задач классификации и object detection"]}],"пет-проекты":[{"name":"CheckDocAI","summary":"<p>Телеграм-бот с ИИ модулем для контроля качества оформления документов</p><p>Инструменты: aiogram, yolo, onnx, albumentations, cvat</p>","highlights":["руководил командой из двух дата-сайнтистов и бекенд-разработчика","проект завершён и внедрён в коммерческую эксплуатацию","ежемесячная экономия — 40 человеко-часов"],"startDate":"2024-05-18","endDate":"2024-10-21","url":"https://onixlas.github.io/projects/check_doc_ai/"}],"технологии":[{"name":"Deep Learning","keywords":["PyTorch","Lightning","ONNX","HuggingFace","Optimum"]},{"name":"NLP, NER","keywords":["Ollama","Label Studio","transformers","deeppavlov","natasha","yargy parser","bert"]},{"name":"Computer Vision","keywords":["object detection","segmentation","autoencoders","UNet","YOLO","CVAT","EfficientNet","MobileNet"]},{"name":"Audio","keywords":["whisper","hubert","Common Voice"]},{"name":"Machine Learning","keywords":["scikit-learn","CatBoost","XGBoost","faiss"]},{"name":"Anomaly Detection","keywords":["PyOD","PySAD","ECOD","HBOS","iForest","Exact-STORM","Half-space Trees","RRCF"]},{"name":"Data analysis","keywords":["python","SQL","PostgreSQL","MySQL","pandas","polars"]},{"name":"Data visualisation","keywords":["seaborn","matplotlib","plotly"]},{"name":"MLOps & Deployment","keywords":["MLFlow","AirFlow","Docker","Linux","FastAPI","pywin32","uvicorn","pyinstaller"]}],"выступления":[{"name":"Опыт обучения и применения нейросетей в качестве модуля российской DCAP системы","publisher":"Moscow Python Meetup","releaseDate":"2024-06-25","url":"https://www.youtube.com/watch?v=VMDWjJoT8yE","summary":"Компания Makves (входит в группу компаний «Гарда») разрабатывает российскую DCAP (data-centric audit and protection) систему для защиты корпоративных данных. Для анализа неструктурированных данных необходимо применять нейросети. В докладе я рассказал о проблемах, с которыми мы столкнулись при создании нейросетей, от этапа сбора и разметки данных и до создания нескольких микросервисов."}],"образование":[{"institution":"Московский Авиационный Институт","location":"Москва, Россия","url":"https://mai.ru/","area":"Физика","studyType":"специалитет","startDate":"2003-09","endDate":"2009-02","courses":["Авиационная и ракетно-космическая теплотехника"]},{"institution":"Московский Авиационный Институт","location":"Москва, Россия","url":"https://mai.ru/","area":"Лингвистика","studyType":"специалитет","startDate":"2005-09","endDate":"2008-05","courses":["Перевод и переводоведение"]},{"institution":"Яндекс Практикум","location":"Москва, Россия","url":"https://practicum.yandex.ru/","area":"Машинное обучение","studyType":"профессиональная переподготовка","startDate":"2022-03","endDate":"2022-11","courses":["Специалист по Data Science"]},{"institution":"Deep Learning School ФПМИ МФТИ","location":"Москва, Россия","url":"https://dls.samcs.ru/","area":"Deep Learning","studyType":"профессиональная переподготовка","startDate":"2022-09","endDate":"2023-03","courses":["Computer Vision"]},{"institution":"Московский Авиационный Институт","location":"Москва, Россия","url":"https://mai.ru/","area":"Deep Learning","studyType":"повышение квалификации","startDate":"2021-10","endDate":"2022-03","courses":["Введение в искусственный интеллект и нейросети для авиационных приложений"]},{"institution":"УЦ «Специалист»","location":"Москва, Россия","url":"https://www.specialist.ru/","area":"Анализ данных","studyType":"повышение квалификации","startDate":"2024-07","endDate":"2024-10","courses":["Анализ данных на языке SQL"]}],"сертификаты":[{"name":"Поколение Python. Курс для продвинутых","date":"2022-04-02","issuer":"Stepik","url":"https://stepik.org/cert/1460043"},{"name":"Поколение Python. Курс для профессионалов","date":"2024-06-30","issuer":"Stepik","url":"https://stepik.org/cert/2511973"},{"name":"Добрый, добрый Python ООП","date":"2023-05-21","issuer":"Stepik","url":"https://stepik.org/cert/2071046"},{"name":"Основы статистики","date":"2022-06-02","issuer":"Stepik","url":"https://stepik.org/cert/1535940"},{"name":"Введение в Data Science и машинное обучение","date":"2022-04-16","issuer":"Stepik","url":"https://stepik.org/cert/1479747"},{"name":"Data Science с Глебом Михайловым","date":"2022-09-16","issuer":"Stepik","url":"https://stepik.org/cert/1673640"},{"name":"SQL для Анализа Данных с Глебом Михайловым","date":"2022-11-06","issuer":"Stepik","url":"https://stepik.org/cert/1753578"},{"name":"Асинхронный Python","date":"2024-09-22","issuer":"Stepik","url":"https://stepik.org/cert/2585570"},{"name":"MLOps Bootcamp","date":"2023-10-20","issuer":"ФКН НИУ ВШЭ","url":"https://github.com/onixlas/DS_portfolio/blob/main/certificates/hse_mlops.png"},{"name":"Intro to Machine Learning","date":"2022-05-28","issuer":"Kaggle","url":"https://www.kaggle.com/learn/certification/salutonkielvifartas/intro-to-machine-learning"},{"name":"Intermediate Machine Learning","date":"2022-06-02","issuer":"Kaggle","url":"https://www.kaggle.com/learn/certification/salutonkielvifartas/intermediate-machine-learning"},{"name":"Data Visualization","date":"2022-06-26","issuer":"Kaggle","url":"https://www.kaggle.com/learn/certification/salutonkielvifartas/data-visualization"},{"name":"Feature Engineering","date":"2022-06-30","issuer":"Kaggle","url":"https://www.kaggle.com/learn/certification/salutonkielvifartas/feature-engineering"}],"языки":[{"language":"русский","fluency":"родной"},{"language":"английский","fluency":"B2"},{"language":"немецкий","fluency":"B2"},{"language":"эсперанто","fluency":"B2"}]}
0 commit comments