Team Lead ML инженер (NLP)
Компания TWIN – ведущий международный разработчик ботов на базе искусственного интеллекта, а также инструментов для автоматизации бизнес-коммуникаций на единой платформе. С помощью наших решений компании выстаивают бесперебойные каналы коммуникации со своими клиентами, исключив человеческий фактор, существенно сократив затраты и повысив скорость обслуживания.
Наши клиенты: 2ГИС, Ростелеком, X5 Retail Group, ПЭК, Росгосстрах и еще больше 100 компаний из РФ, Испании, США и стран СНГ.
Сейчас мы активно развиваемся и ищем Team lead ML инженера, который сможет усилить нашу команду.
Чем предстоит заниматься:
Вы будете решать задачи в области NLP, NLU, NER и TTS сначала для русского, а затем для английского и других языков.
Например: нормализация/предварительная обработка и классификация текста, извлечение именованных сущностей, анализ тональности текста, исправление опечаток, определение границ предложений, расстановка ударений, перевод слов в фонемы, обработка дат, чисел и сокращений.
Так же, в зависимости от опыта и хотелок, могут быть более глубокие задачи по синтезу речи, по обработке аудио ]VAD, шумоподавление, детекция языка по речи) и/или по общей оптимизации производительности нейронных сетей. Также важной задачей является организация эффективной работы ML отдела.
Что для нас важно:
- опыт решения NLP задач для русского языка не менее 3 лет;
- понимание принципов ML/DL, базовых алгоритмов машинного обучения и архитектур нейронных сетей для решения NLP и/или TTS задач;
- хорошее владение Python 3, в том числе опыт работы с популярными ML/около ML библиотеками ]TensorFlow/PyTorch, NumPy, Sklearn, SciPy, PyMorphy2, Yargy, Pandas и т.д.);
- опыт разработки текстовых парсеров (для нормализации чисел, расшифровки сокращений, удаления мусора и прочего);
- опыт разработки, тестирования и вывода моделей в production;
- умение оценить качество построенной модели, как вручную, так и скриптами;
- опыт настройки и использования Linux для ML разработки (в том числе с запуском моделей на GPU~;
- опыт работы с Docker, Docker Compose и написания своих Dockerfiles;
- опыт работы с Git, Jira, Confluence, Grafana, Kibana;
- способности самостоятельно решать задачу и предлагать различные её решения, генерировать идеи по теме и около, любовь к ведению документации, комментированию кода и code review;
- высшее техническое/математическое образование;
- английский на уровне чтения CS-статей (B1 и выше).
Будет плюсом:
- опыт разработки модулей для синтеза речи или решения смежных с TTS задач;
- опыт работы с библиотеками Rasa NLU, spaCy, fasttext и ONNX Runtime;
- опыт разработки масштабируемых RESTful веб-серверов с различными ML моделями (с использованием Flask/FastAPI~;
- опыт оптимизации производительности ML моделей;
- навыки запуска и обучения ML моделей на multi GPU машинах;
- наличие собственных проектов с открытым исходным кодом, связанных с NLP и/или TTS;
- опыт в обработке аудио (как файлов, так и потоков).
Что мы предлагаем:
- Достойную заработную плату (ориентируемся на пожелания, опыт и навыки кандидата);
- Удалённую работу (возможность работать из любой точки мира);
- Гибкий график (возможность работать в любом часовом поясе);
- Дружелюбную атмосферу, демократичное руководство и отсутствие излишней бюрократии.