01.03.2024  •  Удалённая работа

Team Lead ML инженер (NLP)

Компания TWIN – ведущий международный разработчик ботов на базе искусственного интеллекта, а также инструментов для автоматизации бизнес-коммуникаций на единой платформе. С помощью наших решений компании выстаивают бесперебойные каналы коммуникации со своими клиентами, исключив человеческий фактор, существенно сократив затраты и повысив скорость обслуживания.

Наши клиенты: 2ГИС, Ростелеком, X5 Retail Group, ПЭК, Росгосстрах и еще больше 100 компаний из РФ, Испании, США и стран СНГ.

Сейчас мы активно развиваемся и ищем Team lead ML инженера, который сможет усилить нашу команду.

Чем предстоит заниматься:

Вы будете решать задачи в области NLP, NLU, NER и TTS сначала для русского, а затем для английского и других языков.

Например: нормализация/предварительная обработка и классификация текста, извлечение именованных сущностей, анализ тональности текста, исправление опечаток, определение границ предложений, расстановка ударений, перевод слов в фонемы, обработка дат, чисел и сокращений.

Так же, в зависимости от опыта и хотелок, могут быть более глубокие задачи по синтезу речи, по обработке аудио ]VAD, шумоподавление, детекция языка по речи) и/или по общей оптимизации производительности нейронных сетей. Также важной задачей является организация эффективной работы ML отдела.

Что для нас важно:

  • опыт решения NLP задач для русского языка не менее 3 лет;
  • понимание принципов ML/DL, базовых алгоритмов машинного обучения и архитектур нейронных сетей для решения NLP и/или TTS задач;
  • хорошее владение Python 3, в том числе опыт работы с популярными ML/около ML библиотеками ]TensorFlow/PyTorch, NumPy, Sklearn, SciPy, PyMorphy2, Yargy, Pandas и т.д.);
  • опыт разработки текстовых парсеров (для нормализации чисел, расшифровки сокращений, удаления мусора и прочего);
  • опыт разработки, тестирования и вывода моделей в production;
  • умение оценить качество построенной модели, как вручную, так и скриптами;
  • опыт настройки и использования Linux для ML разработки (в том числе с запуском моделей на GPU~;
  • опыт работы с Docker, Docker Compose и написания своих Dockerfiles;
  • опыт работы с Git, Jira, Confluence, Grafana, Kibana;
  • способности самостоятельно решать задачу и предлагать различные её решения, генерировать идеи по теме и около, любовь к ведению документации, комментированию кода и code review;
  • высшее техническое/математическое образование;
  • английский на уровне чтения CS-статей (B1 и выше).

Будет плюсом:

  • опыт разработки модулей для синтеза речи или решения смежных с TTS задач;
  • опыт работы с библиотеками Rasa NLU, spaCy, fasttext и ONNX Runtime;
  • опыт разработки масштабируемых RESTful веб-серверов с различными ML моделями (с использованием Flask/FastAPI~;
  • опыт оптимизации производительности ML моделей;
  • навыки запуска и обучения ML моделей на multi GPU машинах;
  • наличие собственных проектов с открытым исходным кодом, связанных с NLP и/или TTS;
  • опыт в обработке аудио (как файлов, так и потоков).

Что мы предлагаем:

  • Достойную заработную плату (ориентируемся на пожелания, опыт и навыки кандидата);
  • Удалённую работу (возможность работать из любой точки мира);
  • Гибкий график (возможность работать в любом часовом поясе);
  • Дружелюбную атмосферу, демократичное руководство и отсутствие излишней бюрократии.

Считаете себя подходящим кандидатом на эту вакансию?