01.03.2024 • Удалённая работа

Team Lead ML инженер (NLP)

Компания TWIN – ведущий международный разработчик ботов на базе искусственного интеллекта, а также инструментов для автоматизации бизнес-коммуникаций на единой платформе. С помощью наших решений компании выстаивают бесперебойные каналы коммуникации со своими клиентами, исключив человеческий фактор, существенно сократив затраты и повысив скорость обслуживания.

Наши клиенты: 2ГИС, Ростелеком, X5 Retail Group, ПЭК, Росгосстрах и еще больше 100 компаний из РФ, Испании, США и стран СНГ.

Сейчас мы активно развиваемся и ищем Team lead ML инженера, который сможет усилить нашу команду.

Чем предстоит заниматься:

Вы будете решать задачи в области NLP, NLU, NER и TTS сначала для русского, а затем для английского и других языков.

Например: нормализация/предварительная обработка и классификация текста, извлечение именованных сущностей, анализ тональности текста, исправление опечаток, определение границ предложений, расстановка ударений, перевод слов в фонемы, обработка дат, чисел и сокращений.

Так же, в зависимости от опыта и хотелок, могут быть более глубокие задачи по синтезу речи, по обработке аудио ]VAD, шумоподавление, детекция языка по речи) и/или по общей оптимизации производительности нейронных сетей. Также важной задачей является организация эффективной работы ML отдела.

Что для нас важно:

опыт решения NLP задач для русского языка не менее 3 лет;
понимание принципов ML/DL, базовых алгоритмов машинного обучения и архитектур нейронных сетей для решения NLP и/или TTS задач;
хорошее владение Python 3, в том числе опыт работы с популярными ML/около ML библиотеками ]TensorFlow/PyTorch, NumPy, Sklearn, SciPy, PyMorphy2, Yargy, Pandas и т.д.);
опыт разработки текстовых парсеров (для нормализации чисел, расшифровки сокращений, удаления мусора и прочего);
опыт разработки, тестирования и вывода моделей в production;
умение оценить качество построенной модели, как вручную, так и скриптами;
опыт настройки и использования Linux для ML разработки (в том числе с запуском моделей на GPU~;
опыт работы с Docker, Docker Compose и написания своих Dockerfiles;
опыт работы с Git, Jira, Confluence, Grafana, Kibana;
способности самостоятельно решать задачу и предлагать различные её решения, генерировать идеи по теме и около, любовь к ведению документации, комментированию кода и code review;
высшее техническое/математическое образование;
английский на уровне чтения CS-статей (B1 и выше).

Будет плюсом:

опыт разработки модулей для синтеза речи или решения смежных с TTS задач;
опыт работы с библиотеками Rasa NLU, spaCy, fasttext и ONNX Runtime;
опыт разработки масштабируемых RESTful веб-серверов с различными ML моделями (с использованием Flask/FastAPI~;
опыт оптимизации производительности ML моделей;
навыки запуска и обучения ML моделей на multi GPU машинах;
наличие собственных проектов с открытым исходным кодом, связанных с NLP и/или TTS;
опыт в обработке аудио (как файлов, так и потоков).

Что мы предлагаем:

Достойную заработную плату (ориентируемся на пожелания, опыт и навыки кандидата);
Удалённую работу (возможность работать из любой точки мира);
Гибкий график (возможность работать в любом часовом поясе);
Дружелюбную атмосферу, демократичное руководство и отсутствие излишней бюрократии.

Считаете себя подходящим кандидатом на эту вакансию?

Другие вакансии

12.03.2024 • Новосибирск

Свежие новости

25.07.2024

Микросервисная архитектура: способ организации комплексного программного обеспечения, когда оно состоит из совокупности микросервисов — небольших легко заменяемых модулей, каждый из которых решает свою задачу. За счёт этого достигается высокий уровень гибкости и адаптивности решений под изменяющиеся задачи.

Все термины