Нейросети: может ли компьютер работать как мозг?
Человеческий мозг — чрезвычайно сложное устройство, наиболее «продвинутый» орган тела. Универсальность его работы и впечатляющие результаты обеспечиваются, тем не менее, довольно простой архитектурой: есть нейроны, отвечающие за реакцию на сигнал (возбуждение), и есть связи между ними, по которым сигнал передаётся — синапсы. Именно головоломная топология этих связей обеспечивает столь колоссальные возможности мозга.
Копируя природу
Моделируя работу человеческого сознания (подробнее об этом в статье про искусственный интеллект), компьютерщики решили попробовать повторить эволюционные изобретения природы. Так появились технологии нейронных сетей. Их архитектура повторяет принцип действия сетей нервных клеток биологического организма.
Нейросеть представляет собой большое количество простых процессоров, соединённых между собой сложной системой связей. Каждый процессор (по сути, искусственный нейрон) способен принимать простые сигналы, обрабатывать их по простому правилу и передавать результат дальше. Мощь системы — именно в топологии связей, в том, как усложняется эта «паутина» по мере обучения системы и решения задач. Полная аналогия с мозгом — здесь обучение тоже базируется не на числе нейронов, но на росте связей между ними.
Поэтому нейросети не программируются в классическом смысле — они обучаются. И это создаёт им одно из главных преимуществ перед традиционными алгоритмами. Такое обучение заключается в установлении коэффициентов связей между искусственными нейронами (то есть, каждый синапс имеет свой «вес»).
На этапе обучения нейросеть тренируется выявлять сложные зависимости между входными данными и выходными, а также обобщать их в случае неполноты. Поэтому, пройдя обучение на задачах определённой темы, далее нейросеть способна быстро и эффективно решать задачи в той же теме, которых она раньше не встречала. При этом всё лучше и лучше справляясь с данными, которые неполны или «зашумлены», т.е. содержат искажения и ошибки.
Пример из жизни:
99% читателей этой статьи хоть раз да сталкивались с Гугл-капчей. Забавно, но убеждать «Я не робот» вам приходится именно робота. Обратите внимание: раньше капча показывала картинки предметов, цифры, буквы, а теперь всё чаще — картинки с дефектами, искажениями, низкой разборчивости. Все мы, проходя капчу, участвуем в обучении нейросети (которая за ней кроется) распознавать изображения.
Шумим, братцы, шумим!
В технологиях разработки Твин-ботов нейросети принимают самое непосредственное участие. Распознавание речи — одна из задач, которые им по плечу. В самом деле, понять, что говорит человек, не так просто: даже дети учатся этому несколько первых лет своей жизни. К сложности грамматических и синтаксических конструкций языка (а в каждом языке они свои) добавляется и неполнота, и синонимичность слов и выражений, и эмоциональный окрас (например, ирония, когда в определённом контексте сказанное может иметь совершенно противоположное значение). Прибавьте к этому помехи связи, уличный шум, ветер — словом, задача очень трудная. Классическими алгоритмами её запрограммировать невозможно. А нейросети год от года справляются всё лучше.
К примеру:
Собственные технологии компании TWIN позволили повысить качество распознавания речи голосовыми Твин-ботами до 96%.
В прикладных коммерческих задачах мало понять, что сказал человек, — нужно ещё понять, что он при этом хотел. То есть, выявить в его речи (письменной или устной) намерения. Распознавание намерений — следующая технология, которая лежит в основе Твин-ботов. Именно она позволяет составлять гибкие сценарии диалогов и вести ботам полноценные беседы при звонках на горячую линию в колл-центр или обращениях в службу поддержки.
Кстати, после распознавания это уже второй класс задач, в которых хороши нейросети, — классификация. То есть, мы не просто распознаём предмет, сущность, смысл, но и относим его к той или иной категории объектов.
Есть и третий класс задач — прогнозирование. Это когда нейронной сети на вход подаётся информация о какой-то последовательности обусловленных событий, и на основании их нейросеть предсказывает, какие события имеют большую вероятность случиться дальше. По мере обучения и тренировки такие прогнозы становятся всё точнее.
И ещё важное отличие технологии нейросетей от классических алгоритмов — они требуют меньше ресурсов, а значит, и менее энергозатратны.
По образу и подобию
Мало научиться распознавать и понимать речь — чтобы диалог был полноценным, нужен такой же человекоподобный уровень ответов. И это тоже сфера применения нейросетей.
Ответ должен быть по существу — то есть на правильно распознанный запрос должен быть моментально подготовлен соответствующий ответ. Поскольку все возможные ответы заранее не запишешь, требуется синтез речи. Однако, синтезированные голоса первых поколений звучали очень неестественно, с неверными ударениями, без интонаций. Собеседнику-человеку такое, разумеется, доставляет дискомфорт. Так что боты нового поколения — такие как твины — учатся говорить с интонацией и даже эмоциями. В результате возникает естественное звучание реплик, и абонент уже не всегда может понять, что общается с ботом.
Пример из жизни:
Во время тестирования в 2012 году чат-бот «Евгений Густман», имитирующий мальчика-одессита, сумел убедить более 20% экспертов в том, что он является реальным человеком. Уже через 3 года «Соня Гусева» обманула 47% судей.
Подытоживая: моделируя то, как устроено человеческое мышление, восприятие и обработка сигналов нервной системой, компьютерные технологии получают и возможность решать задачи, которые по плечу человеку: распознавать, понимать, создавать новое. Работа с твин-ботами — это ваша возможность прикоснуться к передовым технологиям нейросетей.