Бот ученый

По оценке отечественной компании-разработчика разговорного искусственного интеллекта Just AI, в конце 2022 года рынок разговорного ИИ дойдет до 2,2 млрд рублей, а к 2026 году может вырасти уже до 41 млрд рублей. Город уже принял чат-ботов (они сопровождают вас на госуслугах, например) или прямо сейчас работает над интеграцией. Что означает популярность чат-ботов? Это добровольная капитуляция человечества перед искусственным интеллектом — или торжество разума, организовавшего для себя бесконечное число своеобразных цифровых домашних эльфов? Возможно, и то и другое.

Чат-бот — это как?

Новостные агрегаторы каждый день разрываются от новостей о ChatGPT — новой и, пожалуй, самой интересной из существующих нейросетей, с которой можно действительно разговаривать. Она способна не только переваривать и оформлять пользовательские задачи и выдавать сухую информационную выжимку, но и, например, писать стихи. Вот ответ на запрос «напиши стихотворение про московский Китай-город в стиле Иосифа Бродского»: 

Московский Китай-город, здесь много китайцев.
И не только они, здесь живут и другие.
Здесь улицы узкие, здесь дома невысокие,
Здесь жизнь протекает как в тихой деревне.


В Китай-городе магазины, кафе, рестораны.
Здесь можно найти все, что нужно человеку.
И в ночное время, когда все города спят,
Здесь еще живет ночь, и здесь еще живут люди.


В Китай-городе много разных запахов.
От готовящейся еды до смолы и красок.
И хотя многое здесь устарело, уже не модно,
Все же Китай-город жив и все еще может ждать лучшее.

ChatGPT – нейросеть, которая может решать разные задачи именно через чат. Грубо говоря, тоже чат-бот – самый продвинутый из доступных широкой публике на данный момент. Он работает на основе генеративной модели GPT, которая позволяет боту понимать запросы, сделанные на естественных языках. К сожалению или к счастью, это буквально высшая ступень эволюции современного искусственного интеллекта, способного коммуницировать с людьми.

Денис Кузнецов, исследователь команды проекта DeepPavlov.ai, объясняет: «Диалоговые системы решают большое количество задач различной направленности, например выполнение конкретной команды («включить музыку», «заказать пиццу») или поддержание диалога на разные темы. Основное преимущество бота перед человеком — скорость решения поставленной задачи и удобство пользователя (чат-бот доступен круглосуточно). Например, бабушке нужно включить YouTube-канал, чтобы посмотреть любимые рецепты. Обычно с этим помогают внуки, но не всегда они рядом. Бабушка может использовать функцию голосового ввода поискового запроса в чат-боте, чтобы посмотреть нужное видео».

Чат-боты – те самые «идеальные» помощники, которые оперативно подскажут ответ на любой вопрос (в пределах норм права и морали), помогут сориентироваться в некоем продукте или задаче и дошкольнику, и пожилому человеку. Вопрос только в том, насколько широким может быть их применение, спектр решаемых задач и качество решений.

Краткая история чат-ботов

Традиционно развитие сферы искусственного интеллекта начинают с программиста Алана Тьюринга и двух его изобретений — ленточной «машины» и знаменитого теста, через который новые ИИ «гоняют» и сегодня. Тем не менее на чат-ботов, с которыми мы общаемся сегодня, машина Тьюринга похожа все-таки не была. 

Первый чат-бот появился в 1966 году и назывался «Элиза» (ELIZA). Программа напоминала разговор с психотерапевтом и использовала технику «активного слушания»: получала реплики от собеседника, перефразировала их и создавала ощущение диалога. Никакой новой информации, правда, она не продуцировала. В 1972 году «Элизу» прокачали в Parry – ответы программы стали напоминать речь шизофреника, и благодаря этому Parry смогла убедить некоторых пользователей в том, что она – человек с шизофренией, а не бот.

В течение второй половины XX века исследования компьютерной лингвистики и машинного обучения набирали обороты, пока наконец в 2001 году не появился язык разметки AIML (Artificial Intelligence Markup Language), созданный Ричардом Уоллесом, а еще раньше – чат-бот A.L.I.C.E., затем перепрограммированный на его основе. Этот язык позволял создавать полноценные шаблоны взаимодействия, которые используются и сегодня.

Набирающие популярность мессенджеры дали отличный фундамент для развития чат-ботов, а первооткрыватели технологии стали делиться наработками. Так, доступ к среде разработки голосовых помощников предоставили разработчики Amazon Alexa, Google Assistant, Яндекс, Just AI и DeepPavlov.

Сегодня сфера ИИ и чат-ботов развивается активнее, чем когда-либо: за 2022 году отрасль, по оценке The New York Times, привлекла больше инвестиций, чем за предыдущие пять лет в сумме. Теперь главный вызов специалистов ИИ – отработать понимание естественного языка (NLU) и генерацию ответов (NLG) на нем же.

Фото: Zuma / TASS

Deus in machina 

Чат-боты довольно сильно отличаются друг от друга по «начинке» и трудозатратам на их создание. Причем разница «налицо»: именно те чат-боты, которые отвечают человеку шаблонами и не позволяют использовать вариативные высказывания, как правило, особенно раздражают пользователей. При этом программы вроде ChatGPT, напротив, вызывают что-то среднее между восторгом и эффектом «зловещей долины».

Самые простые чат-боты действуют примерно как оператор из мыслительного эксперимента «Китайская комната».

Иными словами, у чат-бота будет ограниченный набор ответов, а своему собеседнику он, вероятно, предложит выбор не из слов, а из кнопок. Как правило, для создания такого чат-бота «архитектору» даже не нужно знать языков программирования: достаточно представлять, как работают логические блок-схемы.

В такие чат-боты вполне можно добавить элементы машинного обучения, которые облегчат жизнь разработчикам и улучшат взаимодействие ботов с пользователями. Например, программа может сравнивать высказывания пользователей с некой заданной базой, в которую те необязательно входят. Денис Кузнецов объясняет: «Можно поставить в соответствие формулировки намерений (например, фразы «хочу пиццу» или «дайте мне пиццу» являются примерами намерения пользователя получить пиццу). При этом вариативность диалога в таких системах сильно ограничена: создатель подобной диалоговой системы в принципе не может заранее предсказать все возможные варианты ответа пользователя на каждом шагу диалога. Поэтому прописывается  ограниченный набор возможных ответов, которые может обработать бот, для остальных запросов используются заглушки».

Другой вариант сделать коммуникацию с чат-ботом комфортнее — научить того извлекать важную информацию из пользовательских ответов. Например, паспортные данные, даты, названия, определять тематику высказываний (политика, технологии, фильмы, музыка и т.д.), эмоциональную тональность высказываний.

Есть боты, которые отвечают не по заданным сценариям и к тому же не всегда работают по одним и тем же моделям. Денис Кузнецов перечисляет варианты:

  • Генеративные модели. (ChatGPT, GPT-3, BLOOM, ruGPT-3 и другие). «Сами создают ответ по запросу пользователя, пишут его слово за словом, опираясь на контекст диалога и разные источники информации». 
  • Ретривные модели. «По запросу извлекают из некой базы знаний (например, из Википедии или персональной базы знаний) уже готовую информацию. Такие системы внутри чат-бота могут глубже понимать контекст и выдавать гораздо более вариативные ответы».
  • Гибридные модели. Они объединяют два предыдущих формата.

Еще есть продвинутые multiskill-системы («Алиса», «Олег», «Amazon Alexa», «Google Assistant», DeepPavlov Dream). «Они могут объединять в себе все описанные выше подходы для решения широкого спектра задач диалоговых систем. Именно такие сложные системы, объединяющие лучшие подходы в разговорном ИИ для решения различных задач, неискушенный пользователь чаще всего считает сильным ИИ».

Создавать такие продвинутые диалоговые системы — сложно, долго и затратно. Кроме того, практически ни в одной системе пока не выстроена отрегулированная модель самообучения в режиме реального времени. Увы, но сегодняшние продвинутые чат-боты обходятся ограниченным объемом текстов.

Фото: watchmeforever / Twitch

К тому же сложные нейросети часто подкручивают и цензурируют, чтобы те не выдали какой-нибудь нежелательный тезис. Так, например, ChatGPT, которая транслировала на платформе Twitch бесконечный сериал Nothing, Forever, ушла на доработку авторами: один из персонажей заявил, что «трансгендерность — это психическое заболевание», а «все либералы — геи». То есть обучение уже работающих нейросетей происходит, скорее, на основе пользовательского фидбэка, да и от учителей избавиться пока не получается — программам нужны ИТ-специалисты.

Где встретить бота

Сегодня чат-боты — настоящие проводники вообще куда угодно. Для города, например, создают концепции ботов-экскурсоводов. Для поддержания психического здоровья — ботов-психотерапевтов. Для тех, кто жаждет общения, — ботов, подбирающих компанию на обед.

Если очень хочется, чат-бот даже может обратиться кем-то давно умершим: в новой реальности Ленин не гриб, Ленин — бот.

Другой пример «социального» бота — Альфа-Друг, совместный проект Альфа-Банка и Ассоциации «Благополучие животных». Его задача — выдавать проверенную информацию по наиболее частым запросам, связанным с животными, как домашними, так и бродячими и даже дикими. Если ситуация экстренная или инструкции не нашлось, пользователь может прямо из бота связаться с нужным экспертом Ассоциации «Благополучие животных» – ветеринаром, зоопсихологом или юристом.

Руководитель отдела бренда и благотворительности Альфа-Банка Кристина Вдовина рассказывает, что их бот практически не требует вложений: «Мы не делали сложную структуру. Конечно, провели подготовительную работу, проанализировали, что вообще интересует людей, какие вопросы возникают чаще всего. Мы общались с зоощитниками, сотрудниками приютов, ветеринарами, экспертами по поведению животных. И уже после этого создали чат-бот с набором инструкций и возможностью быстрого выхода на консультанта. Важно успокоить пользователя, который столкнулся с травмой питомца, нападением или жестоким обращением с животными, — и тут эксперт справится гораздо лучше искусственного интеллекта».

Фото: Freepik

Большинство современных чат-ботов работают в такой логике «удобства». Разработчик коммерческих чат-ботов Вадим Капустин перечисляет их главные плюсы:

  • позволяют обрабатывать множество повторяющихся запросов пользователей;
  • отвечают на запросы в любое время суток;
  • автоматически собирают информацию о пользователях;
  • легко интегрируются в мессенджеры и на сайты;
  • экономят ресурсы компании.

Как замечает эксперт, чат-бота просто разработать даже без привлечения специальных компаний. По сути, его логическая структура прописывается вручную. «Вопрос в том, сколько времени этому хочется уделить. Работая в одиночку, можно потратить месяц, а в команде, распределив зоны ответственности, — неделю». За одного простого чат-бота, по словам Вадима Капустина, компания может получить от 50 тыс. до 80 тыс. рублей.

Самое приятное — в бота редко когда приходится вкладываться ежемесячно.

Исключение — проекты, которые практически полностью опираются именно на взаимодействие пользователей с диалоговыми системами. Ольга Малюк, директор по развитию бизнеса Random Coffee, говорит: «На наш объем аудитории (90 тыс. — Прим. ред.) мы тратим до сотни тысяч рублей в месяц на сервера. При кратном росте затраты вырастут — нелинейно, но вырастут. Поскольку у нас платный продукт, который мы постоянно развиваем, добавляем новые фичи, доработки и поддержка неизбежны, без них проект впадет в кому: сердце бьется, но идти вперед невозможно».

Робот сочинит симфонию?

Да, современные нейросети могут писать стихотворения, но есть нюанс: безусловно назвать их «сильными» ИИ все еще нельзя. «Некоторые считают, что «сильный ИИ» — такой, который обладает осознанностью. Другие отмечают в качестве его отличительных особенностей возможности совместного использования информации разного типа (изображение, текст, звук) или обучения по ходу диалога, — говорит Денис Кузнецов. — Сейчас есть системы, которые обладают элементами персонализации, используют мультимодальные модели, работающие с разными типами информации. Тем не менее обладающие этими качествами модели пока не могут решать задачи на уровне человека. На текущий момент полноценного решения, которое обладает всеми перечисленными качествами одновременно и способно выполнять широкий круг задач лучше, чем человек, пока нет».

Фото: Frank Rumpenhorst / DPA / Picture-Alliance / TASS

Визионер открытого ИИ и автор бота-психолога «Сабина» Виктор Носко объясняет: «Технология движется в сторону того, чтобы быть помощниками, а не заменителями. Мы не можем называть существующий ИИ «сильным», потому что у него нет целеполагания, рефлексии, долгосрочной памяти. Плохо работает фактология и так далее. Там, где нужно шевелить мозгом, чат-боты людей не заменят, но станут удобными помощниками». Правда, по мнению Виктора Носко, в будущем, если ИИ продолжат развиваться, лишиться работы в худшем для «кожаных мешков» случае могут психологи в B2B, программисты-джуниоры, аналитики данных, юристы. 

В ближайшее время мы можем ждать серьезной трансформации ландшафта поисковых систем. Согласно инсайдерской информации The New York Times, новости о том, что чат-бот начал приобретать массовую популярность, вызвали настоящую панику в головном офисе Google. Другая корпорация-гигант уже суетится: Microsoft планирует инвестировать в компанию OpenAI, разрабатывающую ChatGPT, до $10 млрд, и объявила о внедрении ChatGPT в их поисковик Bing. Когда объем инвестиций будет возмещен прибылью, 49% акций OpenAI отойдет Microsoft.

А вот сюжеты из «Терминатора» представить совсем сложно — надеемся, что все ИИ программируются с оглядкой на законы робототехники Айзека Азимова. По крайней мере, они точно не дают советов по уничтожению человечества. Впрочем, Денис Кузнецов добавляет: «В целом, на мой взгляд, перспективы ИИ можно ограничить только воображением. И темпами технического прогресса».