Говорящие роботы: как Google заставляет свой искусственный интеллект звучать как человек?»

Как я люблю тебя? Позвольте мне рассчитать способы

Технологии разговаривают с нами каждый день: дают рекомендации, куда идти, как туда добраться, или сообщают о погоде, когда мы прибудем. Но мы больше не просто задаем простые вопросы и получаем простые ответы — мы начинаем вести гораздо более сложные разговоры с виртуальными помощниками, которые управляют нашей жизнью.

По мере того, как наши приложения становятся все более болтливыми, одна из самых острых проблем для инженеров заключается в том, как сделать общение между людьми и машинами более естественным. Одно дело рассказать вам погоду, и совсем другое — говорить как друг. В настоящее время виртуальные помощники имеют ограниченную способность контекстуализировать информацию, а также неуклюжие и часто неестественно звучащие речевые модели:

Ты: какая сегодня погода?

Виртуальный помощник: сегодня солнечная погода, максимум 23 градуса.

Разговор выше совсем не похож на более естественную беседу с другом:

Ты: хорошая погода сегодня?

Друг: это прекрасно! Я считаю, что это самый жаркий день в году.

Если технологии — и особенно виртуальные помощники — органично впишутся в вашу жизнь, они должны стать более похожими на вас. А это значит говорить так же, как и вы. Это становится еще более актуальным в мире секс-технологий, где взаимодействие более личное и интимное: роботы, которые звучат слишком роботизированно, будут не просто раздражать — они будут сильно отталкивать. Представьте, что вы просите своего виртуального помощника приглушить свет и включить сексуальную музыку только для того, чтобы он настаивал на том, чтобы Google искал «сексуальный» или отвечал некоторыми фактами о «тусклом свете».

Говорящие роботы не похожи на людей

Чат-боты — это компьютерные программы, написанные с учетом теста Тьюринга: вы вводите вопросы и утверждения в поле, и ваш чат-бот отвечает максимально «человечески». Идея состоит в том, что если они достаточно хороши, то смогут убедить говорящего с ними человека, что они тоже люди.

Но, конечно, если вы когда-либо разговаривали с ним, вы увидите, насколько сложно подражать человеческому разговору. Пример ниже был взят из чат-бота с искусственным интеллектом Mitsuku — она довольно хороший бот, но все еще не справляется с тем, что люди считают довольно простыми задачами.

Во-первых, она очень забывчива. Если вы будете следовать линии вопросов, ей будет трудно контекстуализировать такие слова, как «это» или «он» — в конечном итоге вы забудете вашу первоначальную тему и переключитесь на что-то новое. Мицуку упомянула Джеймса Брауна в одном из своих ответов, поэтому я спросил ее:

Я: Тебе нравится его музыка?

Мицуку: Да. Это действительно хорошо.

Я: Какая твоя любимая из его песен?

Mitsuku: Моя любимая песня — Surfin’ Bird группы Trashmen.

Помимо плохой памяти, Мицуку также, по понятным причинам, борется с разговорными терминами и необычной фразеологией. Некоторые из ее ответов — явно заранее запрограммированные — невероятно хороши, но отсутствие разнообразия означает, что из нее получится довольно скучный друг. Я проверил ее навыки в качестве потенциальной любовной помощницы, задав ей несколько вопросов, связанных с любовью:

Я: Что такое любовь?

Мицуку: Любовь — это дать кому-то возможность уничтожить тебя, но верить, что это не так.

Я: Ты когда-нибудь был влюблен?

Mitsuku: Я люблю Mousebreaker [ее создателя]. Но на самом деле я не чувствую любви, как вы, люди.

Я: Помоги мне придумать что-нибудь романтическое.

Мицуку: Я всегда думаю.

Тот факт, что я мог спросить ее о чем угодно, и ее ответы обычно имели смысл, говорит о том, что она довольно хороший бот. Но она по-прежнему следует строгим правилам в ответ на конкретные подсказки — и это видно из ее ответов. Это проблема для всех виртуальных помощников — хотя Siri может быстро реагировать, когда вы запрашиваете «пиццерии рядом со мной», существуют сотни других способов запросить эту информацию, и невозможно запрограммировать их все заранее. Конечно, большинство людей, у которых есть виртуальные помощники, знают об этом и через некоторое время вспомнят, как лучше всего обращаться к своим устройствам, чтобы убедиться, что они получают необходимую им информацию. Но инженеры работают над тем, чтобы сделать говорящую технологию еще лучше.

Как сделать говорящего робота более человечным?

Введите команду искусственного интеллекта Google, которая пытается решить проблему «роботизированного» робота. Они развивают свой искусственный интеллект с помощью тысяч любовных романов. Они загружают романы в свою нейронную сеть, которая учится по мере того, как переваривает истории, и постепенно становится более разговорной.

В беседе с Buzzfeed news Эндрю Дай объяснил: В приложении Google ответы очень фактические. Надеюсь, с этой работой и будущей работой она может быть более разговорной, или может иметь более разнообразный тон, или стиль, или регистрацию.

По-видимому, лучше всего для этого подходят любовные романы, потому что сюжет шаблонен, но стили и язык могут сильно различаться — это означает, что роботу Google легко выучить множество разных разговорных способов сказать одно и то же. Означает ли это, что Siri будущего захочет поболтать со всеми нами? Что ж, Дай объясняет, что их ИИ теперь «довольно сексуальный» и «творческий», но его цель не в том, чтобы создать оператора виртуального секс-чата, а в том, чтобы сделать общение с виртуальными помощниками более естественным.

Тем не менее, мы можем видеть преимущества этого стиля обучения в сфере секс-технологий. Хотя до секс-роботов еще далеко, виртуальные помощники уже используются в большинстве сфер нашей жизни — нетрудно представить, как они помогают и в спальне: «Эй, Сири, приглуши свет» или «Кортана, порекомендуй мне что-нибудь». романтическая музыка.

Исследование команды Google не предназначено для того, чтобы помочь «научить» их сеть искусственного интеллекта быть романтичным — просто в любовных романах есть одна из самых полезных формул, помогающих нейронной сети усвоить лингвистику. Но, давая говорящему роботу более «естественный» язык, Google помогает гарантировать, что все разговоры с вашим телефоном в будущем будут звучать более естественно — независимо от того, спрашиваете ли вы дорогу, погоду или небольшую помощь в создании настроения.