Краткий обзор разговорного ИИ, почему он полезен и как обстоят дела.

Почему чат-боты?

Этот звонок на самом деле мог быть сообщением. Я уверен, что я не единственный человек, который подумал об этом после телефонного звонка (или необходимости сделать его). Мы заняты, у нас есть дела, места, где можно побывать, и мы не хотим тратить время на то, чтобы поговорить с агентом по обслуживанию клиентов! Виртуальные помощники и чат-боты предлагают элегантный способ получения дополнительной информации (о продукте или услуге), решения проблем (например, технической поддержки) и назначения встреч, и это лишь некоторые из возможностей. Они устраняют время ожидания, поскольку каждый клиент может одновременно разговаривать с чат-ботом, и их можно персонализировать для каждого клиента, чтобы улучшить качество обслуживания клиентов. По крайней мере, это теория!

Несмотря на невероятные достижения в области обработки естественного языка за последние годы, чат-боты, к сожалению, все еще далеки от совершенства. Они оказались крепким орешком, особенно из-за отсутствия хороших данных для обучения. Многие недавние улучшения в других задачах НЛП можно отнести к успеху моделей трансформеров и трансферного обучения в целом. Таким образом, применение трансформеров для разработки чат-ботов можно считать идеей со значительным потенциалом. Это именно то, что Hugging Face сделала со своей диалоговой системой TransferTransfo и добилась впечатляющих результатов.

Модель TransferTransfo использует архитектуру Transformer и Transfer Learning для создания системы, способной не только общаться, но и формировать последовательную личность на основе нескольких входных предложений. В Skil AI мы заинтересованы в развитии этой идеи, чтобы увидеть, как мы можем помочь решить проблемы, стоящие как перед разработкой чат-ботов, так и перед адаптацией использования чат-ботов, чтобы помогать, а не мешать клиентам (не знаю, как вы, но неисправный чат-бот раздражает меня гораздо больше, чем ожидание разговора с реальным человеком!).

У нас есть много интересных идей, над которыми мы работаем, но в этой статье мы хотели поделиться своим опытом использования TransferTransfo. Мы взяли предварительно обученную (в Persona-Chat) модель TransferTransfo, добавили некоторые тонкие настройки и попробовали модель!

Джон Шеф

Одна из созданных нами личностей — работник ресторана по имени Джон. Личность была построена путем предоставления модели следующих предложений.

[
"my name is john .",
"i work at a restaurant .",
"our restaurant specializes in all kinds of burgers .",
"i like to talk with the customers .",
"i enjoy playing the violin .",
]

Завязавшийся разговор показан ниже.

Как видите, модель вполне способна построить последовательную (хотя и несколько эксцентричную) личность из входных предложений. Я не уверен, как бы я отнесся к тому, что шеф-повар играет на скрипке (плохо), пока я ем, но, по крайней мере, ему жаль меня!

Сара — студентка и агент по обслуживанию клиентов

Еще одну личность, которую мы создали, звали Сара. Вклад, данный для создания этой личности, приведен ниже.

"my name is sarah .",
"i work in customer care .",
"i interact with the customers to find out what we do right and what we do wrong .",
"i read a lot of books .",
"i am very curious about people and society ."

Модель сумела дополнить личность дополнительными деталями, чтобы создать довольно убедительную личность.

Меня особенно впечатлило, что модель решила, что Сара — студентка, которая работает неполный рабочий день в фирме по обслуживанию клиентов. По логике вещей, будучи студентом, человек может работать неполный рабочий день, а не полный. Кроме того, это, вероятно, означает, что у человека не так много времени на чтение, как ему хотелось бы, как указано в модели!

Последние мысли

Мы считаем, что TransferTransfo — многообещающее направление исследований в области разработки более реалистичных и полезных чат-ботов. Мы рады видеть, куда нас приведет это путешествие!

Я работаю консультантом Skil.ai по технологиям глубокого обучения и искусственного интеллекта. Являясь частью исследовательской группы Deep Learning в Skil.ai, мы работаем над тем, чтобы сделать ИИ доступным как для малого бизнеса, так и для крупных технологических компаний. Цель этой статьи — поделиться нашими знаниями.