Краткий обзор нового цифрового помощника Oracle

И какое место чат-бот Oracle в ландшафте диалогового ИИ?

Введение

Ровно два года назад я написал две статьи об Oracle Digital Assistant (ODA). Одним из высказанных критических замечаний было то, что намерения и объекты не были тесно связаны.

Многое изменилось в отношении ODA с точки зрения функциональности и соответствия тому, что в настоящее время поддерживается в качестве передовой практики в рамках чат-ботов.

В своей простейшей форме Oracle Digital Assistant состоит из пяти элементов. Намерения и сущности, компоненты, которые могут быть встроенными или настраиваемыми. Диалоговый поток, который может быть разработан графически или с помощью языка уценки. И, наконец, интеграция каналов.

Две области, на которых ODA мог бы сосредоточиться, — это аннотация сущностей в примерах произнесения намерений. И сделать Visual Flow Designer более интерактивным с точки зрения прямого взаимодействия с холстом дизайна.

Возможность выбрать инструмент Visual Flow Designer для создания диалоговых потоков, а не только параметр YAML для записи состояний диалогов в OBotML, является значительным шагом вперед. Но требуется некоторое улучшение; подробнее об этом позже.

Пропустить до конца для общей критики и соображений…

Доступ к Oracle Digital Assistant

Простота доступа определенно не является одним из преимуществ Oracle Digital Assistant (ODA). Особенно по сравнению с бесплатным и полным доступом Cognigy, Kore AI, Nuance Mix и другими. Даже по сравнению с корпоративными облачными решениями, такими как AWS, IBM Watson Assistant и другими.

Регистрация начальной учетной записи выполняется довольно быстро. Количество бесплатных сервисов на этом бесплатном уровне ограничено и не включает никаких инструментов AI или Analytics.

Обновление моей учетной записи до платной версии заняло 24 часа. Это меркнет по сравнению со скоростью других корпоративных облачных решений, таких как Azure, AWS, IBM Cloud и т. д.

Создание экземпляра цифрового помощника занимает некоторое время (к счастью, минуты, а не часы), это действительно подчеркивает исключительную эффективность, скорость и организованный процесс адаптации других платформ.

Что нового?

  • Самым большим изменением является добавление Visual Designer в составе Digital Assistant Release 22.04 около месяца назад. Как показано ниже, при создании навыка существует возможность выбора между режимом YAML или визуальным диалоговым режимом.

  • Этот новый визуальный конструктор помогает визуально проектировать диалоговые потоки с подходом без кода к минимальному коду.

  • Создавайте отдельные потоки для каждого намерения, создавайте подпотоки и многократно используемые служебные потоки, чтобы упростить проектирование и обслуживание диалоговых потоков. Идея отдельных потоков по намерениям немного напоминает Cognigy.

  • Новая функция «Знания» позволяет быстро создавать намерения для ответов из источников PDF/HTML, содержащих текст в формате вопросов и ответов. Принимайте пары вопросов и ответов из источников PDF/HTML и автоматически генерируйте ответы.
  • Структура добавлена ​​к намерениям с быстрыми ответами внутри намерения. Намерения могут быть включены или выключены. Намерения могут быть многоязычными с быстрыми ответами внутри намерения.
  • Эти быстрые ответы, которые могут превратиться в сервис QnA. Быстрые ответы также могут содержать беседу без участия потока.
  • Автозаполнение позволяет использовать высказывания для автоматического завершения предложений. Это реализация больших языковых моделей, в которой доступны полные варианты предложений. Автозаполнение сводит к минимуму ошибки пользователя, предоставляя эффективные фразы, которые можно использовать как для прямого ввода, так и в качестве предложений.
  • Функция справки в ODA очень ненавязчива и не заставляет пользователя идти по определенному пути или последовательности событий. Но по мере того, как ваш процесс разработки разворачивается, появляются различные сообщения, которые направляют пользователя к возможному следующему шагу.

Языки

  • Поддерживается поразительное количество языков. Это делается как через службу поддержки Native, так и через службы перевода.
  • Служба перевода включает такие языки, как африкаанс, зулу и коса,
  • венда, тсвана, цонга, свати, шона, сесото, лингала и др.
  • Поддержка родного языка поддерживает меньшее количество языков непосредственно в лингвистической модели без какого-либо уровня перевода.
  • Для использования службы перевода необходимо настроить ключ службы перевода от Google или Microsoft для своего экземпляра цифрового помощника. Входящие сообщения пользователей переводятся на базовый язык, настроенный для навыка. Базовый язык – это язык, который вы используете для обучения модели. Для переводческих услуг чаще всего используется английский язык. Преимущество использования услуг перевода на данный момент заключается в том, что они поддерживают больше языков, чем поддержка родного языка. Ключевыми факторами здесь являются масштабирование и управление. Слой перевода вводит дополнительный уровень потенциальной непредсказуемости.

Обучение

ODA также фокусируется на времени обучения и поиске решений для сокращения времени обучения, особенно во время тестирования разработки.

Trainer Ht удобно использовать на ранних этапах разработки, когда у вас нет хорошо продуманного и сбалансированного набора тренировочных высказываний, так как он обучается быстрее и требует меньшего количества высказываний.

Используйте Trainer Tm, как только вы соберете от 20 до 30 высококачественных высказываний для каждого намерения в навыке. Это также модель, которую вы должны использовать для серьезного тестирования разговоров и при развертывании вашего цифрового помощника в рабочей среде.

ODA имеет параметр validate, который можно выполнить для проверки базовой логики в приложении.

Сущности

Сущности тесно связаны с намерениями, теперь это общая черта в рамках диалогового ИИ. Снова приходит на ум Cognigy, где намерения и сущности тесно связаны с частями потока.

ODA также поддерживает различные типы сущностей.

Простые объекты – это числа, электронная почта и да/нет.

Сложные сущности включают адрес, время, дату, продолжительность, валюту.

Доступны правила разрешения неоднозначности для времени и даты.

К настраиваемым объектам относятся:

  1. Композитный мешок
  2. Объекты машинного обучения
  3. Объекты списка значений
  4. Динамические объекты
  5. Регулярное выражение
  6. Список объектов
  7. Полученный

Наиболее примечательными являются Производные объекты. Производный объект является дочерним элементом встроенного объекта или другого объекта, который вы определяете.

Сущность ML (машинное обучение) использует модель для идентификации значений сущности в пользовательском сообщении.

Составной пакет — это группа связанных сущностей, которые можно рассматривать как единое целое в рамках разговора. Использование составных пакетов позволяет извлекать значения для нескольких сущностей в одном высказывании пользователя, что позволяет разговору проходить более естественно.

Документы знаний

Вы можете загружать документы, содержащие ряд вопросов и ответов, чтобы сгенерировать намерения ответов для каждого вопроса. Документы базы знаний могут быть в формате HTML или PDF.

Функция «Вопросы и ответы» позволяет вашему навыку отвечать на общие вопросы, возвращая одну или несколько пар вопросов и ответов. Это способ использовать навыки для отображения часто задаваемых вопросов или других документов базы знаний.

Добавление модуля вопросов и ответов к вашему навыку позволяет ему оценить, предназначен ли пользовательский ввод для транзакции («Какой мой баланс?») или для ответа на вопрос («Какой адрес банка?»), а затем ответить соответствующим образом.

Заключение и общие соображения

Добро

  • Функциональность добавляется к намерениям, более богатому управлению и настройке намерений.
  • Функциональность также добавляется к сущностям, стирая границы между намерениями, сущностями, диалоговым потоком и сообщениями.
  • Намерения и объекты кажутся связанными, что приводит к повышению точности.
  • Намерения связаны с разделами потока, что также соответствует передовой практике Gartner.
  • Доступен инструмент визуального проектирования для проектирования и управления состоянием диалогового потока.
  • Сосредоточьтесь на отсутствии кода и низком уровне кода.
  • В зависимости от задачи диалогового дизайна можно выбрать визуальный инструмент или инструмент разработки диалогов YAML.
  • Богатая функциональность сущностей в виде сущностей ML, вложенных или вложенных сущностей. Производные и дочерние сущности.
  • Различные варианты обучения модели, поддерживающие быстрое итеративное тестирование.
  • Два подхода к ботам вопросов и ответов и базам знаний.
  • Автодополнение намекает на то, что ODA использует большие языковые модели для помощи пользователям.
  • Огромное количество поддерживаемых языков, хотя при переводе важно учитывать качество.
  • ODA пошла по пути добавления большого количества функций к сущностям; нечеткое сопоставление, устранение неоднозначности, подсказки, правила проверки и т. д.

Не очень хорошо

  • Большое количество языковых вариантов может ввести в заблуждение, так как большинство из них являются языковыми переводами. Это вводит еще один уровень перевода, где намерение, значение и общая семантика могут быть потеряны или неверно истолкованы. Здесь проблемой становится масштабирование и управление диалоговым агентом.
  • Холст графического дизайна (Visual Designer) не является полностью интерактивным. Холст ODA напоминает, как Nuance Mix реализовал свой холст дизайна диалогов. С узлами, которые не являются полностью интерактивными в смысле перетаскивания элементов. Добавьте в этот список AWS Lex.
  • Сущности не могут быть аннотированы в примерах произнесения намерений. Этот подход является общим местом для диалоговых фреймворков ИИ.
  • Доступ и адаптация являются проблемой и могут стать препятствием для новых пользователей.
  • Среды, доступные для развертывания, значительны, но бледнеют по сравнению с другими платформами, такими как Microsoft, Cognigy, Kore AI и другими.

  • YAML (язык уценки) и визуальный дизайнер нельзя совмещать в одном навыке.