Google AI: представляем набор данных диалога на основе схемы для помощников по общению

Это резюме исследования - лишь одно из многих, которые еженедельно распространяются в информационном бюллетене для ученых в области ИИ. Чтобы начать получать еженедельную рассылку, зарегистрируйтесь здесь.

Разговорные помощники - одно из самых интересных достижений искусственного интеллекта, свидетелями которых мы недавно стали. До сих пор мы наблюдали, как они становятся все более значимой частью нашей личной жизни, а также бизнеса для улучшения обслуживания клиентов. Несомненно, будущее этих помощников захватывающее и будет продолжать расширяться - рынок интеллектуальных виртуальных помощников, по оценкам, будет расти в среднем на 26% и достигнет к 2024 году более 12 миллиардов долларов США.

Инженеры ИИ по всему миру активно работают над новым поколением диалоговых возможностей ИИ, включая чтение и понимание человеческих эмоций. Но не раньше, чем они преодолеют некоторые существующие проблемы, такие как отсутствие достаточного количества данных. Это связано с тем, что существующие наборы данных для многодоменного диалога, ориентированного на задачи, недостаточно отражают ряд проблем, возникающих при производстве масштабируемых виртуальных помощников.

На пути к масштабируемым многодоменным переговорным агентам

Google AI недавно представил набор данных SchemaGuided Dialogue (SGD), корпус диалогов, ориентированных на задачи. С более чем 18000 диалогов в обучающем наборе, охватывающем 26 сервисов, принадлежащих 17 доменам, он теперь является крупнейшим общедоступным аннотированным набором данных ориентированных на задачи диалогов.

Аннотации содержат активные намерения и состояния диалога для каждого высказывания пользователя и системные действия для каждого системного высказывания. SGD - это первый набор данных, охватывающий такое большое количество доменов и предоставляющий несколько API для каждого домена.

Google также предлагает подход на основе схемы для создания виртуальных помощников в качестве решения существующих проблем. Подход использует единую модель для всех сервисов и доменов без каких-либо параметров, зависящих от предметной области.

Возможное использование и эффекты

Набор данных SGD будет иметь большое значение, помогая противостоять множеству реальных проблем, которые не отражаются в достаточной степени существующими наборами данных. Он также поощряет масштабируемые подходы к моделированию для виртуальных помощников за счет упрощения интеграции новых сервисов и API-интерфейсов с крупномасштабными виртуальными помощниками.

Набор данных также предназначен для использования в качестве эффективного испытательного стенда для прогнозирования намерений, заполнения слотов, отслеживания состояния и генерации языка, а также других задач в крупномасштабных виртуальных помощниках.

Подробнее: Набор данных диалога на основе схемы

Спасибо за то, что читаете, комментируете, делитесь и давайте подключимся в Twitter, LinkedIn и Facebook. Будьте в курсе последних разработок в области искусственного интеллекта, новостей, ресурсов, инструментов и многого другого, подписавшись на нашу бесплатную еженедельную рассылку AI Scholar! Подпишитесь здесь Не забудьте 👏, если вам понравилась эта статья. Ваше здоровье!