Google AI: представляем набор данных диалога на основе схемы для помощников по общению
Это резюме исследования - лишь одно из многих, которые еженедельно распространяются в информационном бюллетене для ученых в области ИИ. Чтобы начать получать еженедельную рассылку, зарегистрируйтесь здесь.
Разговорные помощники - одно из самых интересных достижений искусственного интеллекта, свидетелями которых мы недавно стали. До сих пор мы наблюдали, как они становятся все более значимой частью нашей личной жизни, а также бизнеса для улучшения обслуживания клиентов. Несомненно, будущее этих помощников захватывающее и будет продолжать расширяться - рынок интеллектуальных виртуальных помощников, по оценкам, будет расти в среднем на 26% и достигнет к 2024 году более 12 миллиардов долларов США.
Инженеры ИИ по всему миру активно работают над новым поколением диалоговых возможностей ИИ, включая чтение и понимание человеческих эмоций. Но не раньше, чем они преодолеют некоторые существующие проблемы, такие как отсутствие достаточного количества данных. Это связано с тем, что существующие наборы данных для многодоменного диалога, ориентированного на задачи, недостаточно отражают ряд проблем, возникающих при производстве масштабируемых виртуальных помощников.
На пути к масштабируемым многодоменным переговорным агентам
Google AI недавно представил набор данных SchemaGuided Dialogue (SGD), корпус диалогов, ориентированных на задачи. С более чем 18000 диалогов в обучающем наборе, охватывающем 26 сервисов, принадлежащих 17 доменам, он теперь является крупнейшим общедоступным аннотированным набором данных ориентированных на задачи диалогов.
Аннотации содержат активные намерения и состояния диалога для каждого высказывания пользователя и системные действия для каждого системного высказывания. SGD - это первый набор данных, охватывающий такое большое количество доменов и предоставляющий несколько API для каждого домена.
Google также предлагает подход на основе схемы для создания виртуальных помощников в качестве решения существующих проблем. Подход использует единую модель для всех сервисов и доменов без каких-либо параметров, зависящих от предметной области.
Возможное использование и эффекты
Набор данных SGD будет иметь большое значение, помогая противостоять множеству реальных проблем, которые не отражаются в достаточной степени существующими наборами данных. Он также поощряет масштабируемые подходы к моделированию для виртуальных помощников за счет упрощения интеграции новых сервисов и API-интерфейсов с крупномасштабными виртуальными помощниками.
Набор данных также предназначен для использования в качестве эффективного испытательного стенда для прогнозирования намерений, заполнения слотов, отслеживания состояния и генерации языка, а также других задач в крупномасштабных виртуальных помощниках.
Подробнее: Набор данных диалога на основе схемы