Лучше, чем человек: контекстное автоматизированное интеллектуальное управление транспортным средством

Аннотация

Ниже приводится краткое описание шаблона проектирования управления искусственным интеллектом, который потенциально может способствовать разработке надежно безопасных высокопроизводительных автономных автомобилей в ближайшей перспективе. Функциональный элемент, именуемый здесь сетью глубокого контекста (DCN), представлен как фундаментальная технология в предлагаемом шаблоне проектирования. Архитектура рекуррентной нейронной сети рассматривается для сопоставления событий контекста транспортного средства с действиями водителя.

Введение

Основываясь на опубликованных результатах и ​​опубликованных работах [1–5], высокоуровневая характеристика текущего распространенного подхода к управлению автоматизированными транспортными средствами (AV) проиллюстрирована на рисунке 1, где компоненты Perception предоставляют входные данные для Компоненты принятия решений, которые предоставляют входные данные компонентам Control.

Рисунок 1. Функциональная схема автоматизированного интеллектуального управления транспортным средством

В такой структуре управления AV, определенной на рисунке 1, новые наблюдения (т. е. неизвестные события восприятия) несовместимы с предсказуемыми результатами управления. Однако проверяемо безопасные операции требуют, чтобы результаты контроля были предсказуемы, по крайней мере, в теории. В результате инженеры и ученые вложили значительные средства в развитие технологий восприятия, методов и вспомогательных баз данных. Тем не менее, невозможно предвидеть все будущие события восприятия, которые могут произойти на дорогах и улицах в общественном достоянии. Таким образом, такой поток управления, как показано на рис. 1, по своей природе нестабилен, особенно в отношении разросшихся, густонаселенных городов, где высок спрос на личный транспорт.

Требуется более надежный шаблон проектирования. Это показано на рисунке 2, где Context заменил компонент восприятия на рисунке 1.

Рисунок 2. Предлагаемый надежный функциональный поток для автоматизированного интеллектуального управления транспортным средством

В таком предлагаемом надежном шаблоне проектирования контекст получает информацию от компонентов восприятия (рис. 3), но абстрагирует его от потока управления ИИ, исключая появление нестабильного (т. е. непредсказуемого) поведения. Кроме того, компоненты контекста могут предоставлять постоянную информацию о закрытой, хорошо понятной области, которая определяется инженерами во время разработки системы управления, чтобы по существу оценивать ситуационные и эксплуатационные качества транспортного средства, включая ситуационную осведомленность, эксплуатационные ожидания, готовность транспортного средства, приоритизацию безопасности и запас, а также другие качества.

Рисунок 3. Контекст, представленный как отношение более высокой абстракции к восприятию

В этой статье представлен поток управления AV, который включает в себя такой контекстуализированный информационный поток, именуемый здесь контекстуализированным автоматизированным интеллектуальным контроллером транспортного средства (CAVIC) (рис. 4). В концепции CAVIC контекст генерируется оценщиком состояния управляющего контекста и сопоставляется с управляющими решениями рекуррентной нейронной сетью.

Рис. 4. Контекстуализированный интеллектуальный контроллер автоматизированного транспортного средства

В оставшейся части этой статьи представлены компоненты концепции CAVIC и краткие замечания о том, как обучаются встроенные нейронные сети. Также включены замечания о том, как CAVIC интегрируется с современной AV-технологией.

Глубокая контекстная сеть

Нейронные сети (NN) можно использовать для изучения и создания многослойной и сложной картины контекста на основе наблюдаемых информационных шаблонов. На рисунке 5 показана сеть глубокого контекста (DCN), полученная из потоков изображений. Здесь каждый уровень меток и связанных с ними данных подается в процессоры, которые создают метки и данные более высокого уровня. Метки — это контексты, выведенные из входных данных производящего процессора, а данные — результат вычислений, которые преобразуют и обогащают информационный поток, используемый последующими процессорами. По мере продвижения обработки в сети разработанные контексты становятся менее детализированными и более детализированными.

В общем, каждый процессор может быть NN, традиционной программой компьютерного кода (т. е. кодом C/C++) или комбинацией таких функций. Метки — это качественные абстракции, которые имеют тенденцию интерпретироваться человеком и обычно могут быть связаны с порядковым или логическим поведением, которое определяет относительную принадлежность или интенсивность. Разработанные данные, связанные с метками, обычно являются количественными и генерируются для обеспечения достаточного ввода процессоров более высокого уровня для создания полезного контекста более высокого уровня (меток). Такая количественная информация может включать прямые измерения. На рисунке 5 узлы A и B — это другие процессоры, компьютерные программы, статические источники или измерения.

Рисунок 5. Глубокая контекстная сеть

Генерация состояния контекста

На рисунке 6 представлен пример высокоуровневого шаблона для установления непрерывных состояний контекста вождения (DCS), связанных с безопасной работой автономного автомобиля. Проиллюстрированная сеть, DCN, состоящая из меньших по размеру доменных сетей DCN, упоминается здесь как средство оценки состояния управляющего контекста (DCSE).

Рис. 6. Пример возможности подключения генератора состояний контекста безопасности в беспилотном автомобиле

Блоки Perception являются входными данными для DCSE, предоставляя прямую информацию для выбора DCN, специфичных для домена. Специфичные для домена DCN функционально называются блоками управляющего контекста (DCS). Каждый из блоков DCS производит два класса выходных данных. Один класс выходных данных является входным для блоков DCS, которые встречаются позже в потоке контекста. Второй класс выходных данных блока DCS представляет собой вектор состояния контекста, предоставляемый в момент времени k рекуррентному нейрону, который генерирует действия управления вождением автомобиля в течение времени k+1.

Во многих случаях первая принципиальная основа для отображения входных данных на выходные может быть известна для процессоров DCS, и разработчики могут использовать кодовые блоки C++ (или другие) для представления процессоров DCS. Как правило, данные о вождении могут генерироваться смоделированными, роботизированными (т. Е. Современные AV) и опытными водителями-людьми, выполняющими прогрессивные задачи вождения. Наборы управляющих данных должны быть проанализированы группой разработки программного обеспечения, чтобы определить соответствующие выходные данные блоков DCS. Контекстные выходы блоков DCS можно считать аналогами человеческих эмоций, интуиции и суждений, связанных с безопасностью, уменьшением ущерба и другими приоритетами производительности. Таким образом, группе разработчиков программного обеспечения может потребоваться прийти к консенсусу в отношении ожидаемых выходных данных блока РСУ и практиковать управление конфигурацией в отношении эволюции таких проектных решений. Следует отметить, что опыт потери данных о восприятии или плохо понятых или разреженных данных о восприятии может быть представлен в состояниях контекста. После обучения выходные данные блока DCS можно считать обобщением того, что разработчики считают подходящим ощущением (которое должен испытывать автомобиль) при каждой записи опыта вождения.

Генерация состояния действия водителя

Рисунок 7 иллюстрирует информационный поток для создания состояний действия вождения (DAS). Такие состояния представляют собой закодированную информацию, которая сопоставляется с действиями водителя-человека. Такие действия водителя не являются последовательностями, а представляют собой дискретные комбинации входных данных, которые определяются объемом входных данных, доступных для управления системами управления (т. е. нижестоящими частями, которые используют дифференциальные уравнения для управления механическими приводами) автономного автомобиля. На рисунке действия водителя обрабатываются через структуру NN или другой процессор для создания закодированного DAS, который будет использоваться CAVIC. В случаях, когда процессор является NN, процессор может быть сгенерирован из контролируемого обучения NN.

Для обучения NN, как и при разработке блоков DCS, действия водителя, которые генерируют наборы данных кодов действий, могут выполняться смоделированными, роботизированными и опытными водителями, выполняющими прогрессивные огибающие задачи вождения. В идеале обученный CAVIC будет работать с шаблонами ответов и тенденциями, которые указывают на движущие силы, которые генерируют наборы обучающих данных.

Рис. 7. Иллюстрация действий драйвера, используемых для создания закодированных состояний действий драйвера

Контекстное автоматизированное интеллектуальное управление транспортными средствами

Обучение DCSE (при необходимости) происходит до обучения RNN CAVIC, которое мы будем называть здесь оценщиком состояния действия вождения (DASE). Общий пример потенциально полезной архитектуры RNN для DASE представлен на рисунке 8, где входные векторы, так называемые векторы action-context, представляют собой композиции выходных данных DCS и DAS (рисунок 9). Наборы обучающих данных разрабатываются постепенно с помощью моделируемых, роботизированных и опытных водителей, выполняющих маневры в диапазоне характеристик, который должен включать пассивные и агрессивные маневры вождения. Наборы обучающих данных DASE должны включать выходные данные DCS и DAS в момент времени k и выходные данные DAS в момент времени k+1.

Рис. 8. Самоуправляемый автомобиль на основе контекста обучения оценщика состояния вождения

Рис. 9. Функциональное представление вектора действия-контекста

Интеграция с современными технологиями

Текущая современная технология AV может интегрироваться с подходом CAVIC путем создания базовых наборов данных о вождении для первоначального обучения компонентов CAVIC. Такая интеграция является идеальной, поскольку она обеспечивает практические базовые наборы данных о характеристиках вождения в надежных и практичных условиях вождения и потенциально использует наборы данных, полученные из хранилищ записанных опытов и симуляций.

Выводы

Новый шаблон проектирования интеллектуальной системы управления для автономных транспортных средств представлен и представлен как потенциальный путь к достижению безопасного и тонкого автономного вождения в общественном достоянии.

Представленный шаблон проектирования интеллектуального управления, называемый здесь Контекстуализированный автоматизированный интеллектуальный контроллер транспортного средства (CAVIC), абстрагирует выходные данные восприятия транспортного средства в сеть многоуровневых динамических состояний Контекста. Такие состояния контекста разрабатываются и культивируются инженерами во время разработки CAVIC, чтобы соответствовать интерпретируемым человеком нюансам динамического реагирования на обстоятельства, приоритеты и ограничения транспортного средства и окружающей среды.

Совокупность таких состояний контекста, сгенерированных в момент времени k, сопоставляется с действиями управления водителем в момент времени k+1 рекуррентной нейронной сетью. Действия водителя по управлению можно узнать непосредственно у опытных водителей, выполняющих маневры, причем такие маневры могут варьироваться от очень консервативных до очень агрессивных.

Разработка CAVIC, вероятно, будет сложной задачей и потребует серьезных изобретательских разработок. Однако предлагаемый им перевод состояний контекста в состояния действия уходит своими корнями в обработку естественного языка, что может обеспечить некоторое утешение в отношении его осуществимости. Кроме того, расплатой за постепенные успехи являются большие, предвещающие автономные интеллектуальные системы управления транспортными средствами, которые могут сопоставлять сложные экологические переживания с нюансами приоритетов безопасности человека и благодаря обобщениям, полученным нейронными сетями, превосходят даже лучших из своих учителей-людей.

Ссылки

1. Дерюттер, Т., Ванденхенде, С., Груйчич, Д., Ван Гул, Л. и Моэнс, М.Ф., 2019. Talk2car: Взяв под контроль свой беспилотный автомобиль. Препринт arXiv arXiv: 1909.10838.

2. Фан Р., Цзяо Дж., Е Х., Ю Ю., Питас И. и Лю М., 2019 г. Ключевые составляющие беспилотных автомобилей. Препринт arXiv arXiv: 1906.02939.

3. Сингх П.К., Нанди С.К. и Нанди, С., 2019. Учебный обзор современного состояния автомобильной связи и будущих направлений исследований. Автомобильное сообщение, д. 18, с.100164.

4. Григореску С., Траснеа Б., Кочиас Т. и Масесану Г., 2020. Обзор методов глубокого обучения для автономного вождения. Журнал полевой робототехники, 37 (3), стр. 362–386.

5. Веллинга, штат Небраска, 2017 г. От испытаний до развертывания беспилотных автомобилей: юридические проблемы перед политиками в будущем. Обзор компьютерного права и безопасности, 33 (6), стр. 847–863.