Какая технология и алгоритм лежат в основе выпуска Tesla FSD Beta?

По словам директора по искусственному интеллекту Tesla Андрея Карпатого, методом является имитационное обучение:

Когда вы ведете машину, на самом деле вы вводите данные, потому что управляете рулем. Вы рассказываете нам, как перемещаться по разным средам… Мы обучаем нейронную сеть этим траекториям, а затем нейронная сеть предсказывает пути только на основе этих данных. Так что на самом деле то, что обычно называют имитационным обучением¹, — мы берем человеческие траектории из реального мира.

Андрей Карпатий добавляет немного подробнее о том, как работает автопилот (вопрос из зала был о том, как обговариваются обходные пути, т.е. сложные сценарии):

Сейчас мы активно используем машинное обучение, чтобы прогнозировать создание явного представления того, как выглядит мир, а затем есть явный планировщик и контроллер поверх этого представления, и есть множество эвристик для обхода и согласования и так далее. В этих переговорах есть длинный хвост и небольшая игра в цыплят, в которую вы играете с другими людьми. Я думаю, у нас есть большая уверенность в том, что в конечном итоге должны появиться какие-то компоненты обучения флота тому, как вы на самом деле это делаете, потому что написание всех этих правил вручную быстро приведет к тому, что они быстро остановятся.

Приведенная выше цитата говорит нам о том, что части планировщика и контроллера теперь основаны на правилах, и Tesla работает над их улучшением с помощью системы имитации обучения²,³,⁴.

¹ Методы имитационного обучения направлены на то, чтобы имитировать поведение человека в заданной задаче. Агент (обучающая машина) обучается выполнять задачу на демонстрациях, изучая сопоставление между наблюдениями и действиями.

Имитационное обучение: обзор методов обучения, Хусейн и др., 2017 г.

Здесь мы сосредоточимся на модуле планирования и контроля. Зрительная часть не прикрыта.

² Google Waymo приобрела Latent Logic в 2019 году. Latent Logic может помочь Waymo сделать моделирование более реалистичным, используя форму машинного обучения, называемую имитационным обучением… Всего за два года мы добились значительного прогресса в использовании имитационного обучения для имитации реального поведения человека на дороге.

.. использовать машинное обучение для разработки реалистичных моделей поведения
пользователей дороги, с которыми может взаимодействовать автономное транспортное средство, поэтому водители-люди,
пешеходы, велосипедисты — нам нужны действительно хорошие модели их поведения, чтобы
иметь надежные инструменты моделирования.

Имитационное обучение здесь не используется для непосредственного обучения алгоритму вождения, оно используется для создания лучшего симулятора.

³ Обновление, август 2021 г. День Tesla AI: модуль планирования и управления будет основан на поиске по дереву Монте-Карло (по аналогии с проектом MuZero), а также некоторое имитационное обучение:

«.. поэтому мы работаем над нейронными сетями, которые могут создавать распределения состояний и действий, которые затем могут быть подключены к поиску по дереву Монте-Карло с различными функциями стоимости. Некоторые из стоимостных функций могут быть явными стоимостными функциями, такими как расстояние, столкновения, дискомфорт, время в пути, но они также могут быть
интервенциями от фактических событий ручного вождения
.

⁴ Работа над автономным вождением ведется; улучшения являются постепенными; До уровня 5 еще несколько десятилетий.

Основным препятствием для достижения L5 является то, что ИИ необходимо обучать на больших объемах данных, репрезентативных для «реального вождения» во многих сценариях. Однако количество таких сценариев и требуемая степень вариативности огромны — в настоящее время нет реального способа собрать все перестановки всех объектов на дороге, движущихся во всех направлениях и при любых погодных условиях. . .. Из-за этих проблем многие эксперты считают, что до L5 осталось более двадцати лет.

Кай-Фу Ли ИИ 2041: Десять видений нашего будущего