Это ближе, чем вы думаете

Tesla собирается решить проблему автономии, вот как

Огромное преимущество Tesla в области данных и технологий; их увлекательные возможности автопилота

В настоящее время Tesla выпускает бета-версию ПО Full Self Driving. Это позволит всему автопарку автономно ездить практически в любом месте. Это программное обеспечение включает в себя такие функции, как вызов вашей машины (немного похоже на Бэтмена или Мистера Невероятного), автоматическую смену полосы движения и парковку, управление дорожным движением и знак остановки и многое другое. В этой статье я расскажу о том, как им удается этого добиться и как их методы улучшились с годами.

Вступление

Tesla, без сомнения, является мировым лидером в области исследований в области искусственного интеллекта. За последние несколько лет компания показала, что это гораздо больше, чем просто автопроизводитель, доказав свои возможности в области технологий.

Когда Tesla впервые запустила автопилот, как и большинство других автопроизводителей сегодня, автомобиль мог оставаться в пределах своей полосы движения и на подходящем расстоянии от машины, идущей впереди. Он не мог менять полосу движения, выезжать на съезд, обгонять, избегать столкновения и т. Д. Конечная цель автономного транспортного средства состоит в том, чтобы иметь возможность ехать куда угодно, оставаясь при этом таким же или даже более безопасным, чем водитель-человек.

Во многих отношениях автопилот Теслы в некоторых отношениях успешен, поскольку он статистически намного безопаснее, чем средний водитель. Во втором квартале 2021 года использование Tesla с включенным автопилотом снизит вероятность попадания в аварию более чем в три раза [1]. Фактически, автопилот Tesla становится настолько хорош, что они не собирают достаточно данных об автокатастрофах для обучения своих моделей. Конечно, это хорошая проблема. Но Tesla придумала обходной путь.

С запуском бета-версии Full Self Driving (FSD) Tesla как никогда близка к решению автономных задач.

Как это работает?

Автомобили с автопилотом извлекают информацию из данных датчиков, которая затем используется для создания представления дороги вокруг них в векторном пространстве. В этом векторном пространстве автомобиль может затем принимать решения о том, когда повернуть, разогнаться и сломаться.

В этой статье будет рассмотрено, как методы Tesla для создания этого векторного пространства улучшились с годами.

Датчики

Автопроизводители внедряют широкий спектр датчиков для обеспечения автономного вождения. Обычные датчики - это радар, LiDAR и камеры. В отрасли думали, что вождение с использованием только камер окажется чрезвычайно трудным. Другие датчики, такие как LiDAR, позволяют прорезать дождь, туман, тень и солнечный свет. Радар также обеспечивает более точное представление глубины. По этим причинам другие лидеры рынка в отрасли, такие как Waymo, предпочитают использовать все три типа датчиков. Однако, помимо других проблем, LiDAR и радарные датчики требуют дополнительных затрат, что делает их менее привлекательными при проектировании автономного транспортного средства.

Tesla предпочитает использовать зрение только для своих новейших автомобилей. С мая 2021 года автомобили Tesla больше не оснащаются датчиками радаров, а вместо этого полагаются исключительно на камеру [2]. Это революционный переход для отрасли. Мы, люди, используем только два датчика видимого света. Теоретически Tesla, оснащенная восемью камерами, может быть значительно безопаснее любого человека, и использование других датчиков не обязательно для достижения такого уровня безопасности.

Старый трубопровод

Несколько лет назад автопилот Теслы работал следующим образом:

  • Захватываются изображения и собираются данные с датчиков.
  • Изображения обрабатываются Res-Nets одно за другим (Res-Nets - это широко используемая архитектура сверточной нейронной сети, позволяющая извлекать соответствующие характеристики)
  • Затем функции передаются через модель BiFPN (модель с пространственной осведомленностью в изображении, улучшающая извлечение соответствующих функций).
  • Обработанные изображения затем используются для обнаружения объектов, обнаружения знаков, обнаружения полос движения и т. Д.

Так что изображения обрабатывались кадр за кадром, камера за камерой. Затем были извлечены характеристики, и из пространственного восприятия автомобиля было восстановлено векторное пространство окружающей его области путем сшивания информации от каждого датчика.

Этот метод оказался успешным, поскольку он использовал один и тот же конвейер предварительной обработки до создания прогнозов при обнаружении объектов, обнаружении знаков и обнаружении полосы движения. Скорость является ключевым моментом при вождении автомобиля, разница в миллисекундах может быть решающей между аварией и ее предотвращением.

Хотя этот метод оказался достаточно успешным для движения по прямой, сшивание векторного пространства сделало систему неточной при попытке идентифицировать дорожные бордюры и другие объекты на дороге. Это приводило к множеству трудностей, когда автомобили пытались проехать не по шоссе.

Tesla сегодня

Вместо того, чтобы делать прогнозы на отдельных изображениях, а затем сшивать скрытое пространство, в котором можно затем управлять автомобилем, новые архитектуры модели принимают изображения со всех камер, а затем используют их для непосредственного обновления векторного пространства.

Это дает много преимуществ. Исходя из предсказаний одного кадра, изображения не могут обмениваться информацией друг с другом, и поэтому, если что-то выходит за рамки видимости для этого кадра, это не может быть интерпретировано в векторном пространстве. Более того, объект находится между двумя камерами, объект будет обнаружен дважды и может дважды появиться в векторном пространстве, если не сшит правильно.

Новая система обеспечивает гораздо более точные и стабильные прогнозы. Векторное пространство обновляется до оценки наивысшей вероятности с учетом всех предыдущих входных данных измерений дороги. Это делается с помощью пространственной рекурсивной архитектуры нейронной сети. Это позволяет модели выбирать, когда обновлять векторное пространство. Например, если в поле зрения камеры есть преграды, как будто автомобиль стоит на пути к бордюру, тогда модель может выбрать не обновлять положение бордюра в векторном пространстве для этого кадра.

Используя этот метод, автопилот Tesla достигает почти идеального изображения дороги вокруг него, облегчая управление автомобилем.

Принимать решение

Помимо моделей видения и интерпретации пространства вокруг автомобиля, у Tesla есть невероятно мощные инструменты планирования, которые позволяют автомобилю выбирать оптимальный путь для движения по дороге. Этот путь будет учитывать комфорт водителя, а также других участников на дороге при достижении своей цели, будь то обгон, съезд, достижение точки на дороге, парк или другое.

Данные

Таким образом, у вас может возникнуть соблазн подумать, что все, что нужно сделать конкурентам Tesla, чтобы наверстать упущенное, - это начать предсказывать прямо в векторном пространстве, вместо того, чтобы делать предсказания изображение за изображением и сшивать менее точное векторное пространство. Однако, чтобы делать прогнозы в векторном пространстве, вам нужны данные для обучения вашей модели. Точнее, вам нужны размеченные данные векторного пространства.

У Tesla есть собственная команда профессиональных этикетировщиков данных в США, состоящая из 1000 этикетировщиков данных. Маркировка теперь выполняется не в каждом кадре изображения, а непосредственно в векторном пространстве. Это позволяет значительно повысить продуктивность, поскольку один раз нанесение метки в этом векторном пространстве приводит к созданию метки для этого объекта во всех камерах и для многих кадров.

Чтобы затем масштабировать наборы данных, Tesla использует методы автоматической маркировки. Они делают это, беря прогнозы векторного пространства одного и того же местоположения для нескольких автомобилей и комбинируя их для получения точных меток.

Безграничное преимущество Tesla в области данных позволяет ей на годы опережать любые конкуренты. Весь их парк автомобилей оснащен датчиками сбора данных, используемых для улучшения автопилота.

Наконец, Tesla разработала чрезвычайно реалистичный движок моделирования, который они используют для дальнейшего обучения, особенно в крайних случаях, когда модели могут быть неэффективными.

Преимущество Tesla в области данных огромно. Каждый произведенный автомобиль Tesla собирает данные, и парк Tesla растет с каждым днем. Чем больше данных собирает Tesla, тем лучше становятся эти модели и тем больше крайних случаев они изучают. Мы недалеко от полностью автономного вождения.

Заключение

Одним из важнейших факторов недавних улучшений автопилота Tesla стало изменение архитектуры модели. Вместо того, чтобы предсказывать кадр за кадром, камера за камерой, их модели выводятся непосредственно в векторное пространство, которое затем используется автомобилем для принятия решений во время вождения. Это было бы невозможно с их огромной мобилизацией для сбора достаточного количества маркированных данных для этой цели. На мой взгляд, скоро вы сможете отослать машину, чтобы забрать детей из школы, будущее уже наступило!

Поддержите меня

Надеюсь, это помогло вам, если вам понравилось, вы можете подписаться на меня!

Вы также можете стать средним участником, используя мою реферальную ссылку, получить доступ ко всем моим статьям и многому другому: https://diegounzuetaruedas.medium.com/membership

Другие статьи, которые могут вам понравиться

Дифференцируемые генераторные сети: введение

Преобразования Фурье: интуитивная визуализация

Использованная литература:

[1] Отчет Tesla по безопасности транспортных средств, Tesla, 2 квартал 2021 г., https://www.tesla.com/VehicleSafetyReport

[2] Tesla Support, Tesla, переход на Tesla Vision, https://www.tesla.com/support/transitioning-tesla-vision