Прошли годы, но разговоры о беспилотных автомобилях все еще ходят. Многие говорили, что это будет следующая большая вещь, которая изменит то, как мы живем сегодня. Тем не менее, население в целом понятия не имеет, как далеко мы продвинулись — теперь это просто идея из какого-то научно-фантастического фильма.

Будущее автономных транспортных средств зависит от технологии, используемой для создания и реализации реальности. Один из которых машинное обучение играет очень большую роль.

Машинное обучение (МО)

Машинное обучение — это, по сути, использование компьютерных систем для обучения и адаптации на основе опыта и данных. Именно так машина учится имитировать разумное поведение человека. Например, машинное обучение может распознавать визуальную сцену, понимать текст, написанный на естественном языке, или даже выполнять действия в физическом мире! Вам необходимо знать три типа машинного обучения:

Под наблюдением

В контролируемой модели алгоритм получает инструкции о том, как интерпретировать входные данные. Он использует помеченные наборы данных для обучения алгоритмов классификации данных или точного прогнозирования результатов.

Это рекомендуемый метод обучения для самоуправляемых автомобилей. Это позволяет алгоритму оценивать обучающие данные на основе полностью размеченного набора данных, что делает контролируемое обучение более полезным при классификации. Например, если контролируемой модели предоставляются помеченные данные о тысячах деревьев, как только она увидит изображение любого типа дерева, она сможет определить, что это такое.

Без присмотра

При неконтролируемом обучении алгоритм машинного обучения получает неразмеченные данные и не содержит инструкций по их обработке, поэтому ему приходится самостоятельно решать, что делать. Он анализирует и группы на основе скрытых шаблонов и распознанных ключевых функций.

Допустим, в алгоритм подается куча входных данных с деревьями и автомобилями. Алгоритм начнет группировать объекты, которые выглядят похожими друг на друга по своим характеристикам и шаблонам (деревья с одной стороны и автомобили с другой).

Обучение с подкреплением

Обучение с подкреплением находится между контролируемым и неконтролируемым обучением. Он работает, поощряя модель поведения, основанную на будущих вознаграждениях.

Агент должен научиться вести себя в окружающей среде исключительно на основе вознаграждения. Целью обучения с подкреплением является создание эффективных алгоритмов обучения, а также понимание преимуществ и недостатков алгоритма. Обучение с подкреплением представляет особый интерес из-за его широкого спектра практических применений. У него есть потенциал для решения проблем в области искусственного интеллекта, исследования операций или инженерии управления — все это имеет отношение к разработке беспилотного автомобиля.

АДАС

Усовершенствованные системы помощи водителю (ADAS) — это группы электронных технологий, которые помогают водителям при вождении и парковке. ADAS повышает безопасность транспортных средств и дорожного движения, используя безопасный человеко-машинный интерфейс. ADAS использует автоматизированные технологии, такие как датчики и камеры, для обнаружения ближайших препятствий или ошибок водителя и принятия соответствующих мер.

Как работают автономные транспортные средства?

Без водителя-человека автоматизированное транспортное средство должно иметь возможность видеть все в своем окружении, классифицировать его и решать, какие действия ему необходимо предпринять.

Датчики

Обычно для восприятия окружающей среды в беспилотных транспортных средствах используется 3 датчика.

Камеры

Подобно тому, как люди используют свои глаза, автоматизированные автомобили используют видеокамеры и датчики для интерпретации объектов на дороге. Оснащенные камерами под каждым углом, транспортные средства могут сохранять 360-градусный обзор внешней среды. Это лучший способ получить точное представление об окружении автомобиля и условиях движения.

Сегодня 3D-камеры доступны и применяются для отображения изображений с высоким разрешением. Эти датчики изображения автоматически обнаруживают объекты, классифицируют их и определяют расстояние между ними и автомобилем. Например, камеры могут легко идентифицировать другие автомобили, дорожную разметку, мосты, дорожные знаки и сигналы, пешеходов, велосипедистов и ограждения.

Ограничения

Камеры не работают в туман, дождь или снег, в отличие от радаров и лидаров. Технология камеры требует, чтобы компьютер производил измерения по изображению, чтобы понять, насколько далеко находится объект.

Радар

Радарные датчики (радиообнаружение и определение дальности) отвечают за обнаружение и отслеживание присутствия, направления и скорости объектов с использованием радиоволн в режиме реального времени. В отличие от камер, радар хорошо работает в экстремальных погодных и необычных дорожных условиях.

Радарные датчики ближнего действия (24 ГГц) обеспечивают мониторинг слепых зон, идеальную помощь в поддержании полосы движения и помощь при парковке. Принимая во внимание, что функции радарных датчиков дальнего действия (77 ГГц) включают автоматический контроль дистанции и помощь при торможении.

Ограничения

В современных радиолокационных возможностях необходимо улучшить несколько областей. Классическая радиолокационная обработка не может различать типы стационарных объектов, таких как припаркованные автомобили, эстакада или перила. Кроме того, точность современных радаров позволяет идентифицировать только 90–95% пешеходов. Чего едва хватает для соблюдения норм безопасности на дороге. Кроме того, используемые в настоящее время 2D-радары не могут правильно определять высоту объекта, поскольку датчики могут сканировать только по горизонтали. Это может вызвать множество проблем при проезде под мостами или дорожными знаками. Для решения этих проблем разрабатывается более широкий спектр 3D-радарных датчиков.

Чем может помочь машинное обучение

Сигналы радара отражаются от объектов в окружающей среде и анализируются на предмет силы и плотности возвращающихся отражений. Если возвращается сильное и плотное скопление отражений, классическая радиолокационная обработка может определить, что это, вероятно, какой-то крупный объект. Если кластер перемещается с течением времени, скорее всего, это автомобиль.

Однако неподвижный объект, такой как сломанная машина, также создает плотный кластер отражений, но не движется. Этот подход не позволяет определить, является ли это автомобилем, деревом или чем-то еще. Автономные транспортные средства должны не только обнаруживать движущийся транспорт вокруг них, но и быть в состоянии обнаружить то, что не движется. Исследователи NVIDIA обучили глубокую нейронную сеть (DNN), используя данные радарных датчиков для обнаружения движущихся и неподвижных объектов, а также для точного различения различных типов стационарных препятствий. Для этого они сначала посмотрели на отражения радара, которые довольно редки. Человеку практически невозможно визуально идентифицировать и маркировать транспортные средства только по данным радара при обучении DNN.

Данные радара, представленные выше, слишком скудны для идентификации автомобилей. При классической радиолокационной обработке обнаружение стационарных автомобилей и обнаружение отсутствующих транспортных средств с низкой достоверностью.

С другой стороны, LiDAR (об этом будет сказано ниже) может создавать трехмерное изображение окружающих объектов с помощью лазерных импульсов. Как показано на рисунке 1, наземные достоверные данные (данные, собранные в масштабе из реальных сценариев для обучения алгоритмов) для DNN были созданы путем распространения меток ограничительной рамки из соответствующего набора данных лидара на данные радара. Таким образом, способность человека-маркировщика визуально идентифицировать и маркировать автомобили по данным лидара переносится в область радара.

Кроме того, радар DNN учится не только обнаруживать автомобили, но и их трехмерную форму, размеры и ориентацию, что традиционными методами сделать не так просто.

С помощью этой дополнительной информации радар DNN может различать различные типы препятствий, даже если они неподвижны, повышая достоверность истинных положительных обнаружений и уменьшая количество ложных срабатываний.

Благодаря большей уверенности в трехмерном восприятии автоматизированные транспортные средства могут гораздо эффективнее воспринимать свое окружение с меньшим количеством сбоев.

Лидар

Датчики Lidar (Light Detection and Ranging) работают аналогично радарным системам, за исключением того, что они используют лазеры, а не радиоволны. Помимо измерения расстояний до различных объектов на дороге, лидар позволяет создавать 3D-изображения обнаруженных объектов, а также составлять карты их окружения. полагаясь на узкое поле зрения, лидар можно настроить для создания полной 360-градусной карты вокруг автомобиля.

Ограничения

Лидар — мощный инструмент, но обработка данных происходит медленно. Типичный лидарный датчик может генерировать миллионы точек данных о глубине в секунду, что превосходит возможности обработки данных. Это, в свою очередь, может привести к тому, что автомобильные системы свернут трехмерные лидарные данные в двухмерные данные, что приведет к значительной потере деталей. В то время как датчики LiDAR обеспечивают неизменно точную информацию, существующие сквозные решения для вождения в основном основаны на камерах из-за большого объема памяти и затрат на вычисления, необходимых для обработки 3D-данных. Однако повышение надежности этих систем также имеет решающее значение; однако оценка неопределенности модели затруднена из-за высокой стоимости методов, основанных на выборке.

Как машинное обучение может помочь

Исследователи Массачусетского технологического института предоставили GPS-изображения низкого разрешения и необработанные 3D-лидарные данные, чтобы справиться с вычислительной нагрузкой массивных лидарных данных и более эффективного графического процессора, чтобы обеспечить вождение в реальном времени. Алгоритм и перспективы системы также были улучшены. Достигнута совокупная скорость в 9 раз выше, чем у существующего 3D-лидара.

Для получения дополнительной информации о том, как эти исследования работают над снижением потребности в человеческом поглощении — здесь

HERE Technologies также работает над использованием Deep Convolutional Neural Networks для обнаружения трехмерных объектов дорог для автоматического построения HD-карты. Более подробная информация доступна здесь"

Как автомобили с автоматическим управлением принимают решения?

Используя алгоритмы обнаружения и классификации объектов, беспилотные автомобили могут идентифицировать объекты, интерпретировать ситуации и принимать соответствующие решения. Они достигают этого, обнаруживая, классифицируя и интерпретируя объекты.

Машинное обучение имеет решающее значение в беспилотных автомобилях, поскольку оно постоянно визуализирует окружающую среду и предсказывает возможные изменения в этой среде.

Алгоритмы машинного обучения можно разделить на четыре типа:

  • алгоритмы регрессии
  • распознавание образов
  • кластерные алгоритмы
  • алгоритмы матрицы решений

Эти алгоритмы будут упоминаться позже в технологиях, которые в настоящее время обеспечивают обнаружение объектов, распознавание объектов, классификацию объектов, локализацию объектов и прогнозирование движения.

Алгоритмы регрессии

Регрессия — это тип проблемы, которая решается с помощью обучения с учителем. Речь идет о прогнозировании непрерывного количества. Определяется переменной, которая имеет бесконечные возможности. Что касается автономных транспортных средств, алгоритмы регрессии могут создать статистическую модель связи между изображением и положением данного объекта на этом изображении. Типы алгоритмов регрессии, которые можно использовать для беспилотных автомобилей, включают, среди прочего, байесовскую регрессию, регрессию нейронной сети и регрессию леса решений.

Алгоритмы распознавания образов (классификация)

Распознавание образов — это обычно неконтролируемый алгоритм машинного обучения, который фильтрует изображения для распознавания экземпляров категории объектов, исключая нерелевантные точки данных. Распознавание закономерностей в наборе данных является важным шагом перед классификацией объектов. Эти типы алгоритмов также могут быть определены как алгоритмы сокращения данных.

Машины опорных векторов (SVM) с гистограммами ориентированных градиентов (HOG) и анализ главных компонентов (PCA) являются наиболее распространенными алгоритмами распознавания, используемыми в ADAS.

Кластеризация

Кластеризация имеет дело с группировкой определенных вещей вместе на основе общих черт, которые они могут иметь. Это полезно, когда изображения, полученные системой, нечеткие и трудно обнаружить и локализовать объекты. Также возможно, что алгоритмы классификации могут пропустить объект и не классифицировать и сообщить о нем системе. Возможными причинами могут быть изображения с низким разрешением, несколько точек данных или прерывистые данные. Кластеризация может обнаруживать структуру по точкам данных, например, регрессия, она описывает класс проблемы и класс метода.

Алгоритмы матрицы решений

Этот тип алгоритма превосходен в идентификации, анализе и оценке производительности взаимосвязей между наборами значений и информации. Эти алгоритмы в основном используются для принятия решений. Уровень уверенности алгоритмов в классификации, распознавании и прогнозировании следующего движения объектов определяет, нужно ли автомобилю повернуть налево или затормозить. Эти алгоритмы представляют собой модели, состоящие из нескольких моделей принятия решений, которые были обучены независимо друг от друга и чьи прогнозы каким-то образом комбинируются для получения общего прогноза при одновременном снижении вероятности ошибок при принятии решений. Повышение градиента (GDM) и AdaBoosting являются наиболее часто используемыми алгоритмами.

Алгоритмы машинного обучения

SIFT (масштабно-инвариантное преобразование признаков) для извлечения признаков

Представьте себе автомобиль, спрятавшийся за деревом. Может ли он быть обнаружен автономным транспортным средством? Да, если использовался SIFT.

Сопоставление изображений и распознавание объектов для частично видимых объектов возможны с помощью масштабно-инвариантного преобразования признаков. Алгоритм извлекает характерные точки (то есть ключевые точки) объекта, используя базу данных изображений. Это характеристики объекта, которые не меняются при масштабировании, вращении, загромождении или шуме.

Алгоритмы машинного обучения в беспилотных автомобилях сравнивают каждое новое изображение с функциями SIFT, извлеченными из базы данных. Для идентификации объектов он обнаруживает соответствие между ними. Когда автономное транспортное средство видит треугольный дорожный знак, оно использует три его угла в качестве ключевых точек. Даже если треугольный дорожный знак был поврежден и погнут назад, беспилотное транспортное средство, использующее SIFT, распознает его по присущим ему характеристикам.

AdaBoost для классификации данных

AdaBoost — это алгоритм матрицы решений, который обеспечивает ускорение адаптивного обучения. По сути, он проверяет выходные данные других алгоритмов регрессии и классификации, чтобы увидеть, насколько их производительность соответствует правильным прогнозам.

AdaBoost объединяет и оптимизирует производительность нескольких алгоритмов, чтобы они работали в тандеме и дополняли друг друга. Отдельные алгоритмы, вероятно, будут работать плохо, но их совокупная производительность может способствовать улучшению обучения.

Предположим, что есть четыре ученика: A, B, C и D. A и B используют одни и те же критерии, но A превосходит B. Между тем, успеваемость C хуже, чем у A или B, но она измеряется с использованием другого набора критериев. . Это означает, что C плюс A может дать более высокий результат, чем A плюс B (и без C). Предсказания D могут быть совершенно неверными и в большинстве случаев не сбываться. Тем не менее, его выходные данные могут быть полезны для всей системы. AdaBoost объединяет несколько слабых классификаторов в один сильный классификатор.

TextonBoost для распознавания объектов

TextonBoost, как и AdaBoost, объединяет слабых учеников для создания сильных учеников. Он улучшает распознавание изображений, помечая тексты. Текстоны — это группы визуальных данных со схожими характеристиками, которые одинаково реагируют на фильтры.

Алгоритм TextonBoost объединяет информацию из трех источников в проекте беспилотного автомобиля, использующего машинное обучение: внешний вид, форма и контекст. Это применение машинного обучения в автономных транспортных средствах является блестящим, потому что эти источники могут не давать точных результатов сами по себе. Проще говоря, одного внешнего вида объекта не всегда достаточно, чтобы правильно его маркировать.

Сначала компьютер создает текстовую карту изображения. Затем он сопоставляет функции с текстонами и учится на контекстной информации. В этом случае он узнает, что «коровьи» пиксели обычно окружены «травяными» пикселями.

Гистограмма ориентированных градиентов (HOG)

Одним из наиболее фундаментальных алгоритмов машинного обучения для автономного вождения и компьютерного зрения является гистограмма ориентированных градиентов (HOG). Он исследует область изображения, известную как ячейка, чтобы определить, как и в каком направлении изменяется интенсивность изображения. HOG соединяет вычисленные градиенты каждой ячейки и подсчитывает, сколько раз встречается каждое направление. Затем эти функции передаются в машину опорных векторов (SVM) для классификации.

HOG, по сути, описывает изображения как распределения интенсивности изображения. Он генерирует закодированную и сжатую версию изображения, которая представляет собой не просто набор пикселей, а полезный градиент изображения. Кроме того, это недорого с точки зрения системных ресурсов. HOG может помочь беспилотным автомобилям, потому что это может стать мощным первым шагом в последовательности распознавания изображений.

YOLO (Только один раз посмотришь)

YOLO (You Only Look Once) — это алгоритм машинного обучения, используемый для классификации таких объектов, как автомобили, люди и деревья. На самом деле это другой алгоритм, чем HOG. YOLO анализирует все изображение и делит его на сегменты. Поскольку каждый класс объектов имеет уникальный набор характеристик, YOLO помечает их соответствующим образом.

Для каждого сегмента изображения алгоритм генерирует ограничивающие рамки и прогнозы. Он оценивает сеть только один раз и рассматривает каждый прогноз в контексте всего изображения. С другой стороны, другие алгоритмы обнаружения применяют детекторы и классификаторы к нескольким позициям и областям изображения. В результате YOLO точнее и быстрее, чем HOG. Алгоритм YOLO — отличный инструмент для обнаружения объектов в беспилотных транспортных средствах. Это обеспечивает быструю обработку и реакцию автомобиля на реальные сценарии.

Будущие приложения машинного обучения

Мониторинг водителя

Нейронные сети способны распознавать закономерности и поэтому не могут использоваться для наблюдения за водителем в транспортных средствах. Одним из важнейших применений этого может быть распознавание лиц для идентификации водителя и проверки наличия у него доступа к машине. Это поможет предотвратить несанкционированное использование и кражу. Соответственно, назначенный водитель транспортного средства может быть проанализирован, чтобы распознать выражение лица усталости или невнимательности. Последующее предупреждение водителя или замедление транспортного средства. В дополнение к этому умные функции, такие как регулировка кондиционирования воздуха в соответствии с количеством и местоположением пассажиров, могут улучшить качество обслуживания клиентов.

Замена драйвера

На данный момент беспилотным автомобилям в ближайшем будущем потребуется человеческий монитор для вмешательства в случае возникновения чрезвычайных ситуаций. Существующие системы недостаточно точны, чтобы соответствовать стандартам безопасности на дороге. Однако в случае полной автономии также может применяться машинное обучение. Потребуются данные от различных датчиков, чтобы система ADAS могла понимать окружающую среду. Тогда система будет полностью контролировать атрибуты транспортных средств, включая скорость, направление и прогнозирование.

Слияние датчиков

Учитывая преимущества и недостатки трех основных технологий, используемых в автономных транспортных средствах; камера, радар и лидар. Например, камеры уязвимы для условий, ухудшающих видимость, таких как туман, дождь и снег. В то время как радар и лидар могут измерять расстояние с большей точностью. Чтобы решить проблему наличия нескольких выходов от разных устройств, выходы датчиков объединяются. Камера автомобиля, радар и LiDAR могут работать вместе, обеспечивая 360-градусное наблюдение и, в свою очередь, точные прогнозы. И в этом случае ML можно использовать как дополнительный этап обработки на объединенном выходе всех этих датчиков.

Машинное обучение можно применять к выходным данным каждого датчика в отдельности, чтобы лучше классифицировать объекты, определять расстояние и движение, а также прогнозировать действия других участников дорожного движения. Таким образом. Он может анализировать выходные данные камеры и делать выводы на основе того, что видит камера. Радарные сигналы и облака точек используются для улучшения кластеризации и получения более точного трехмерного изображения объектов. Точно так же с LiDAR с высоким разрешением ML можно использовать для классификации объектов, применяя его к данным LiDAR.

Например, для первоначальной классификации можно использовать изображения с камер. Затем данные можно объединить с выходными данными LiDAR, чтобы определить расстояние и увеличить то, что видит автомобиль, а также проверить, что классифицирует камера. После объединения этих двух выходных данных к объединенным данным можно применять различные алгоритмы машинного обучения. Затем система может сделать дополнительные выводы или сделать дополнительные выводы, чтобы помочь с обнаружением, сегментацией, отслеживанием и прогнозированием.

Привод автомобиля

Силовой агрегат — это совокупность всех компонентов, участвующих в передаче мощности на колеса и толкании автомобиля вперед. Обычно точки данных временного ряда генерируются этими силовыми агрегатами. Которые могут использоваться машинным обучением для улучшения управления двигателем и батареей. Вместо того, чтобы ограничиваться установленными на заводе граничными условиями, система может адаптироваться к изменениям в автомобиле и соответствующим образом реагировать. Транспортное средство может работать с более высоким уровнем эффективности благодаря гибкости его граничных условий.

Система может изменять свои рабочие параметры с течением времени по мере ее настройки. В качестве альтернативы, если система имеет достаточную вычислительную мощность, она может адаптироваться к изменяющимся условиям в режиме реального времени. Система может научиться обнаруживать аномалии и уведомлять пользователей о необходимости технического обслуживания, а также предупреждать о надвигающемся отказе управления двигателем.

Функциональная безопасность

Машинное обучение может помочь предотвратить системные сбои, которые могут привести к фатальным последствиям. Данные, собранные по таким переменным, как температура двигателя, заряд батареи, давление масла и уровень охлаждающей жидкости, могут быть переданы в систему. Создание анализа производительности двигателя и общего состояния автомобиля. При обнаружении потенциальных неисправностей система может уведомить водителя о дальнейших действиях (ремонт или техническое обслуживание). Кроме того, машинное обучение может обеспечить хорошее обслуживание систем камер, LiDAR и радарных датчиков и уведомлять об этом.

Заключение

Самоуправляемые автомобили стали возможными благодаря алгоритмам машинного обучения. Они позволяют автомобилю собирать данные с камер и других датчиков об окружающей обстановке, интерпретировать их и решать, какие действия предпринять. Это приводит к логическому выводу, что алгоритмы машинного обучения и беспилотные автомобили — транспорт будущего.

Мы предоставляем возможность следующему поколению студентов-мыслителей, изобретателей и учащихся публиковать свои мысли, идеи и инновации в письменной форме.
Наши авторы охватывают все области тем — от Рост до технологий, вплоть до будущего и мира.
Так что, если вы чувствуете, что вот-вот прыгнете в кролика дыра в чтении этих невероятных статей, не волнуйтесь, мы чувствуем то же самое. ;)
Вот почему студенты x студенты — это место, где ваш голос будет услышан!
Звучит интересно? Почему бы не присоединиться к нам в этом эпическом путешествии?