Во время странного садистского эпизода я решил с головой погрузиться в самоуправляемые автомобили и искусственный интеллект в качестве побочного проекта. Имея консультационный бизнес, маленького ребенка и практически не имея свободного времени, я подумал: «Пойти на какие-нибудь курсы на стороне? Вот это отличная идея!»[1] . По крайней мере, может быть, я смогу демистифицировать некоторые технологии, из которых она состоит

Проходя курс самостоятельного вождения, я часто говорю с людьми об этой технологии. Разговаривая с людьми о беспилотных автомобилях, я обнаружил, что большинство людей либо удивлены нынешним уровнем технологий, либо в ужасе от него. Что является естественной реакцией. Вождение стало настолько явно человеческим занятием, что для большинства людей невозможно понять, что компьютер может по существу выполнять эту задачу в гораздо более высокой степени практически без ошибок водителя. Это, или они считают, что автомобили с самостоятельным вождением так далеки, что им не нужно об этом беспокоиться.

Но недооценка того, что могут сделать компьютеры, характерна не только для вождения. Будучи бесстыдно плохим шахматистом в молодые годы, я боготворил страсть и напор гроссмейстеров. Используя такие термины, как творческий, агрессивный, неумолимый, Каспаров действительно был одним из последних гроссмейстеров перед падением в серии телевизионных матчей в 1997 году. Это стало переломным моментом для компьютерных алгоритмов в шахматах, и они не оглядывались назад. В наши дни даже умеренные 20-долларовые игры имеют рейтинг выше, чем гроссмейстеры. Эпоха шахмат как вершины человеческого потенциала быстро канула в лету и не оглядывалась назад.

Точно так же беспилотные автомобили превзойдут человеческие способности в более короткие сроки. И это хорошо, потому что я не могу представить себе стресс, связанный с обучением дочери вождению.

Компьютерное зрение

У человека-водителя не так много датчиков для работы, но у него есть отличная визуальная система. И вождение заточено под работу с ним. Дорожные знаки, разметка полос движения и сигналы поворота (даже на BMW) служат подсказками для навигации в окружающей среде. Но увидеть что-то — не то же самое, что понять контекст. Мы видим дорожную разметку, но понимаем ее значение совершенно по-другому. Часть восприятия вождения сложна для компьютера (большинство водителей тоже серьезно следят за дорогой), и большинство считает, что именно в этом преуспевают люди. Если беспилотный автомобиль будет работать на дороге, он должен будет не только видеть дорогу, но и понимать смысл этой маркировки.

Большая часть технологий компьютерного зрения для беспилотных автомобилей теперь отражает то, что мы знаем (или догадываемся) о человеческом зрении. Глаз выполняет ряд преобразований изображения в колбочках, извлекая цвета, линии и узоры, и передает эту информацию в мозг для обработки. Он никогда не захватывает все изображение, а просто фокусирует различные области для поиска закономерностей. Вот почему вы можете сосчитать движения мяча, но никогда не увидеть гориллу.

NVIDIA и другие компании взяли эту концепцию и интегрировали ее в алгоритм обучения под названием Сверточная нейронная сеть (CNN). CNN является важным инструментом машинного зрения и доказала свою эффективность в огромном количестве областей компьютерного зрения. Во время вождения мы хотим сосредоточиться на визуальных указателях на дороге, и CNN можно научить определять особенности дороги, просто обучая его видеозаписи вождения.

Реализация NVIDIA зашла так далеко, что научила автомобиль перемещаться по дороге исключительно с помощью камеры. И если вы исходите из того, что этот тип технологии ограничен крупными университетами или компаниями с огромными исследовательскими бюджетами, вот та же техника, примененная к симулированному курсу в качестве небольшой части 3-месячного курса самостоятельного вождения;

Область применения компьютерного зрения для беспилотных автомобилей очень далеко продвинулась. Даже концепции здесь рудиментарны по сравнению с работой, проделанной Google, BMW, Mercedes и практически всеми другими производителями автомобилей в отношении компьютерного зрения.

Может быть, нам нужен автомобильный вызов «Человек против машины»….

[1] Если вы с ними знакомы, я работаю над парой программ Nanodegree от Udacity, специализирующихся на ИИ и беспилотных автомобилях. Они являются отличным введением в эту область и привлекают некоторых ведущих специалистов отрасли. Они охватывают огромное количество информации, и иногда кажется, что пить из пожарного шланга.