Возможно, вы слышали модную фразу «компьютерное зрение» и думали, что это какая-то футуристическая вещь, но она уже есть в вашей жизни.

Когда вы просыпаетесь утром, первое, что вы делаете, - это аутентифицируете свой iPhone с помощью Face ID, который ваш телефон может сделать с помощью фронтальной камеры.

Еще лежа в постели, вы открываете приложение Нанит, которое получает информацию с камеры над кроваткой вашего ребенка. Нанит сообщает вам, насколько хорошо ваш ребенок спал прошлой ночью. Вы видите, что Лили заснула за 12 минут. Она спала 10 с половиной часов, и вам с мужем пришлось навестить ее только дважды посреди ночи. Вполне нормально!

Просматривая электронную почту, вы получаете уведомление от Waldo Photos о том, что у них есть новые фотографии вашей дочери, которая уехала в лагерь. Пока учителя в лагере загружают фотографии, которые делают участников лагеря, распознавание изображений Уолдо работает в фоновом режиме, чтобы выбрать только фотографии, включая вашу дочь, избавляя вас от необходимости пролистывать фотографии всех.

Затем, когда вы готовите завтрак, ваш сын играет с iPad на столе. IPad может видеть, что находится на столе, потому что у него сверху находится камера Osmo. Ваш сын складывает части головоломки в стиле Лего и заставляет персонажа на экране своего iPad прыгать через препятствия, приказывая ему пробежать три шага вправо, спуститься на два шага и прыгнуть.

Звонит ваш дверной звонок, и вы открываете приложение Ring и видите, что это курьер с посылкой для вас. Вы говорите ему оставить пакет там, потому что сейчас у вас заняты руки, а вы заберете его позже.

Наконец вы приступаете к работе, и когда вы входите в конференц-зал для встречи, устройство Density, установленное над дверью, подсчитывает количество людей в комнате. Устройства измерения плотности собирают данные об использовании пространства в этой комнате и в каждой комнате вашего здания. Density сообщает данные вашему менеджеру объекта, который затем может лучше спланировать пространства во всех своих зданиях.

После работы вы едете в продуктовый магазин. Вы не обращали внимания ни на секунду и свернули с полосы движения, поэтому ваша машина пискнула вам. Потому что у зеркала заднего вида вашего автомобиля есть камера на задней части, которая может видеть разметку полосы движения впереди и может обнаруживать ее, когда вы отклоняетесь от своей полосы движения.

Вы пришли в магазин Amazon Go за продуктами. Вы просто берете с полок то, что хотите, и кладете в сумку. Плотная масса камер на потолке и на полках опознала вас и предмет, который вы подобрали. Когда вы выходите из магазина, вы получаете счет, отправленный прямо в приложение Amazon.

Кстати, салат, который вы купили в магазине, выращивали в теплице с установленными на потолке камерами. Эти камеры контролируют посевы, и если они обнаруживают какое-либо изменение цвета на листьях, указывающее на определенные заболевания, они предупреждают фермера о немедленном лечении.

Пока вы были на стоянке магазина, спутники, вращающиеся вокруг Земли, сфотографировали стоянку и подсчитали количество машин на ней. Они сравнили его с накануне, месяцем и годом ранее. Затем эти данные отправляются в хедж-фонд. Хедж-фонд использовал его, чтобы делать прогнозы относительно того, как обстоят дела у этого розничного продавца, и торговал на основе этой информации.

Вечером вы включаете ESPN и смотрите, как Кливленд Кавальерс играют с Голден Стэйт Уорриорз. Мало ли вы знаете, что на заднем плане GumGum незаметно наблюдает за логотипами спонсоров на экране, будь то на корте, по бокам или на футболках игроков. GumGum измеряет логотипы по их четкости, заметности, видимости, размеру, доле голоса и размещению, чтобы количественно оценить ценность, которую получил каждый спонсор во время этой игры. Затем спонсоры могут использовать эту информацию для расчета своей рентабельности инвестиций, а также для поддержки своих переговоров.

Все, что вы делаете, использует компьютерное зрение. Вы просто не думали об этом ни одним из этих способов. Одна из причин, по которой компьютерное зрение так полезно, заключается в его повсеместном распространении.

Что такое компьютерное зрение?

Давайте сделаем быстрый шаг назад. Вам не нужно разбираться в математике. Тебе просто нужно понять, что -

Компьютерное зрение позволяет интерпретировать физический мир с помощью камер и датчиков.

Раньше нам приходилось вручную вводить инструкции, чтобы машина выполняла одно действие, а затем другое.

Затем компьютеры получили возможность делать выводы о мире с помощью таких данных, как твиты, публикации и покупки. Но они понимали только числа и слова.

Теперь компьютеры могут понимать, что они видят и что ощущают. Они могут принимать изображения и видео, что позволяет им непосредственно наблюдать за физическим миром.

Это означает, что у нас может быть много камер, на которые людям не нужно смотреть. Используя камеры в качестве глаз, компьютеры станут более осведомленными и осведомленными о физическом мире и смогут напрямую взаимодействовать с нами.

Если вас интересует компьютерное зрение, посмотрите мой другой пост:

Если вы создаете стартап с использованием компьютерного зрения, я буду рад с вами поговорить. Отправь мне письмо на [email protected].