Компьютерное зрение, технология искусственного интеллекта, которая позволяет компьютерам понимать и маркировать изображения, теперь используется в магазинах шаговой доступности, тестировании беспилотных автомобилей, ежедневной медицинской диагностике и мониторинге здоровья сельскохозяйственных культур и домашнего скота.

Из нашего исследования мы увидели, что компьютеры умеют распознавать изображения. Сегодня ведущие технологические компании, такие как Amazon, Google, Microsoft и Facebook, инвестируют миллиарды долларов в исследования в области компьютерного зрения и разработку продуктов.

В этом посте рассказывается, какие виды использования технологии компьютерного зрения в настоящее время популярны в различных отраслях:

Розничная торговля и безопасность розничной торговли
• Автомобильная промышленность
• Здравоохранение
• Сельское хозяйство
• Банковское дело
• Промышленность

Мы стремимся предоставить бизнес-лидерам общее представление о доступных на рынке приложениях и возможную отправную точку для их собственных приложений.

Компьютерное зрение в розничной торговле и безопасность розничной торговли

1. Амазонка

Возможно, наиболее широко известное использование этой технологии. Amazon недавно открыла для публики магазин Amazon Go, где покупателям не нужно стоять в очереди у кассы, чтобы оплатить свои покупки. Расположенный в Сиэтле, штат Вашингтон, магазин Go оснащен камерами, специализирующимися на компьютерном зрении. Первоначально он разрешал совершать покупки только сотрудникам Amazon, но приветствовал публичное начало в начале 2018 года.

Технология, которая используется в магазине Go, называется Just Walk Out. Как показано в этом одноминутном видео, покупатели активируют приложение для мобильных телефонов IOS или Android, прежде чем войти в ворота магазина.

Камеры размещены в потолке над проходами и на полках. Используя технологию компьютерного зрения, компания утверждает, что эти камеры способны определять, когда предмет взят с полки и кто его взял. Если товар возвращается на полку, система также может удалить этот товар из виртуальной корзины покупателя. Сеть камер позволяет приложению постоянно отслеживать людей в магазине, гарантируя, что оно выставляет счета за правильные товары правильному покупателю, когда они выходят, без необходимости использовать распознавание лиц.

Как следует из названия, покупатели могут свободно уйти из магазина, как только получат свои товары. Затем приложение отправит им онлайн-квитанцию ​​и спишет стоимость продуктов с их учетной записи Amazon.

В сфере розничной торговли Amazon подала заявку на патент на виртуальное зеркало. В патенте компания заявила: «Для развлекательных целей уникальные визуальные дисплеи могут улучшить впечатления пользователей».

Технология виртуального зеркала, показанная на патентном изображении ниже, описывается как дисплей смешанной реальности, который помещает изображения покупателя в дополненную сцену и помещает человека в виртуальное платье.

Согласно патенту, виртуальное зеркало будет использовать улучшенное распознавание лиц, подмножество компьютерного зрения, алгоритмы которого будут определять местонахождение глаз. Определение положения глаз пользователя позволит системе узнать, какие объекты пользователь видит в зеркале. Затем алгоритмы будут использовать эти данные для управления проекторами.

Amazon не делал никаких заявлений об этой разработке, и виртуальное зеркало не было развернуто, но эскизы, опубликованные патентным ведомством, показывают, как пользователь может видеть освещенные объекты, отраженные в зеркале, в сочетании с изображениями, передаваемыми с устройства отображения, для создания сцены. .

Amazon ранее выпустила Echo Look, камеру с голосовым управлением, которая делает снимки и шестисекундные видеоролики гардероба человека и рекомендует комбинации нарядов.

Этот двухминутный обзор приложения показывает, как оно утверждает, что использует виртуального помощника Amazon Alexa, чтобы помочь пользователям собирать изображения одежды и даже может рекомендовать, какой наряд лучше смотрится на человеке.

Как видно из видео, пользователь может поговорить с гаджетом и дать ему команду сделать фото в полный рост или шестисекундное видео. По словам Amazon, контент сопоставляется для создания инвентаря гардероба пользователя. Alexa сравнивает две фотографии пользователя в разных нарядах и рекомендует, что выглядит лучше.

2. StopLift
Компания StopLift из Массачусетса утверждает, что в области безопасности розничной торговли продуктами питания компания разработала систему компьютерного зрения, которая может уменьшить кражи и другие потери в сетях магазинов. Продукт компании под названием ScanItAll представляет собой систему, которая выявляет ошибки на кассе или кассиров, которые избегают сканирования, также называемую «приятельством». Sweethearting — это действие кассира по фальшивому сканированию продукта на кассе в сговоре с покупателем, который может быть другом, членом семьи или коллегой по работе.

Технология компьютерного зрения ScanItAll работает с существующими видеокамерами, установленными на потолке продуктового магазина, и системами торговых точек (POS). Через камеру программа «наблюдает», как кассир сканирует все товары на кассе. Любой продукт, который не отсканирован в POS, помечается программным обеспечением как «потеря». Получив уведомление об убытке, компания заявляет, что руководство должно сделать следующий шаг, чтобы обратиться к персоналу и принять меры для предотвращения подобных инцидентов в будущем.

Трехминутное видео ниже показывает, как ScanItAll обнаруживает множество способов пропуска товаров на кассе, таких как раздача, случайное превышение веса, сокрытие и другие, и как владельцы продуктовых магазинов могут потенциально остановить такое поведение.

Судя по новостям, компания утверждает, что установила эту технологию в некоторых супермаркетах в Род-Айленде, Массачусетсе и Австралии.

Компьютерное зрение в автомобильной промышленности

По данным Всемирной организации здравоохранения, ежегодно в результате дорожно-транспортных происшествий погибает более 1,25 миллиона человек. ВОЗ добавляет, что, по прогнозам, эта тенденция станет седьмой по значимости причиной смерти к 2030 году, если не будут приняты устойчивые меры. Почти половина жертв дорожно-транспортных происшествий приходится на «уязвимых участников дорожного движения»: пешеходов, велосипедистов и мотоциклистов. Согласно этому исследованию, у подавляющего большинства этих инцидентов есть четкая причина: человеческая ошибка и невнимательность.

1. Waymo
Одной из компаний, которая утверждает, что делает вождение более безопасным, является Waymo. Waymo, ранее известный как проект беспилотных автомобилей Google, работает над улучшением транспорта для людей, опираясь на беспилотный автомобиль и сенсорную технологию, разработанную в Google Labs.

Автомобили Waymo оснащены датчиками и программным обеспечением, способным обнаруживать на 360 градусов движения пешеходов, велосипедистов, транспортных средств, дорожных работ и других объектов на расстоянии до трех футбольных полей. Компания также сообщает, что программное обеспечение было протестировано на дорогах общего пользования протяженностью более 7 миллионов миль, чтобы научить свои автомобили безопасно перемещаться в условиях ежедневного движения.

Трехминутное видео ниже показывает, как автомобиль Waymo автономно перемещается по улицам.

Согласно видео, он может следить за транспортным потоком и правилами и обнаруживать препятствия на своем пути.

Компания утверждает, что использует глубокие сети для прогнозирования, планирования, картирования и моделирования, чтобы обучать транспортные средства маневрировать в различных ситуациях, таких как строительные площадки, уступать дорогу машинам экстренных служб, уступать место припаркованным автомобилям и останавливаться для перехода пешеходов.

2. Tesla Пожалуй, самый популярный случай — это автомобили Tesla, в которых автомобили с автопилотом оборудованы для полной возможности самостоятельного вождения.

Каждое транспортное средство оснащено восемью камерами для обзора автомобиля на 360 градусов с дальностью обзора 250 метров вокруг. Двенадцать ультразвуковых датчиков позволяют автомобилю обнаруживать как твердые, так и мягкие объекты. Компания утверждает, что радар, обращенный вперед, позволяет автомобилю видеть сквозь сильный дождь, туман, пыль и даже автомобиль впереди.

Его система камер под названием Tesla Vision работает с инструментами обработки зрения, которые, как утверждает компания, построены на глубокой нейронной сети и способны деконструировать окружающую среду, чтобы автомобиль мог перемещаться по сложным дорогам.

В этом 3-минутном видеоролике показано, как водитель, убрав руки от руля и ноги от педалей, движется в час пик в автомобиле Tesla Autopilot.

Хотя случались аварии с включенным автопилотом, почти всегда виноватым оказывался водитель, игнорирующий предупреждения автомобиля. За те шесть секунд, что руки не были на руле, его внедорожник врезался в бетонную перегородку, в результате чего погиб водитель. Позже выяснилось, что ни водитель, ни автомобиль перед аварией не затормозили.

Компьютерное зрение в сфере здравоохранения

В сфере здравоохранения технология компьютерного зрения помогает медицинским работникам точно классифицировать состояния или болезни, которые потенциально могут спасти жизни пациентов, уменьшая или устраняя неточные диагнозы и неправильное лечение.

1. Gauss Surgical
Компания Gauss Surgical разработала решения для мониторинга крови, предназначенные для оценки кровопотери в режиме реального времени во время медицинских ситуаций. Это решение, как сообщает веб-сайт, увеличивает количество переливаний и распознает кровотечение лучше, чем человеческий глаз.

Линейка решений Gauss Surgical для мониторинга крови Triton включает Triton OR, в котором используется приложение на базе iPad для захвата изображений крови на хирургических губках и аспирационных емкостях. Эти изображения обрабатываются облачным компьютерным зрением и алгоритмами машинного обучения для оценки кровопотери. Компания сообщает, что приложение в настоящее время используется медицинскими работниками в операционных больницах во время хирургических операций или кесарева сечения.

Это 6-минутное видео показывает, как Triton захватывает изображения губок или салфеток, впитывающих кровь во время медицинской процедуры, работает как сканер в реальном времени и оценивает потенциал кровопотери у пациента. Генеральный директор Gauss Surgical Сиддхарт Сатиш объясняет, как решение использует технологию компьютерного зрения для прогнозирования начала кровотечения.

Приложение Triton OR прошло клинические испытания в родильных домах для проверки правильности и достоверности и было одобрено Управлением по санитарному надзору за качеством пищевых продуктов и медикаментов США в 2017 году.

2. DeepLens и DermLens
Amazon Web Services (AWS) также разработала DeepLens, программируемую камеру с поддержкой глубокого обучения, которую можно интегрировать с программным обеспечением с открытым исходным кодом в любой отрасли. В этом видео DeepLens описывается как комплект, который программисты из разных отраслей могут использовать для разработки собственного приложения компьютерного зрения.

Одним из медицинских приложений, использующих камеру DeepLens, является DermLens, разработанное независимым стартапом. DermLens помогает пациентам контролировать состояние кожи, называемое псориазом, и управлять им. Приложение DermLens, созданное стартапом в области цифрового здравоохранения Терье Нордерхаугом из Predictably Well, предназначено в качестве службы непрерывного ухода, где сообщаемые данные доступны для врача и бригады по уходу.

В 4-минутном видеоролике разработчикам рассказывается, как создать и развернуть проект обнаружения объектов с помощью набора
DeepLens.

Для DermLens в этом коротком видеоролике объясняется, как алгоритмы приложения были обучены распознавать псориаз, передав ему 45 изображений кожи, на которых были видны типично красные и чешуйчатые сегменты. Каждое изображение в наборе снабжено маской, указывающей на аномальную кожу. Затем устройство компьютерного зрения отправляет данные в приложение, которое, в свою очередь, предоставляет пользователю оценку тяжести псориаза.

Команда DermLens также создала мобильное приложение для самоотчетов о дополнительных симптомах, таких как зуд и усталость.

Компьютерное зрение в сельском хозяйстве

Некоторые фермы начинают внедрять технологии компьютерного зрения для улучшения своей работы. Наши исследования показывают, что эти технологии направлены на то, чтобы помочь фермерам внедрить более эффективные методы выращивания, повысить урожайность и, в конечном итоге, увеличить прибыль. Мы подробно рассмотрели приложения искусственного интеллекта в сельском хозяйстве для читателей, проявляющих более общий интерес к этой области.

1. Slantrange
Slantrange утверждает, что предлагает дроны с компьютерным зрением, которые подключены к тому, что компания называет «интеллектуальной системой», состоящей из датчиков, процессоров, устройств хранения данных, сетей, программного обеспечения для анализа искусственного интеллекта и других пользователей. интерфейсы для измерения и мониторинга состояния посевов.

Компания утверждает, что дрон делает снимки полей, чтобы показать разные признаки здоровых культур по сравнению с культурами, находящимися в состоянии стресса. Эти факторы стресса включают заражение вредителями, дефицит питательных веществ и обезвоживание; показатели для оценки потенциальной урожайности при сборе урожая и другие. Эти сигнатуры передаются в аналитическую систему SlantView, которая интерпретирует данные и в конечном итоге помогает фермерам принимать решения, связанные с лечением стрессовых состояний.

В этом 5-минутном видеоролике показано, как использовать основные функции приложения SlantView, начиная с того, как пользователь может использовать это решение для определения стрессовых областей с помощью изображений, сделанных с помощью дронов.

2. Cainthus
Распознавание лиц животных — это одна из функций, которую компания Cainthus, базирующаяся в Дублине, предлагает. Cainthus использует прогнозный анализ изображений для мониторинга здоровья и благополучия сельскохозяйственных культур и домашнего скота. Cainthus использует прогнозный анализ изображений для мониторинга здоровья и благополучия сельскохозяйственных культур и домашнего скота.

Система может идентифицировать отдельных коров за считанные секунды, основываясь на характере шкуры и распознавании лиц, а также отслеживает ключевые данные, такие как потребление пищи и воды, обнаружение охоты и модели поведения. Эти фрагменты информации принимаются алгоритмами на основе ИИ и отправляют предупреждения о состоянии здоровья фермерам, которые принимают решения о производстве молока, управлении воспроизводством и общем состоянии здоровья животных.

Cainthus также утверждает, что предоставляет такие функции, как всепогодный анализ урожая по темпам роста, общему состоянию здоровья растений, выявлению факторов стресса, спелости плодов и зрелости урожая, среди прочего.

Компания Cargill, производитель и дистрибьютор сельскохозяйственной продукции, такой как сахар, рафинированное масло, хлопок, шоколад и соль, недавно заключила партнерское соглашение с Cainthus, чтобы внедрить технологию распознавания лиц на молочных фермах по всему миру. Сделка включает миноритарные инвестиции от Cargill, хотя ее условия не разглашаются.

Согласно новостным сообщениям в феврале 2018 года, Cargill и Cainthus работают над испытаниями с использованием свиней и планируют выпустить приложение в коммерческую эксплуатацию к концу года. Есть также планы по расширению применения на птицеводство и аквакультуру.

Банковское дело

В то время как большая часть нашего предыдущего освещения ИИ в банковской сфере включала обнаружение мошенничества (и это правильно) и обработку естественного языка, некоторые технологии компьютерного зрения также нашли свое применение в банковской отрасли.

1. Mitek Systems
Mitek Systems предлагает приложения для распознавания изображений, которые используют машинное обучение для классификации, извлечения данных и проверки подлинности документов, таких как паспорта, удостоверения личности, водительские права и чеки.

Приложения работают, когда клиенты фотографируют удостоверение личности или бумажный чек с помощью своего мобильного устройства и отправляют в банк пользователя, где программное обеспечение компьютерного зрения на стороне банка проверяет подлинность. После проверки и принятия банком пользователя заявка или чек обрабатываются. Согласно веб-сайту компании Mitek, для депозитов средства обычно становятся доступными для клиента в течение рабочего дня.

Двухминутная демонстрация ниже показывает, как программное обеспечение Mitek работает на мобильных телефонах, чтобы захватить изображение чека, который будет депонирован на счет:

Для начала процесса пользователь вводит номер своего мобильного телефона в форму заявки банка. На его телефон будет отправлено текстовое сообщение со ссылкой, по которой пользователь может щелкнуть, чтобы открыть функцию захвата изображения. Клиент может выбрать водительские права, удостоверение личности или паспорт. Технология Mitek распознает тысячи документов, удостоверяющих личность, со всего мира. Требуются передние и задние изображения удостоверения личности или документа.

После того, как пользователь отправил изображения, приложение в режиме реального времени будет получать обратную связь, чтобы гарантировать получение изображений высокого качества. Компания утверждает, что ее алгоритмы корректируют изображения; устранение искажений, устранение перекоса, искажение и плохие условия освещения.

Другие варианты промышленного использования:

1. Osprey Informatics
В промышленном секторе приложения компьютерного зрения, такие как Osprey Informatics, используются для мониторинга состояния критически важных инфраструктур, таких как удаленные скважины, промышленные объекты, рабочая деятельность и безопасность объекта. На своем веб-сайте компания указывает Shell и Chevron в числе своих клиентов.

В тематическом исследовании клиент утверждает, что онлайн-система визуального мониторинга удаленных нефтяных скважин Osprey помогла сократить количество посещений объекта и эквивалентные затраты. Клиент искал способы сделать добычу нефти более эффективной в условиях низких цен на сырьевые товары. В исследовании отмечается, что компания Osprey обратилась к Osprey с просьбой развернуть виртуальные системы мониторинга на нескольких объектах для наблюдения за операциями и обеспечения безопасности, а также для определения новых приложений для повышения производительности.

Система компьютерного зрения Osprey Reach была развернута на высокоприоритетных буровых площадках клиента для получения 15-минутных интервальных изображений определенных областей скважины с возможностью получения изображений по запросу и видео в реальном времени. Osprey также развернут на удаленной батарее резервуаров, что позволяет операторам считывать уровни в резервуарах и просматривать зону содержания.

Согласно тематическому исследованию, после развертывания решения Osprey клиент смог сократить рутинные посещения объектов на 50 %. Средняя стоимость осмотра скважины с личным присутствием также была снижена с 20 до 1 доллара США.

В 3-минутном видео ниже показано, как заявлено, что решение Osprey Reach позволяет операторам удаленно контролировать нефтяные скважины, увеличивая и уменьшая изображение, чтобы убедиться в отсутствии утечек в окрестностях. Видео по запросу также показывает, как насосный домкрат работает в обычном режиме.

Вывод

Приложения компьютерного зрения появились во многих отраслях, хотя некоторые из них внедрили эту технологию быстрее, чем другие. Какая бы технология компьютерного зрения ни существовала, она по-прежнему опирается на человеческий фактор, чтобы контролировать, анализировать, интерпретировать, контролировать, принимать решения и предпринимать действия.

В автомобильной промышленности глобальные компании, такие как Google и Tesla, продвигаются вперед в улучшении беспилотных автомобилей, оснащенных камерами компьютерного зрения. Однако из сообщений о несчастных случаях со смертельным исходом становится ясно, что эти автомобили не полностью готовы к выпуску в продажу и не могут быть полностью автономными.

В розничных магазинах, таких как магазин Amazon Go, сотрудники-люди продолжают работать в сфере обслуживания клиентов и за ширмами, чтобы обучать алгоритмы и подтверждать, что возможности машинного обучения работают. С точки зрения безопасности розничной торговли технология помогает записывать видео о кражах, но человеческие ресурсы должны вмешиваться, чтобы исправить ошибки сотрудников.

Применение компьютерного зрения в сельском хозяйстве развивается медленно. Но такие компании, как Cainthus, вышли на этот рынок, стремясь перенять технологии из других отраслей и применить их в сельском хозяйстве. Эти приложения утверждают, что предлагают фермерам возможность вести точное земледелие, чтобы увеличить производство с меньшими затратами. Партнерство Cainthus и Cargill потенциально может открыть другие формы искусственного интеллекта для остальной части отрасли.

Первоначально опубликовано на www.pegasusone.com. Вы можете прочитать это здесь.