Приложения компьютерного зрения: изображение как визуальные данные

Существует много новых бизнес-приложений для компьютерного зрения. Вы уже знаете о них?

Изображения записываются в цифровой форме с 1970-х годов, но только недавно благодаря достижениям в области облачных вычислений и специализированных процессоров бизнес-приложения для компьютерного зрения и современные модели классификации изображений вышли из пещеры.

Теперь компьютеры могут действительно понимать и извлекать смысл изображений, набор данных пикселей, который имеет высоту, ширину и даже интенсивность цвета глубины. Изображения имеют высокое разрешение и требуют высокой мощности компьютера и масштабирования для быстрой обработки, чтобы получить высокую точность для приложений классификации.

Например, к 2006 году более половины всех телефонов имели встроенные камеры. Сейчас камер и других датчиков больше, чем общее количество людей на планете.

Чтобы дать вам представление о масштабе визуальных данных, по состоянию на февраль 2020 года на YouTube каждую минуту загружалось более 500 часов видео. Это соответствует примерно 30 000 часов нового загружаемого контента в час.

Что касается изображений, по данным Google по состоянию на 2020 год, каждую неделю в сервис загружается около 28 миллиардов фотографий и видео, а всего в сервисе хранится более 4 триллионов фотографий.

Давайте посмотрим, как некоторые организации применяют интеллектуальное компьютерное зрение и модели классификации машинного обучения для своего бизнеса.

Приложения компьютерного зрения

Снег или облака?

Airbus уже использует методы классификации и распознавания изображений, чтобы различать облака и снежный покров. Эта функция очень важна для планирования безопасных маршрутов полета и отслеживания погодных условий.

Взгляните на изображения ниже. Сможете ли вы определить, какие из белых отметин являются снегом и облаками? Облака на самом деле находятся в верхнем правом углу правого изображения, выделенного красным.

Картофель для детей

Посмотрим на другое. Kewpie – традиционная японская компания, производящая продукты питания. Они используют машинное обучение, чтобы отличать плохой картофель от хорошего при приготовлении детского питания.

Они используют модель Tensorflow с изображениями нарезанного кубиками картофеля, а не целого картофеля.

После обучения модель смогла выбрать плохую картошку почти с идеальной точностью, что уменьшило общий объем случаев, которые работники завода должны были просмотреть сами.

Конечно, успех моделей зависит от маркированного изображения, которое обеспечивает команда рабочих. Они назвали изображение хорошими высококачественными данными и плохой картошкой, нарезанной кубиками, а не жестко запрограммированными правилами.

Например, если это зеленая картошка, если вы ее видите, то это плохо. Сама модель вычисляет правила между вашим набором обучающих данных, который помечен, и, в конечном счете, правильным результатом.

Экономический прогноз — отслеживание судов

Этот пример не является обычным для многих людей. Есть несколько компаний, специализирующихся на экономических прогнозах, которые отслеживают глобальный флот контейнеровозов с помощью спутниковых изображений. Зная количество перевозимого груза, они используют эти данные для корректировки своего экономического прогноза на дни или месяцы, опережающие официальные цифры.
Фактически, каждый может отслеживать эти корабли, существует множество веб-сервисов, которые можно использовать для получения общедоступной или частной информации.

Медицинские приложения

Компьютерное зрение становится основным инструментом, помогающим врачам классифицировать медицинские изображения. Такие заболевания, как диабетическая ретинопатия, можно диагностировать раньше, когда легче лечить и предотвращать слепоту.

Диабетическая ретинопатия является одной из самых быстрорастущих причин слепоты. Во всем мире около 415 миллионов пациентов с диабетом находятся в группе риска. При своевременном обнаружении болезнь поддается лечению. В противном случае это может привести к необратимой слепоте.

Модель Google Teams показала, что результаты алгоритмов ML не уступают результатам офтальмолога, который затем использует его для оказания помощи и постановки диагноза.

В последнее время эти модели даже превосходят людей и некоторые конкретные области изображений. Они будут нести ответственность за спасение многих жизней в будущем.

Есть и другие приложения, такие как генерация подписей, которые описывают, что происходит на изображении, например, карта зависимостей или оценка позы. Существует множество действительно впечатляющих вариантов использования машинного обучения, таких как обнаружение объектов и изображений, помощь в обнаружении болезней и даже создание дорожных данных в реальном времени, чтобы автомобили могли управлять сами собой.

В последующие годы эта область сильно расширится и изменит то, как мы взаимодействуем с видео и изображениями.

Давайте посмотрим.

Использованная литература:

Как ИИ может помочь сделать детское питание (и другие продукты) более безопасным
В октябре прошлого года мы начали исследовать, могут ли ИИ и машинное обучение обеспечить безопасность и чистоту наших…блог.google