Понимание некоторых вариантов использования компьютерного зрения с помощью Amazon Rekognition

Что такое компьютерное зрение? Могут ли компьютеры видеть, как люди?

Согласно Википедии, компьютерное зрение можно определить как «Компьютерное зрение — это междисциплинарная научная область, изучающая, как компьютеры могут получать высокоуровневое понимание цифровых изображений или видео».

Почему компьютерное зрение так важно в современном мире?

Технически компьютерное зрение относится к категории искусственного интеллекта. Компьютерное зрение позволяет нам получать полезную информацию из изображений и видео. Можно возразить, что люди выполняют аналогичные функции уже несколько лет. Но способность компьютеров выполнять такого рода анализ очень быстро и сочетать его с интеллектом, полученным в прошлом, делает компьютерное зрение очень эффективным инструментом для нескольких сценариев, как показано ниже:

  1. Возможность обнаруживать небезопасные объекты, такие как оружие, а также неприемлемый контент.
  2. Распознавание лиц пассажиров в аэропортах, вокзалах, автовокзалах и торговых центрах
  3. Системы учета рабочего времени
  4. Сравнение лиц для обнаружения и предотвращения мошенничества
  5. Обнаружение текста для обеспечения безопасности, упаковки и управления запасами
  6. Обеспечьте использование средств индивидуальной защиты (СИЗ) во времена COVID
  7. Чтение эмоциональных выражений, таких как счастливые, грустные или растерянные лица, — мощный инструмент для онлайн-преподавателей.

Amazon Rekognition расширяет возможности человеческого зрения быстрее и точнее. Это бессерверноерешение, поэтому конечные пользователи не должны предоставлять какую-либо инфраструктуру. Он может выполнять анализ изображений и видео (как сохраненных, так и потоковых).

Достаточно теории, теперь давайте рассмотрим некоторые функции Amazon Rekognition на нескольких примерах. Если вы хотите продолжить, вам понадобится рабочая подписка AWS для этого упражнения:

Нажмите Далее. На вкладке "Сеть" выберите Пропустить информацию о сети.

Нажмите Далее. На вкладке Добавить открытый ключ SSH оставьте поле пустым. Нажмите Далее, а затем Готово.

  • Через несколько минут статус подготовки изменится с ВЫПОЛНЯЕТСЯ на ГОТОВО.

  • Теперь мы можем создать записную книжку Sagemaker поверх этой конечной точки. Следуйте инструкциям ниже:

  • Используйте параметры, как показано ниже, чтобы создать новый блокнот.

  • Очень скоро Статус блокнота Sagemaker изменится с "Начало работы" на Готово. На данный момент мы готовы катиться.

  • Теперь нажмите Открыть блокнот. Это откроет новую вкладку в вашем браузере.
  • Вызовите команду ниже, чтобы клонировать репозиторий кода

git клон https://github.com/mkukreja1/blogs

  • Приведенный выше репозиторий содержит папку rekognition, в которой находится блокнот Jupyter, а вложенная папка называется images. Скопируйте папку rekognition/images всегмент в S3 под вашей подпиской AWS. Просто запомните ведро S3 и путь, потому что они понадобятся нам позже. В моем случае детали S3 приведены ниже:

Название сегмента: aws-analytics-course

Путь: raw/images/

  • С помощью кнопки «Загрузить» установите Rekognition.ipynb на Jupyter.

  • Теперь нажмите Rekognition.ipynb. Откроется новая вкладка браузера.
  • Щелкните первую ячейку (отмеченную # Cell 1) и вызовите код с помощью кнопки Выполнить.
  • Давайте выполним простое обнаружение изображения. Я разместил изображение собаки на S3. Это лабрадор-ретривер.

  • Давайте посмотрим, как Amazon Rekognition описывает это изображение. Выберите ячейку 2 и нажмите Выполнить.

Обратите внимание на ярлыки, прикрепленные к изображению. Метка — это объект, сцена или концепция, обнаруженные в изображении на основе его содержимого.

Также обратите внимание на достоверность для каждого ярлыка. Показатель достоверности – это число от 0 до 100, указывающее вероятность того, что данный прогноз верен.

  • Давайте проведем еще одно распознавание. На этот раз на кадре изображен полицейский, стоящий возле станции метро под дорожным знаком.

  • Выберите ячейку 3 и нажмите Выполнить.

Обратите внимание, как Rekognition описывает это изображение, правильно идентифицируя полицейского. Я предполагаю, что достоверность относительно ниже, потому что охранник тоже может выглядеть так же.

Но как было бы здорово, если бы дорожный знак можно было прочитать как текст. Представьте, какие возможности могут открыться. Распознавание текста — это функция Amazon Rekognition, позволяющая обнаруживать и распознавать текст на изображении, например названия улиц, подписи, названия продуктов и номерные знаки транспортных средств. Давайте посмотрим, как это работает.

  • Выберите ячейку 4 и нажмите Выполнить.

Обратите внимание на поля Обнаруженный текст выше. Amazon Rekognition правильно определил текст с уличного знака как 90 St-Elmhurst Av. Он также распознал еще один фрагмент текста желтого знака парковки.

  • Очень интересной функцией Amazon Rekognition является Распознавание знаменитостей. Celebrity Recognition – это простой в использовании API, основанный на глубоком обучении, для обнаружения и распознавания известных, заслуживающих внимания или выдающихся людей в своей области. Давайте посмотрим, как работает Celebrity
    Recognition. Выберите ячейку 5 и нажмите Выполнить.

Обратите внимание на Nametag в выводе выше. Изображение было правильно идентифицировано как знаменитый Билл Гейтс.

  • Теперь вопрос: может ли Amazon Rekognition сравнивать лица? Ну, может. Сравнение лиц — это процесс сравнения одного лица с одним или несколькими лицами для измерения сходства. Я загрузил 2 разных изображения Тайгер Вудс для сравнения. Давайте посмотрим, как эти лица сравниваются.

  • Выберите ячейку 6 и нажмите Выполнить.

Amazon Rekognition сравнил лица и пришел к выводу, что эти два изображения идеально соответствуют Тайгеру Вудсу.

  • На этот раз давайте сравним Тайгера Вудса с подобным Тайгером Вудсом. Я загрузил изображение Тайгера Вудса и его двойника для сравнения. Давайте посмотрим, как эти лица сравниваются.

  • Выберите ячейку 7 и нажмите Выполнить.

Это не совпадение!

  • Amazon Rekognition может хранить информацию об обнаруженных лицах в контейнерах на стороне сервера, известных как коллекции. Вы можете использовать информацию о лицах, хранящуюся в коллекции, для поиска известных лиц на изображениях, сохраненных видео
    и потокового видео. Сохраним образ Тайгера Вудса в новой коллекции. Выберите ячейку 8 и нажмите Выполнить.

  • Теперь давайте поищем Тайгера Вудса в нашей базе данных коллекций, используя совершенно новую картинку.

  • Выберите Cell 9 и нажмите Выполнить.

Вроде картинка совпала. Сравнение лиц в коллекциях имеет большое значение в финансовой сфере для обнаружения и предотвращения мошенничества.

  • Теперь у нас есть Тайгер Вудс в наших коллекциях, давайте запросим в коллекции изображение Уилла Смита.

  • Выберите ячейку 10 и нажмите Выполнить.

Правильно, Уилла Смита нет в нашей базе коллекций.

  • Чтобы удалить коллекцию, выберите ячейку 11 и нажмите Выполнить.
  • Чем может быть полезно обнаружение объектов? Среди многих других случаев это очень полезно для безопасности. Представьте, что камера наблюдения засняла мужчину с оружием в оживленном торговом центре.

  • Выберите ячейку 12 и нажмите Выполнить.

Этикетки изображений обнаружили оружие, если мы просто передадим эти данные в систему мониторинга, способнуюоповестить соответствующие органы до того, как произойдет несчастный случай.

  • Обучение должно быть весёлым. Муж, пора идти домой, потому что твоя домашняя камера обнаружила изображение ниже. Вы рискнете пойти сегодня домой?

  • Выберите ячейку 13 и нажмите Выполнить.

Amazon Rekognition может легко определять человеческие чувства и эмоциональные выражения. Обнаружение эмоций учащихся во время онлайн-занятий помогает преподавателям определить, кто борется с

Возможности безграничны. Каждый день многие крупные организации находят новые способы использования этой технологии. Надеюсь, вы тоже найдете ему хорошее применение.

Надеюсь, эта статья была вам полезна. Amazon Rekognition рассматривается как часть курса AWS Big Data Analytics, предлагаемого Облачной академией Datafence. Курс я преподаю онлайн по выходным.

Больше контента на plainenglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку здесь.