Глубокое обучение для машинного зрения (часть 2)

Введение в сверточные нейронные сети

Разработка сверхинтеллектуальных существ, роботов, привлекла большое внимание исследовательских центров по всему миру. Некоторые могущественные страны и крупные компании тратят миллиарды денег на дальнейшее развитие этих разумных существ.

Исследования в области компьютерного зрения начались еще в 1950-х годах. С развитием технологий и ростом интереса к нейронным сетям и глубокому обучению мир исследований расширился как никогда раньше.

Применение глубокого обучения в области зрения упростило задачу для самых сложных технологий. Потребовались десятилетия исследований, чтобы открыть, изучить, адаптировать и передать компьютеру способность обнаруживать объект с разумной точностью.

Сверточные нейронные сети (CNN или ConvNets) — одна из основных категорий для распознавания и классификации изображений. Они имеют широкое применение в распознавании изображений и видео, обработке естественного языка, обнаружении объектов, рекомендательных системах, распознавании лиц и т. д. — вот некоторые из областей, в которых широко используются CNN.

Классификация изображений берет входное изображение, обрабатывает его и классифицирует по определенным категориям (например, кошка, собака). Компьютер видит входное изображение как массив пикселей, и это зависит от разрешения изображения. В зависимости от разрешения изображения он увидит высоту x ширину x размер. Они работают, успешно создавая и моделируя информацию и формируя ее глубже в своей сети.

Архитектура сверточной нейронной сети

Давайте познакомимся со сложной, но интересной архитектурой сверточной нейронной сети.

Сверточная нейронная сетьобычно состоит из 3 слоев.

Сверточный слой
Объединение слоев
Полностью подключенный слой

Первый слой, слой свертки, попытается обнаружить края и сформировать шаблоны для обнаружения краев. Объединенный слой будет комбинировать упрощенные формы с различными позициями объектов, масштабами, освещением и т. д. Полносвязный слой сопоставит входное изображение со всеми собранными шаблонами и даст окончательный результат.

Применения глубокого обучения для компьютерного зрения

Сегментация объектов

Обнаружение объекта иногда называют сегментацией объекта или семантической сегментацией. Задача обнаружения объектов состоит в том, чтобы провести линию вокруг каждого объекта, обнаруженного на изображении и в сегментации изображения; изображение разбито на сегменты.

Обнаружение объектов использует ограничивающую рамку для идентификации объектов.
Сегментация объекта идентифицирует определенные пиксели в изображении, которые принадлежат объекту, подобно мелкозернистой локализации.
Сегментация изображения разделяет все пиксели изображения на разные категории объекта.

Перенос стиля

Передача стиля известна как передача нейронного стиля, которая представляет собой задачу изучения стиля на одном или нескольких изображениях и применения этого стиля к новому изображению. Задача скорее типа фотофильтра. Он преображает фотографии, которые могут не иметь особой объективной оценки.

Для переноса стиля часто используются наборы данных, включающие известные произведения искусства, находящиеся в открытом доступе, и фотографии из стандартных наборов данных компьютерного зрения.

Раскрашивание изображения

Раскрашивание изображения, также известное как нейронная раскраска, преобразует изображение в градациях серого в полноцветное изображение. Как и передача стиля, раскрашивание изображений — это тип фотофильтра, который преображает фотографии, которые могут не иметь объективной оценки.

Классический пример раскрашивания изображений — раскрашивание старых черно-белых фильмов и фотографий.

Реконструкция изображения

Реконструкция изображения также известна как раскрашивание изображения. Задача заполнения отсутствующих или поврежденных частей изображения является сутью реконструкции изображения. Реконструкцию изображения можно рассматривать как разновидность фотофильтра.

Например, фотореконструкция, при которой выполняется реконструкция старых, поврежденных черно-белых фотографий. Кроме того, это то же самое, что и старые черно-белые фильмы.

Суперразрешение изображения

При сверхвысоком разрешении изображения обрабатывается новая версия изображения с более высоким разрешением и детализацией, чем исходное изображение. Модели, разработанные для сверхвысокого разрешения изображений, могут быть использованы для реставрации изображений и в живописи.

Часто существующие наборы фотоданных используются в изображении сверхвысокого разрешения. При этом модели должны научиться создавать версии в супер-разрешении из уменьшенных версий фотографий.

Синтез изображений

Синтез изображений создает целевые модификации существующих изображений или создает пакет совершенно новых изображений. Синтез изображений — очень широкая область, которая быстро развивается.

Синтез изображения может включать небольшие модификации изображения и видео. Это может быть изменение стиля объекта в сцене, добавление объекта в сцену или добавление лица в сцену.

Это также может включать в себя создание совершенно новых изображений, например, создание лиц, ванных комнат или одежды.

Обнаружение объектов

Изображение содержит несколько объектов, требующих локализации и классификации. Обнаружение объектов включает в себя задачу классификации изображений с локализацией.Обнаружение объектов является более сложной задачей по сравнению с простой классификацией изображений или классификацией изображений с локализацией.

Методы, разработанные для классификации изображений с локализацией, демонстрируются при обнаружении объектов.Примеры обнаружения объектов включают рисование ограничивающей рамки и маркировку каждого объекта на улице, фотографии в помещении, каждого объекта в ландшафте и многое другое. .

Вывод:

Глубокое обучение — это, по сути, новое и модное название предмета под названием нейронные сети. Он собирается остаться и много развиваться в ближайшем будущем, достигая больших успехов.

При наличии огромного количества данных со смартфонов, датчиков устройств и интернета в целом критерии обучения выполняются. Кроме того, вычислительная мощность современных компьютеров позволяет сократить этап обучения.