Обработка изображения может быть методом выполнения некоторых операций с изображением, получения улучшенного изображения или извлечения из него некоторой полезной информации. Это своего рода обработка сигнала, во время которой входом является изображение, а выходом также может быть изображение или характеристики/признаки, связанные с этим изображением. В настоящее время обработка изображений является одной из быстро развивающихся технологий. Он составляет основную область исследований в инженерии.

Компьютерное зрение — это междисциплинарная научная область, изучающая, как компьютеры могут на высоком уровне понимать цифровые изображения или видео. С инженерной точки зрения, он должен знать и автоматизировать задачи, которые может выполнять сенсорная система человека. Например, обнаружение дорожек или объектов, таких как бочки, фрукты. Основные темы, которые будут обсуждаться в этой статье, — это обнаружение дорожек и объектов.

Обнаружение полосы движения:

Обнаружение полосы — это алгоритм, который берет набор из n краевых точек и находит все линии, на которых лежат эти граничные точки. Наиболее популярными детекторами дорожек являются методы преобразования Хафа и свертки.

• Преобразование Хафа можно использовать для обнаружения линий, и на выходе получается параметрическое описание линий на изображении, например, ρ = r cos(θ) + c sin(θ). Если в пространстве изображений на основе строк и столбцов есть линия, ее можно определить ρ, расстояние от начала координат до линии вдоль перпендикуляра к линии, и θ, угол перпендикулярной проекции от начала координат до точки. линия измеряется в градусах по часовой стрелке от положительной оси ряда. Следовательно, линия на изображении соответствует точке в пространстве Хафа.[4] Таким образом, пространство Хафа для линий имеет эти два измерения θ и ρ, и линия представлена ​​​​единственной точкой, соответствующей уникальному набору этих параметров. Затем можно реализовать преобразование Хафа, выбрав набор значений ρ и θ для использования. Для каждого пикселя (r, c) изображения вычислите cos(θ) + c sin(θ) для каждого значения θ и поместите результат в соответствующую позицию в массиве (ρ, θ). В итоге значения (ρ, θ) с наибольшими значениями в массиве будут соответствовать самым сильным линиям на изображении.

• Хитрое обнаружение краев — это метод извлечения полезной структурной информации из различных объектов зрения и значительного сокращения объема обрабатываемых данных. Он нашел широкое применение в различных системах компьютерного зрения. Кэнни обнаружил, что требования к устройству обнаружения краев в различных системах машинного зрения относительно схожи. Таким образом, решение для обнаружения плацдарма для удовлетворения этих требований часто реализуется в самых разных ситуациях. Общие критерии обнаружения краев включают в себя:

o Обнаружение края с низкой частотой ошибок, что означает, что обнаружение должно точно захватывать как можно больше краев, показанных на изображении.

o точка края, обнаруженная оператором, должна точно локализоваться на галопе края.

o Конкретный край на изображении должен быть отмечен только один раз, и, по возможности, шум изображения не должен создавать ложных краев.

На картинке выше мы видим, как машина определяет полосы движения и следует за ними.

Обнаружение полосы движения используется в полуавтономных транспортных средствах, таких как Tesla или других беспилотных автомобилях, или для вспомогательного вождения. изготовление деталей. Обнаружение полосы движения и обнаружение объектов идут рука об руку для большинства процессов, выполняемых в этих задачах.

Обнаружение объектов:

Обнаружение объектов может быть методом компьютерного зрения для обнаружения экземпляров объектов на изображениях или видео. Алгоритмы обнаружения объектов обычно используют машинное обучение или глубокое обучение для получения значимых результатов. Когда люди просматривают изображения или видео, мы распознаем и находим интересующие их объекты в считанные секунды. Цель обнаружения объектов состоит в том, чтобы воспроизвести этот интеллект с помощью компьютера.

На изображении выше мы видим, что машина определила знак как знак СТОП с точностью 99,5%.

Мы можем использовать различные подходы для обнаружения объектов. Популярные подходы, основанные на глубоком обучении, использующие сверточные нейронные сети (CNN), такие как R-CNN и YOLO v2, автоматически учатся обнаруживать объекты на изображениях. Есть два основных способа начать обнаружение объектов в глубоком обучении:

1. Создайте и обучите собственный детектор объектов с помощью CNN.

2. Используйте предварительно обученный детектор объектов

В машинном обучении мы используем известный алгоритм под названием RANSAC (консенсус случайной выборки). Это итерационный метод оценки математической модели по набору данных, содержащему выбросы. Алгоритм RANSAC работает, идентифицируя выбросы в наборе данных и оценивая указанную модель с использованием данных, которые не содержат выбросов.

Он в основном используется в задачах компьютерного зрения, таких как аннотация изображений, распознавание действий, обнаружение лиц, распознавание лиц, совместная сегментация видеообъектов, а также используется в автомобилях для обнаружения транспортных средств впереди, дорожных знаков и людей перед автомобилем. Он также используется для отслеживания объектов, например отслеживания мяча во время футбольного матча, отслеживания движения биты для крикета или отслеживания человека на видео.

В заключение этой статьи скажем, что обнаружение объектов и полос движения является ключевой возможностью и будущим для большинства компьютерных систем, автономных транспортных средств и систем машинного зрения роботов. Хотя в последние годы наблюдается большой прогресс, и несколько существующих технологий теперь являются частью многих потребительских электронных устройств.

принадлежность

Вайбхав Рахеджа, четвертый курс B. Tech Integrated, компьютерная инженерия, MPSTME NMIMS.

Ссылка

· https://en.wikipedia.org/wiki/Canny_edge_detector

· https://en.wikipedia.org/wiki/Line_detection

· https://in.mathworks.com/discovery/object-detection.html