Введение в компьютерное зрение

Базовое объяснение компьютерного зрения за пределами шума и гламура СМИ.

«Я не боюсь компьютеров. Я боюсь их отсутствия ».
- Айзек Азимов

Компьютерное зрение было популярным термином, постоянно повторяющимся в течение последнего десятилетия, хотя его популярность со временем колебалась от неслыханной темы до горячих новостей. В результате того, что в последние годы тема компьютерного зрения стала актуальной, понимание того, что влечет за собой компьютерное зрение, было несколько шумным. Поэтому цель этой статьи - разобрать термин «компьютерное зрение» и проанализировать его составляющую, тем самым обеспечивая базовое понимание того, что такое компьютерное зрение.

Чтобы расширить тему компьютерного зрения, нам сначала нужно проанализировать компоненты термина («Компьютер» и «Зрение») и дать им определение.
Компьютер можно определить как электронную машину, способную выполнять различные процессы, вычисления и операции на основе наборов инструкций, управляемых программным или аппаратным обеспечением.

Таким образом, зрение, точнее, визуальное восприятие через зрение, можно определить как понимание локальной среды через освещение объектов в этой среде через видимый световой спектр.

Объединив два определения, элементарное объяснение состоит в том, что компьютерное зрение - это то, как машины пытаются понять то, что они видят, для достижения цели.

Мы можем расширить приведенные выше определения, заявив, что компьютерное зрение - это процесс, с помощью которого машина или система генерирует понимание визуальной информации, вызывая один или несколько алгоритмов, действующих на предоставленную информацию. Понимание затем переводится в решения, классификации, наблюдение за образцами и многое другое.

Затем перевод сопоставленного понимания используется в приложениях, аппаратном и программном обеспечении и может принимать различные формы, например следующие:

Обнаружение объектов: идентификация интересующих объектов (кошек, собак, автомобилей) на цифровых изображениях или даже видео.
Оптическое распознавание символов: перевод изображений текста, который написан или набран, в машинно-кодированный формат.
Распознавание отпечатка пальца: использование информации о шаблоне человеческого отпечатка пальца для сравнения источника отпечатка пальца и отпечатка пальца, являющегося целью.

Представляя компьютерное зрение широким массам, мы должны включить подходы, которые были приняты, чтобы позволить системам рассуждать о развитии понимания и, как следствие, разработке полезных приложений компьютерного зрения.

Существует две основных стратегии, которые система компьютерного зрения может применять для получения понимания из информации, которой она была предоставлена. А именно: подходы снизу вверх и сверху вниз.

Подход «снизу вверх» предполагает использование накопленной информации для дальнейшего понимания произвольного наблюдения; в конечном итоге все накопленное понимание приводит к решению или общему пониманию целостности объекта наблюдения.

Примером использования подхода «снизу вверх» в приложении компьютерного зрения является автоматическое распознавание номерных знаков. Этот тип приложений кажется разумным компонентом камеры контроля скорости движения.

Автоматическое распознавание номерных знаков (ANPR) с помощью восходящего подхода работает путем передачи визуальной информации (номерной знак) в нашу систему компьютерного зрения. Система переходит к некоторой форме понимания, определяя края в числах на пластинах. От информации о краях мы продвигаемся на один уровень вверх и начинаем определять линии, соединяя края (здесь мы можем видеть передачу понимания с одного уровня на другой). После этого линии могут быть соединены в формы, и, наконец, мы наблюдаем за символами, определяя области, где линии встречаются, а края закрываются.

При нисходящем подходе используются базовые знания для выработки понимания на основе наблюдения. Базовые знания действуют как справочное руководство для выбора параметров, соответствующих модели (аналогично подходу методов глубокого обучения). Этот подход можно кратко охарактеризовать как процесс, с помощью которого изображение разбивается на подкомпоненты, и достигается понимание фрагментированной информации, чтобы представить понимание целостности изображения.

Из этой статьи мы понимаем определение компьютерного зрения и его компонентов. Также упоминаются некоторые области, в которых применяются методы компьютерного зрения. Помимо этого, мы исследовали подходы, которые методы компьютерного зрения в этих системах могут использовать при попытках получить понимание на основе информации.

С этого момента вы можете изучить некоторые базовые методы обработки изображений низкого уровня, такие как обнаружение краев, уменьшение шума, повышение резкости изображения и т. Д.

Введение в компьютерное зрение

Вопросы по теме