Создание простой модели компьютерного зрения — это не высшая математика — все, что вам нужно, — это доступ к качественным данным и надежная платформа обучающих данных, чтобы начать работу. Ознакомьтесь с нашими идеями для проектов компьютерного зрения для начинающих и начинайте строить!

Вот что мы рассмотрим:

1 . Инструмент подсчета посетителей
2. Распознавание цветов
3. Отслеживание объектов на видео
4. Обнаружение пешеходов
5. Распознавание жестов рук
6. Распознавание эмоций человека
7. Обнаружение полосы движения
8. Сканер визитных карточек
9. Распознавание номерных знаков
10. Распознавание рукописных цифр
11. Классификация цветков ириса
12. Семейство фотообнаружение лица
13. LEGO Brick Finder
14. Обнаружение СИЗ
15. Обнаружение лицевой маски
16. Обнаружение светофора

Создание решения для подсчета посетителей может быть как увлекательным проектом, так и проектом, который действительно находит практическое применение.

Для обнаружения и подсчета людей, присутствующих на изображении, вам потребуется соответствующий набор данных для обучения и платформа для обучения данным. Вы можете использовать бесплатный инструмент, такой как OpenCV, для маркировки ваших данных или инструмент автоматической аннотации, такой как V7, чтобы завершить этот проект быстрее.

После вспышки COVID-19 популярность решений для подсчета посетителей растет, помогая обеспечить соблюдение правил социального дистанцирования и повысить безопасность.

Вот рекомендуемый набор данных для начала:

Далее идет простой детектор цвета, который можно использовать для самых разных визуальных задач.

От определения цветов до создания приложения для зеленого экрана — замены зеленого фона пользовательским видео или фоном — до простого программного обеспечения для редактирования фотографий — создание распознавателя цветов — отличный проект для начала работы с Computer Vision.

Вот несколько интересных наборов данных, которые вы можете использовать для своего проекта:

"Исходный код"

Отслеживание объекта заключается в оценке состояния целевого объекта, присутствующего в сцене, на основе предыдущей информации.

Вы можете создавать простые модели отслеживания объектов, используя видео с участием одного объекта, например автомобиля, или нескольких объектов, таких как пешеходы, животные и так далее.

По сути, модель будет выполнять две задачи — прогнозировать следующее состояние объекта и корректировать это состояние с учетом реального состояния объекта. Модели отслеживания объектов находят применение в управлении дорожным движением и взаимодействии человека с компьютером.

Вот несколько наборов видеоданных, которые могут оказаться интересными для этой задачи компьютерного зрения:

"Исходный код"

Создание модели обнаружения объектов для обнаружения пешеходов — один из самых простых и быстрых проектов компьютерного зрения.

Все, что вам нужно, — это соответствующий набор данных с высококачественными изображениями и платформа для обучения данных для обучения и тестирования вашей модели. Вы можете использовать один из бесплатных инструментов для аннотирования изображений.

Детекторы пешеходов обычно используются в автомобильной промышленности для обеспечения безопасности дорожного движения, а также для взаимодействия человека и робота и интеллектуальных видеосистем.

Для начала рассмотрите эти наборы данных:

"Исходный код"

Распознавание жестов рук — это немного более сложная задача компьютерного зрения, требующая, чтобы вы сначала отделили область руки от фона, а затем сегментировали пальцы, чтобы предсказать жесты рук.

Вы можете использовать OpenCV, если хотите, чтобы ваша модель была простой. После обучения вы можете протестировать свою модель с помощью веб-камеры. Модели жестов рук можно использовать в VR-играх и языках жестов.

Проверьте эти наборы данных, чтобы начать:

"Исходный код"

Если вы решите выполнить более сложную задачу, рассмотрите возможность создания модели обнаружения эмоций. Вы можете создать свою модель на основе шести основных лицевых эмоций: счастья, печали, гнева, страха, отвращения и удивления.

Три основных компонента этого проекта включают предварительную обработку изображений, извлечение признаков и классификацию признаков.

Вот наборы данных, которые могут пригодиться:

"Исходный код"

Обнаружение полосы движения — еще одна модель компьютерного зрения, играющая ключевую роль в развитии автомобильной промышленности.

Используемый в основном для беспилотных автомобилей, детектор дорожных полос может стать забавным проектом для начинающих, который поможет вам получить практический опыт как с изображениями, так и с видео.

Вот пара наборов данных, которые помогут вам:

"Исходный код"

Разработать сканер визитных карточек можно с помощью технологии OCR (оптическое распознавание символов). Ваша обученная модель будет находить и извлекать информацию с визитных карточек.

По сути, этот проект будет разделен на три этапа: обработка изображений (шумоподавление), OCR (извлечение текста) и классификация (классификация ключевых свойств).

Вы можете использовать устройство чтения визитных карточек для автоматизации ввода данных.

Выберите один из этих наборов данных, чтобы начать:

Исходный код приложения

Распознаватель номерных знаков — еще одна идея для проекта компьютерного зрения с использованием OCR.

Однако есть две проблемы, связанные с этим проектом: сбор данных и различия в форматах номерных знаков в зависимости от местоположения/страны.

Поэтому ваша модель может быть неточной, если вы не обучаете большие объемы данных (если вам удастся их получить).

Примечание. Номерные знаки считаются конфиденциальными данными, поэтому при построении моделей убедитесь, что вы придерживаетесь общедоступных наборов данных.

Простая система автоматического распознавания номерных знаков может использовать базовые методы обработки изображений, и вы можете построить ее с помощью OpenCV и Python.

Однако более продвинутые системы используют детекторы объектов, такие как YOLO или Fast C-RNN.

Автоматическое распознавание номерных знаков можно использовать для обеспечения безопасности, парковки, умных городов, автоматического сбора платы за проезд и контроля доступа.

Вот несколько наборов данных, которые вы можете рассмотреть:

"Исходный код"

Этот проект — идеальное начало для новичков в области компьютерного зрения — вы можете создать простой распознаватель цифр, используя набор данных MNIST.

Получив возможность обучить свою модель с помощью сверточных нейронных сетей, вы узнаете, как разрабатывать, оценивать и использовать сверточные нейронные сети с глубоким обучением для классификации изображений.

Набор данных MNIST содержит обучающий набор из 60 000 примеров и тестовый набор из 10 000 примеров. Вы можете получить к нему доступ здесь:

"Исходный код"

Вот еще один проект компьютерного зрения, основанный на одном из самых популярных и, следовательно, легкодоступных наборов данных для распознавания образов — наборе данных классификации цветов ириса.

Он содержит три класса по 50 экземпляров в каждом, где каждый класс относится к типу ириса. Это отличный проект для начинающих, который поможет вам получить практический опыт классификации изображений, поскольку вы научите свою модель предсказывать виды нового цветка ириса.

Вы можете скачать набор данных здесь:

"Исходный код"

Возьмите свой семейный альбом, чтобы собрать исходные данные и создать модель распознавания лиц, чтобы идентифицировать членов вашей семьи на фотографиях.

Вы можете маркировать свои данные с помощью бесплатного инструмента аннотации и обучать свою модель менее чем за час. Эта задача представляет собой многоэтапный процесс, состоящий из обнаружения лиц, выравнивания, извлечения признаков и распознавания признаков.

Чтобы сделать ваш проект более интересным, а модель — более точной, рассмотрите возможность использования видеоданных. Если вы не можете получить данные самостоятельно, ознакомьтесь с этими наборами данных, чтобы начать работу с проектами по распознаванию лиц:

"Исходный код"

Если в детстве вы когда-нибудь часами собирали LEGO, этот проект может стать отличным способом подсадить вас на компьютерное зрение.

В простейшей форме вы можете построить модель для обнаружения и идентификации кубиков LEGO в режиме реального времени с помощью веб-камеры или камеры телефона. Все, что вам нужно, — это большой набор обучающих данных и инструмент для обучения вашей модели.

Вот наборы данных для вас:

"Исходный код"

Цель этого проекта компьютерного зрения — построить модель, идентифицирующую элементы СИЗ или лицевых масок. Вы можете выполнить его за пару часов и протестировать с помощью веб-камеры и в маске перед компьютером.

Модели обнаружения СИЗ находят применение в таких отраслях, как строительство или здравоохранение (больницы).

Ознакомьтесь с этими наборами данных, чтобы начать:

"Исходный код"

Подобно обнаружению СИЗ, вы можете построить простую модель обнаружения масок для лица, чтобы идентифицировать людей, которые носят и не носят маску в общественных местах.

Не забывайте собирать большие объемы данных, чтобы обеспечить точность модели при обработке различных видов окклюзии.

Ознакомьтесь с этим набором данных, чтобы начать:

"Исходный код"

Наконец, подумайте о том, чтобы потратить некоторое время на обучение детектора светофора. Этот проект относительно легко выполнить из-за наличия данных и исследований, к которым вы можете получить бесплатный доступ.

Обнаружение светофора находит применение в сфере интеллектуального транспорта, включая популярные варианты использования, такие как автономные автомобили и умные города.

Вот несколько наборов данных, которые вы можете использовать:

"Исходный код"

???? Давай будем друзьями! Подпишитесь на меня в Twitter и Facebook и свяжитесь со мной в LinkedIn. Вы тоже можете посетить Мой сайт. Не забудьте также подписаться на меня здесь, на Medium, чтобы получать больше технофильского контента.

Первоначально опубликовано на http://www.naezam.com.