В этом уроке я буду использовать YOLO v5 для обнаружения различных поз йоги.

Введение

Используя YOLO (You Only Look Once ), мы создадим детектор объектов для обнаружения поз йоги, мы будем использовать набор данных, который я создал с помощью labelimg , помеченный набор данных можно найти на Каггл. Набор данных, а также записную книжку можно найти на Github.

Создание набора данных

Я использовал существующий набор данных, который нашел на Kaggle. А затем пометил данные с помощью ограничивающих рамок с помощью labelimg. Если вам нравится созданный мной набор данных, проголосуйте за исходный набор данных, из которого я взял данные. Это отнимает много времени, и я не смог получить достаточно данных для всех классов. Если кто-то хочет сотрудничать для завершения этого проекта, свяжитесь со мной в LinkedIn.

Обучение модели

Поскольку рекомендуется использовать предварительно обученную сеть, я использовал предварительно обученные модели YOLO версии 5. Я рекомендую использовать графический процессор или онлайн-блокнот, такой как Kaggle или Collab, для его запуска. Мы заказываем набор данных для обучения модели. Я использовал маленькую модель S для работы на своей локальной машине и большую модель X для работы на Kaggle с использованием их графического процессора. Обе модели работали примерно от пяти до десяти минут на процессоре и графическом процессоре соответственно. Чтобы узнать больше о модели, перейдите на официальный YOLO GitHub.

Полученные результаты

Это были результаты, которые я получил из данных.

Заключение

Как вы можете видеть, результаты смогли правильно идентифицировать одни классы, а не другие. Это связано с дисбалансом классов. На приведенном ниже графике показаны классы и их относительная встречаемость.

Как видите, классы Downdog и Goddess имеют гораздо больше экземпляров в наборе данных. Из-за нехватки времени я не смог пометить достаточное количество изображений каждого класса. Рекомендуемая сумма для каждого класса составляет 100–200 для пяти классов. Те, кто хочет сотрудничать со мной для завершения этого проекта, могут связаться со мной в LinkedIn.