Сегодня мы рассмотрим оценку позы и точность для использования в различных приложениях. Приступая к этому исследованию, мы рассмотрели различные доступные библиотеки и начали с PoseNet — «PyTorch реализация от Росса Вайтмана и OpenPose от Гинес Идальго, Чжэ Цао, Томас Саймон, Ши-Эн. Wei Hanbyul Joo and Yaser Sheikh из Университета Карнеги-Меллона.

PoseNet создан для работы на легких устройствах, таких как браузер или мобильное устройство, тогда как OpenPose гораздо точнее и предназначен для работы в системах с графическим процессором. Вы можете увидеть тесты производительности ниже.

Наш первый взгляд был на это видео по олимпийской тяжелой атлетике, где мы сравнивали результаты как OpenPose, так и Posenet.

Поснет

Он обрабатывался быстро, но на протяжении всего видео было много пропущенных поз, о чем можно судить по мерцающему и исчезающему скелету. Затем мы углубились в данные, чтобы увидеть, насколько сильно они промахнулись.

Как вы можете видеть, он довольно шумный и не может хорошо отслеживать. Поэтому мы относились к нему как к любому другому шумному датчику и провели небольшую очистку данных с некоторым сглаживанием и фильтрацией.

Прежде чем слишком углубляться в использование PoseNet, мы перешли к OpenPose, чтобы оценить его точность.

OpenPose

Мы были вдохновлены тем, насколько точным может быть OpenPose из множества источников, использующих его для различных проектов, таких как Everybody Dance Now от Caroline Chan, Shiry Ginosar, Tinghui Zhou и Alexei A. Efros. .

Полностью пораженные точностью, мы сравниваем его вывод с PoseNet.

У нас еще не было возможности изучить его данные, но мы уже можем сказать, что он намного точнее и хорошо отслеживается. Его нужно будет сгладить, и мы видели некоторые работы с использованием фильтрации Savgol, которые мы будем изучать.

Первоначально опубликовано на https://parleylabs.com 6 января 2020 г.