Microsoft Research Asia и Университет науки и технологий Китая совместно выпустили новую модель оценки позы человека, которая установила рекорды по трем тестам COCO. Нейронная сеть «HRNet» имеет отличительную параллельную структуру, которая может поддерживать представления с высоким разрешением на протяжении всего репрезентативного процесса.

Модель HRNet (сеть высокого разрешения) превзошла все существующие методы в задачах обнаружения ключевых точек, оценки позы для нескольких человек и оценки позы в наборе данных COCO. Исследовательская статья проекта была принята CVPR 2019.

Исследовательская группа разработала параллельную структуру, позволяющую модели соединять подсети с разными разрешениями новым и эффективным способом.

Большинство существующих методов соединяют подсети разрешения последовательно, от высокого до низкого разрешения или от низкого до высокого разрешения.

Сеть HRNet начинается с подсети с высоким разрешением. В отличие от существующих сетей, он не полагается на единый процесс повышения дискретизации от низкого до высокого для агрегирования представлений низкого и высокого уровня, а вместо этого проводит повторяющиеся многомасштабные объединения на протяжении всего процесса.

Исследовательская группа представляет «обменные единицы» , которые перемещаются между разными подсетями, позволяя каждой из них получать информацию из других параллельных подсетей. Изображения высокого разрешения можно получить, повторив этот процесс.

Исследователи сравнили производительность HRNet при обнаружении ключевых точек с существующими методами на проверочном наборе COCO val2017. И HRNet-W48 (большой размер), и HRNet-W32 (маленький размер) побили рекорд COCO в задаче классификации ImageNet. В тестовом наборе COCO для оценки позы и оценки позы нескольких человек и HRNet-W48, и HRNet-W32 также превзошли другие существующие методы. По другим наборам данных HRNet показал лучшие результаты, чем все конкуренты, по проверочным наборам MPII, PoseTrack и ImageNet.

HRNet имеет открытый исходный код. Помимо оценки позы, новый метод также может применяться в семантической сегментации, выравнивании лиц, обнаружении объектов, переводе изображений и других областях.

Статья Обучение глубокому представлению с высоким разрешением для оценки позы человека находится на arXiv.

Автор: Херин Чжао | Редактор: Майкл Саразен

Вышел Отчет об адаптивности AI для публичной компании Fortune Global 500 за 2018 год!
Приобретите отчет в формате Kindle на Amazon.
Подайте заявку на участие в Партнерской программе Insight, чтобы получить бесплатный полный отчет в формате PDF.

Подпишитесь на нас в Twitter @Synced_Global, чтобы получать ежедневные новости об ИИ!

Мы знаем, что вы не хотите пропустить ни одной истории. Подпишитесь на наш популярный Synced Global AI Weekly , чтобы получать еженедельные обновления AI.