Состояние распознавания выражений лица в 2022 году, часть 1

Я счастлив только при свете: влияние изменений окружающей среды на распознавание аффективных выражений лица(arXiv)

Автор:Дорин Джирак, Алессандра Шутти, Пабло Баррос, Франческо Ри

Аннотация. Взаимодействие человека и робота (HRI) значительно выигрывает от достижений в области машинного обучения, поскольку оно позволяет исследователям использовать высокопроизводительные модели для задач восприятия, таких как обнаружение и распознавание. В частности, модели глубокого обучения, предварительно обученные для извлечения признаков или используемые для классификации, в настоящее время являются признанными методами для характеристики человеческого поведения в сценариях HRI и для создания социальных роботов, которые лучше понимают это поведение. Поскольку эксперименты HRI обычно маломасштабны и ограничены конкретными лабораторными средами, вопросы заключаются в том, насколько хорошо модели глубокого обучения могут обобщать конкретные сценарии взаимодействия, и, кроме того, насколько хороша их устойчивость к изменениям окружающей среды? Эти вопросы важно решить, если область HRI хочет поместить социальных роботов-компаньонов в реальную среду, действуя последовательно, т. Е. Изменение условий освещения или перемещение людей должно по-прежнему давать те же результаты распознавания. В этой статье мы изучаем влияние различных условий изображения на распознавание возбуждения и валентности по выражениям лица человека с использованием структуры FaceChannel \cite{Barro20}. Наши результаты показывают, как интерпретация аффективных состояний человека может сильно различаться как в положительную, так и в отрицательную сторону даже при незначительном изменении свойств изображения. Мы завершаем статью важными моментами, которые следует учитывать при использовании моделей глубокого обучения для обеспечения надежной интерпретации экспериментов HRI.

2.Влияние гендерных стереотипов на распознавание выражения лица(arXiv)

Автор: Ирис Домингес-Катена, Даниэль Патернэн, Микель Галар

Аннотация .Распознавание выражений лица (FER) использует изображения лиц для определения эмоционального состояния пользователей, обеспечивая более тесное взаимодействие между людьми и автономными системами. К сожалению, поскольку изображения естественным образом включают в себя некоторую демографическую информацию, такую как предполагаемый возраст, пол и раса субъекта, эти системы подвержены проблемам демографической предвзятости. В последние годы модели на основе машинного обучения стали самым популярным подходом к FER. Эти модели требуют обучения на больших наборах данных изображений выражений лица, а их возможности обобщения тесно связаны с характеристиками набора данных. В общедоступных наборах данных FER кажущееся гендерное представительство обычно в основном сбалансировано, но их представление в индивидуальной маркировке не так, что внедряет социальные стереотипы в наборы данных и создает потенциал для причинения вреда. Хотя этот тип предвзятости до сих пор игнорировался, важно понимать, какое влияние он может иметь в контексте FER. Для этого мы используем популярный набор данных FER, FER+, для создания производных наборов данных с различной степенью стереотипной предвзятости путем изменения гендерных пропорций определенных меток. Затем мы приступаем к измерению несоответствия между производительностью моделей, обученных на этих наборах данных, для очевидных гендерных групп. Мы наблюдаем расхождение в распознавании определенных эмоций между полами до 29% при наихудших условиях предвзятости. Наши результаты также указывают на безопасный диапазон стереотипной предвзятости в наборе данных, который, по-видимому, не приводит к стереотипной предвзятости в результирующей модели. Наши результаты подтверждают необходимость тщательного анализа предвзятости общедоступных наборов данных в таких задачах, как FER, где глобальный баланс демографического представительства все еще может скрывать другие типы предвзятости, которые наносят ущерб определенным демографическим группам.

3. Пересмотр самоконтролируемого контрастного обучения для распознавания выражений лица(arXiv)

Автор: Юсюань Шу, Сяо Гу, Гуан-Чжун Ян, Бенни Ло.

Аннотация . Успех самых передовых работ по распознаванию выражений лиц в значительной степени зависит от крупномасштабных аннотированных наборов данных. Тем не менее, это создает большие проблемы при получении четких и последовательных аннотаций для наборов данных выражения лица. С другой стороны, контрастивное обучение с самоконтролем приобрело большую популярность благодаря своей простой, но эффективной стратегии обучения различению экземпляров, которая потенциально может обойти проблему аннотации. Тем не менее, остаются неотъемлемые недостатки различения на уровне экземпляра, которые становятся еще более сложными при столкновении со сложными изображениями лица. В этой статье мы возвращаемся к использованию контрастивного обучения с самоконтролем и исследуем три основные стратегии для обеспечения репрезентации конкретных выражений и минимизации влияния других атрибутов лица, таких как личность и стиль лица. Экспериментальные результаты показывают, что предлагаемый нами метод превосходит современные современные методы обучения с самостоятельным наблюдением с точки зрения как категориальных, так и размерных задач распознавания выражения лица.

Состояние распознавания выражений лица в 2022 году, часть 1

Вопросы по теме