Система распознавания лиц — Глава 3 Недостатки и дальнейшая работа

3.1 Предварительная обработка изображений

3.1.1 Феномен на данный момент

В этом проекте цветные изображения преобразуются в оттенки серого на этапе предварительной обработки. Изображение в градациях серого — это изображение, в котором значение каждого пикселя представляет собой одиночный образец, несущий информацию об интенсивности. Таким образом, изображение в градациях серого можно использовать для классификации с использованием некоторых алгоритмов. Однако существует ограничение на информацию, переносимую изображением в градациях серого, которое заключается в том, что обработка преобразования из цветного изображения в изображение в градациях серого приведет к потере некоторой подробной информации. Шкала серого только от 0 до 255, она не может точно передать все особенности цветного изображения[19]. Таким образом, использование изображения в градациях серого для классификации может привести к некоторым ошибкам, а это означает, что стабильность при использовании градаций серого не является хорошей. Этот проект - обнаружение лица, цель состоит в том, чтобы точно определить лицо. Таким образом, первый недостаток — предварительная обработка цветных изображений.

3.1.2 Улучшение в будущем

Изображение в градациях серого представляет собой двумерную матрицу, его можно рассматривать как сигнальный канал. Возможности переноса информации для сигнального канала ограничены, поэтому использование многоканальности может решить эту проблему. Цветовая модель RGB — это распространенный метод, который может представлять цветные изображения с тремя каналами. Эти три канала — красный, зеленый и синий, которые можно комбинировать различными способами для воспроизведения широкого спектра цветов.

Как показано на этом рисунке, модель RGB имеет три канала, которые сложнее, чем один канал. Поэтому многоканальность в этом проекте не используется. В будущем этот проект может быть улучшен с помощью этого. Если используется модель RGB, цвет может быть представлен более точно, а черта лица телесного цвета является эффективной функцией, которую можно использовать для распознавания лиц [20]. Когда камера делает снимки, на изображениях может быть записано не только лицо, но и окружающая среда. Таким образом, для распознавания лица важно полностью снять лицо с изображения. Для этого может быть задействован цвет кожи, если система может найти разницу между кожей и окружающей средой с помощью функции цвета, полное лицо может быть вырезано из всего изображения и введено на следующем шаге[19 ]. Однако цветовые черты лица легко интерферируют [20]. Это не недостижимый идеал, на самом деле существует своего рода метод нечеткой сегментации, который имеет правильный уровень обнаружения кожи между 94% и 96%[19]. На рисунке ниже показан этот метод нечеткой сегментации. Этот метод сегментации можно использовать для улучшения этого проекта в будущем, чтобы улучшить предварительную обработку изображений.

3.2 Алгоритмическая модель

3.2.1 Феномен на данный момент

Для программного обеспечения для обнаружения лиц модель алгоритма является наиболее важной частью, потому что вся информация должна вводиться в модель алгоритма и обрабатываться моделью алгоритма. Образец модели алгоритма легко строить, тестировать и отлаживать, напротив, возможности обработки данных и точность не лучше, чем у сложной модели алгоритма[21]. В этом проекте есть некоторые ограничения модели алгоритма, например, он может распознавать только лица, которые есть в базе данных. Если используется образец, отсутствующий в базе данных, и он имеет сходные черты лица с лицами в базе данных, система иногда ошибается при тестировании, что система не может распознать этот образец, отсутствующий в базе данных. Поскольку система сравнивает образец с базой данных и выбирает наиболее близкий результат, если образец не имеет схожих черт лица с лицами в базе данных, система может распознать этот образец не в базе данных. На самом деле ограничения вызваны точностью модели простого алгоритма. Когда точность очень высока, могут быть обнаружены очень небольшие различия между двумя лицами, что означает, что даже если образец не находится в базе данных, система может точно определить его и указать, что этого образца нет в базе данных. Таким образом, вторым недостатком является модель алгоритма.

3.2.2 Улучшение в будущем

В будущем более сложная модель алгоритма может быть использована для улучшения этого проекта. Глубокая сверточная нейронная сеть — это тип искусственной нейронной сети с прямой связью в машинном обучении, который называется сокращенно CNN[22]. CNN вдохновлен организацией зрительной коры животных, что означает, что это сложная модель. CNN обладает высокой эффективностью и точностью в классификации шаблонов из-за мощной силы характеристики обучения CNN[21]. Однако очень сложно построить правильную CNN для этого проекта. В CNN много сложных параметров, особенно в этом проекте используется цветное изображение. На рисунке ниже показана структура CNN. Как показано на этом рисунке, простая структура имеет два важных слоя: один — слой свертки, а другой — слой выборки. Слой свертки может собирать признаки этого изображения, используя специальное ядро свертки [22]. Пробный слой может извлекать признаки, а максимальная выборка имеет хорошую производительность в целом [22]. Если CNN можно будет использовать в этом проекте, точность будет значительно повышена.

3.3 Ограничение выборки

3.3.1 Феномен на данный момент

База данных важна для этого проекта, потому что базу данных можно использовать для обучения системы. В этом проекте процесс сэмплирования не очень строгий. Каждый член группы сидит перед компьютером и смотрит в камеру, а затем другие участники регулируют угол источника света и делают снимки с изменением угла источника света. Этот процесс выборки может дать образцы системы, которые подвергаются воздействию источника света под другим углом. Следовательно, система может получать более подробные черты лица для одного лица, что может повысить практическую ценность приложения. Однако проблема обнаружения лиц заключается в больших вариациях внешнего вида, вызванных некоторыми реальными факторами, такими как источник света и изменение выражения лица. Эти реальные факторы приводят к большим вариациям лица и делают алгоритм обнаружения недостаточно надежным [23]. Следовательно, система должна быть обучена преодолевать эту проблему, поэтому большой размер выборки в базе данных имеет большое значение для системы обнаружения лиц. Таким образом, третьим недостатком является ограничение в выборке.

3.3.2 Улучшение в будущем

В будущем процесс отбора проб должен быть улучшен за счет этих трех аспектов: количества, выражения лица и позы головы. Во-первых, количество одного лица в разной освещенности определяется системой, которая может получить достаточное количество черт лица для одного лица. Количество различных лиц определяется системой, способной распознавать большее количество людей. Во-вторых, во время предварительной выборки следует фиксировать различные выражения лица. На практике люди не всегда используют одно и то же выражение, поэтому, если база данных достаточно богата, система может преодолеть изменение выражения и точно распознать людей. В-третьих, при выборке следует учитывать положение головы, потому что оценка положения головы является важной начальной задачей для обнаружения человеческого лица[23]. В практической ситуации поза головы всегда меняется, и камера может захватить только часть лица, есть три измерения и следует учитывать разные углы поворота, как показано на рисунке ниже. Если эти три аспекта можно будет использовать в будущем, ценность приложения значительно повысится.

3.4 Размеры распознавания лиц

3.4.1 Феномен на данный момент

В этой системе обнаружения лиц двумерная матрица уровня серого используется для записи особенностей лица каждого участника. Поэтому участник команды должен держать один и тот же угол с захваченными лицами в базах данных при тестировании. Другими словами, одним из недостатков этой системы является то, что двумерная модель снижает точность тестирования. Кроме того, он не может отличить реальных людей от изображений, потому что изображение может иметь одинаковую матрицу характеристик с реальными людьми из-за двумерной модели.

3.4.2 Улучшение в будущем

Систему распознавания лиц можно улучшить до 3D-модели. Трехмерная информация, соответствующая поверхности лица, может быть получена с использованием различных альтернатив: системы с несколькими камерами (стереоскопия), дальномерных камер или трехмерных лазерных и сканирующих устройств [24].

Система трехмерного распознавания лиц использует функцию геометрического инварианта. В 3D-модели используются два типа функций. Одним из них является геометрическая характеристика, представляющая собой угол между соседними гранями. Другой функцией локальной вариации является локальный вектор представления формы. Эти два вида признаков объединяются вместе, и получается геометрический инвариантный признак [24]. С помощью 3D-модели в будущем можно повысить точность определения лица.

Библиография

[1] Дана Х. Баллард; Кристофер М. Браун (1982). Компьютерное зрение. Прентис Холл. ISBN 0–13–165316–4.

[2] Хуанг, Т. (1996–11–19). Вандони, Карло, Э., изд. Компьютерное зрение: эволюция и перспективы (PDF) . 19-я вычислительная школа ЦЕРН. Женева: ЦЕРН. стр. 2125. doi: 10.5170/CERN-1996–008.21. ISBN 978–9290830955.

[3] http://www.bmva.org/visionoverview Британская ассоциация машинного зрения и Общество распознавания образов, дата обращения 20 февраля 2017 г.

[4] Милан Сонка; Вацлав Главац; Роджер Бойл (2008). Обработка изображений, анализ и машинное зрение. Томсон. ISBN 0–495–08252-X.

[5] «Биометрия: обзор». Биометрия.cse.msu.edu. 6 сентября 2007 г. Архивировано из оригинала 7 января 2012 г. Проверено 10 июня 2012 г.

[6] Джайн, А.; Хонг Л. и Панканти С. (2000). «Биометрическая идентификация». Сообщения ACM, 43(2), p. 9198. DOI 10.1145/328236.328110.

[7] Джайн, Анил К.; Росс, Арун (2008). «Введение в биометрию». Ин Джейн, Аляска; Флинн; Росс, А. Справочник по биометрии. Спрингер. стр. 122. ISBN978-0-387-71040-2.

[8] Фонд программного обеспечения Python. Проверено 24 апреля 2012 г., второй раздел «Поклонники Python используют фразу «батареи включены» для описания стандартной библиотеки, которая охватывает все, от асинхронной обработки до zip-файлов».

[9] МакКоннелл, Стив (30 ноября 2009 г.). Код завершен, с. 100. ISBN9780735636972.

[10] Кульман, Дэйв. «Книга Python: начальный курс Python, продвинутый уровень Python и упражнения по Python».

[11] «О Python». Фонд программного обеспечения Python. Проверено 24 апреля 2012 г., второй раздел «Поклонники Python используют фразу «батареи в комплекте» для описания стандартной библиотеки, которая охватывает все, от асинхронной обработки до zip-файлов».

[12] Миллман, К. Джаррод; Айвазис, Майкл (2011). «Python для ученых и инженеров». Вычисления в науке и технике. 13 (2): 912.

[13] PIWilson, F.John, Распознавание черт лица с помощью классификаторов Хаара, [в сети] Доступно: http://dl.acm.org/citation.cfm?id=1127416. Доступ: 11 октября 2017 г.

[14] Виола П., Джонс М. Дж. и Сноу, International Journal of Computer Vision,

Июль 2005 г., том 63, выпуск 2, стр. 153 161.

[15] Y.Freund, Robert E. Schapire, A Short Introduction to Boosting[Online] Доступно: https://cseweb.ucsd.edu/~yfreund/papers/IntroToBoosting.pdf, доступ : 11 октября 2017 г.

[16] Jolliffem, I. Анализ главных компонентов, [онлайн] Доступно: http://onlinelibrary.wiley.com/doi/10.1002/9781118445112. stat06472/abstract;jsessionid=5B75782970C6F5BEF6316C2DC625C1A1. f02t01?userIsAuthenticated=false&deniedAccessCustomisedMessage=

Доступ: 11 октября 2017 г.

[17] П. Н. Бельюмер, Дж. П. Хеспанья и Д. Дж. Кригман, «Eigenfaces vs. Fisherfaces: распознавание с использованием линейной проекции, специфичной для класса», в IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 19, нет. 7, стр. 711–720, июль 1997 г.

[18] Дж. Бергстра, Ю. Бенжио, Случайный поиск для оптимизации гиперпараметров [онлайн]. Доступно: http://www.jmlr.org/papers/volume13/bergstra12a/bergstra12a.pdf Дата обращения: 11 октября 2017 г.

[19] Пухоль, Ф.; Пужоль, М .; Химено-Моренилья, А.; Пужоль, М., «Распознавание лиц на основе сегментации цвета кожи с использованием нечеткой энтропии», Энтропия, стр. 1–22. c22p., Том. 19 Выпуск 1, январь 2017 г.

[20] Хаджиарбаби, М.; Ага А., «Распознавание лиц на цветных изображениях с использованием сегментации кожи», Журнал автоматизации, мобильной робототехники и интеллектуальных систем, стр. 41–51. 11с., вып. 8 Выпуск 3, июль 2014 г.

[21] Тао, К.; Жан, С .; Ли, Х .; Курихара Т. «Надежное обнаружение лиц с использованием локальной CNN и SVM на основе комбинации ядра», Neurocomputing, стр. 98–105. 8с., т. 211, октябрь 2016 г.

[22] Лу, Х.; Дуан, X .; Мао, X .; Ли, Ю .; Чжан, X., «Извлечение признаков и объединение с использованием глубоких сверточных нейронных сетей для обнаружения лиц», Математические проблемы в инженерии, стр. 1–9. 9 стр., январь 2017 г.

[23] Саид А.; Аль-Хамади, А .; Гонейм, А., Сенсоры, «Оценка положения головы на фоне распознавания лиц, подобного Хаару», стр. 20945–20966. 22с., т. 1, с. 15 Выпуск 9, сентябрь 2015 г.

[24] Насер Заери, «Распознавание лиц в 3D», Арабский открытый университет, Кувейт.

[Онлайн] Доступно: https://www.intechopen.com/books/ новые подходы к характеристике и распознаванию лиц/

3d-распознавание лиц, дата обращения: 11 октября 2017 г.