Благодаря глубокому обучению, разработка возможностей распознавания лиц сделала большой шаг вперед благодаря прорывной технологии Face ID от Apple. Эта технология представляет собой алгоритм биометрического распознавания лиц, который выполняет аутентификацию пользователя и может быть адаптирован для многих случаев использования, например:

  • Разблокировка таких устройств, как телефоны или компьютеры
  • Разблокировка дверей и систем
  • Проверка онлайн-транзакций (особенно финансовых)
  • Авторизация оплаты покупок в Интернете
  • Массовое наблюдение в аэропортах, на железных дорогах, на стадионах, в государственных учреждениях и коммерческих учреждениях или для всего населения, как в Китае (оценка граждан).

Face ID оказался намного более надежным и безопасным, чем традиционное распознавание лиц, выполняемое простой двумерной фронтальной камерой, и гораздо более эффективным инструментом отслеживания, чем отпечатки пальцев, поскольку не требует физического контакта для идентификации.

В основе технологии лежит глубокое обучение, которое демонстрирует отличную способность изучать функции изображений, которые упрощают классификацию данных и распознавание лиц на основе двух типов нейронных сетей:

  • Сверточные нейронные сети (CNN или ConvNet) - это класс искусственных нейронных сетей с прямой связью, которые успешно применялись для анализа визуальных образов. CNN используется в контролируемом обучении для целей классификации и распознавания / обнаружения объектов, в неконтролируемом обучении для сегментации изображений и сжатия изображений.

  • Сети с глубоким автокодированием используются в режиме неконтролируемого обучения для уменьшения размерности. Он пытается изучить преобразования, которые сжимают ввод с помощью кодировщика f (), чтобы сжать его через узкое место (2 или 3 нейрона) и перекомпоновать его с помощью декодера g (), чтобы аппроксимировать функцию идентичности, чтобы выходные данные, аналогичные f () и g (), были нелинейными нейронными сетями. (см. рисунок ниже). Автоэнкодер сжимает представление изображения в простой вектор, что минимизирует время поиска за счет оптимизации операции сопоставления.

Как работает распознавание лиц?

Распознавание лиц часто описывается как процесс, который сначала включает четыре этапа; это: Распознавание лиц, выравнивание лиц, извлечение признаков и, наконец, распознавание лиц.

  1. Распознавание лиц. Это проблема распознавания объектов, цель которой - найти лицо пользователя на изображении и ограничить его рамкой. он основан на сверточной сети и использует такие алгоритмы, как Faster R-CNN, YOLO YOLO (You Only Look Once) или SSD (Single Shot Detector).

2. Выравнивание лица. Нормализуйте лицо, чтобы оно соответствовало базе данных, например, по геометрии и фотометрии.

3. Извлечение функций. Извлеките черты лица, которые можно использовать для распознавания. он основан на сверточной сети и автоэнкодерах для сжатия вектора признаков.

Как работает Face ID?

FaceID использует пять различных компонентов фотоники для проецирования сетки на лицо пользователя, черты лица искажают сетку, что позволяет создавать топографическую карту.

  • Обычная камера
  • Прожектор: это инфракрасный свет, который освещает ваше лицо и позволяет обнаруживать лицо перед камерой даже в условиях низкой освещенности или если человек носит очки или шляпу.
  • Точечный проектор: освещает ваше лицо более 30 000 невидимых инфракрасных точек, создавая карту глубины, которую можно прочитать с помощью инфракрасной камеры.
  • Инфракрасная камера. Инфракрасный свет можно увидеть в условиях низкой освещенности, в темноте, а также сквозь солнцезащитные очки, чтобы обнаружить ваш взгляд, и система все равно распознает вас, если совпадет достаточное количество точек данных. Затем точечная карта считывается инфракрасной камерой, и структура вашего лица передается в нейронную сеть.
  • Камера True Depth: считывает более 30 000 инфракрасных точек, чтобы сформировать карту глубины геометрии вашего 3D-лица, а также двухмерное инфракрасное изображение, которое используется для создания последовательности 2D-изображений и карт глубины, которые проталкиваются через уже обученные нейронные сети для создания математической модели вашего лица.