Глубокие нейронные сети, TensorFlow, OpenCV, Librosa

Применение методов машинного обучения к решениям биометрической безопасности - одна из современных тенденций в области искусственного интеллекта. В этой статье будет рассмотрена разработка мультимодальной биометрической системы распознавания и подробно рассмотрено, почему одномодальная биометрическая идентификация не является надежной моделью.

На базовом уровне большинство биометрических данных можно разделить на две категории:

Существует поведенческая биометрия, которая включает жесты, рукописный текст, распознавание голоса и модели ходьбы.

И есть физическая биометрия, которая включает в себя распознавание отпечатков пальцев, вен, радужной оболочки и лица, а также геометрию руки.

Консультанты по науке о данных могут использовать способность машинного обучения добывать, искать и анализировать большие наборы данных для повышения производительности и надежности биометрической системы безопасности.

Распознавание лица

Алгоритм распознавания лиц анализирует 64 контрольных точки на лице человека, таких как горизонтальная и вертикальная длина носа, ширина ноздрей, размеры подбородка, расположение скул и лба, а также горизонтальность. расстояние между глазами.

Затем формируется вектор пространственного дескриптора черт лица, который сравнивается с изображениями из базы данных, определяя евклидово расстояние между этим новым лицом и каждым другим лицом в базе данных. Если совпадение существует, оно будет помечено.

Однако проблема существует. В век социальных сетей и других открытых источников фотографий получить изображение человека может быть тривиальной задачей. Одним из основных факторов безопасности при биометрическом распознавании является подтверждение того, что лицо пользователя «живое».

Для распознавания лиц необходимы две основные стратегии:

  1. Во-первых, обнаружение живости - определение того, что рассматриваемое изображение не является какой-либо маской или измененным изображением, и использование технологии защиты от спуфинга для подтверждения того, что человек перед камерой является живым человеком.
  2. Во-вторых, сравнение изображения с официальным удостоверением личности - сопоставление представленного селфи с каким-то формальным удостоверением личности. В этом методе используется технология оптического распознавания символов для проверки текста на картинке на соответствие официальной форме идентификации. Данные, к которым можно получить доступ в официальном документе, удостоверяющем личность, могут служить ценным индикатором.

Распознавание голоса

Среди систем биометрической проверки проверка голоса является одной из самых рентабельных, поскольку для нее требуется только приложение, способное классифицировать речь, и микрофон для захвата речи.

Чтобы получить высококачественный образец голоса для проверки, пользователя следует попросить указать парольную фразу, состоящую либо из слов, либо из чисел. Алгоритмы, обрабатывающие распознавание голоса, способны распознавать сходства и различия между характеристиками и паттернами голосов отдельных говорящих. После считывания образца голоса его можно напрямую сравнить с моделями голоса, которые ранее были проанализированы и сохранены в уже существующей базе данных.

Важно отметить, что текущее состояние технологии распознавания голоса не является на 100% точным или идеальным. Голос человека со временем меняется в зависимости от факторов, включая его возраст, состояние здоровья и даже настроение.

Но искусственный интеллект в области биометрии может помочь в этом. Систему можно обучить, работая с часто встречающимися искажениями речи, а также с обычным фоновым шумом. Нейронная сеть способна учиться на этих типах ложных входных сигналов и отфильтровывать их при анализе выборки голоса.

Оптическое распознавание символов

OCR, классическая задача машинного обучения и компьютерного зрения, используемая для распознавания печатных или рукописных текстовых символов внутри цифровых изображений физических документов, не является официальной технологией биометрической проверки. Но его можно использовать как предварительный инструмент для сравнения предоставленной информации с пользовательскими документами, например, для распознавания водительских прав.

Разработка мультимодальной системы идентификации

В таблице ниже вы можете найти результаты моего исследования по сравнению решений для биометрического распознавания.

Это доказывает, что ни одно унимодальное биометрическое решение не способно обеспечить достаточно высокий уровень безопасности, чтобы избежать взлома. Поэтому следует использовать мультимодальные решения.

Система мультимодального биометрического распознавания требует подтверждения как минимум двух идентификаторов, что обеспечивает более высокий уровень точности.

Давайте рассмотрим систему, основанную на технологии распознавания голоса и лиц и доступную через мобильное приложение.

На первом этапе потенциальный пользователь создаст фотографический оттиск, который будет сохранен через камеру на рассматриваемом устройстве. Библиотека OpenCV поможет преобразовать и нормализовать биометрический отпечаток.

Затем система проанализирует фотографию, используя 64 лицевых ориентира. После нанесения на карту ориентиры и общее вырезанное изображение лица пользователя будут переданы в глубокую нейронную сеть. Эта сеть была обучена с помощью библиотеки TensorFlow.

После того, как нейронная сеть обработает изображение лица, она создаст вектор признаков eDNA, который представляет все основные биометрические характеристики изображения лица пользователя. Вектор eDNA обычно имеет размер примерно 2048 бит.

Теперь вектор eDNA можно сравнить с записью, уже находящейся в файле в базе данных системы. Этот метод нельзя перепроектировать, поскольку любой потенциальный хакер не имеет возможности получить доступ к исходной записи в базе данных.

Наконец, эта система будет периодически обновлять запись изображения пользователя, не отставая от потенциально меняющегося внешнего вида пользователя.

На втором этапе пользователь через микрофон дает голосовой сэмпл. Библиотека Librosa принимает звуковой образец, преобразует его в работоспособную форму, а затем отправляет биометрические данные в нейронную сеть (DNN).

И снова будет создан вектор eDNA 2048 с учетом таких характеристик, как интонация, темп, тембр, высота тона и другие аспекты, по которым была обучена нейронная сеть.

Идея проверки личности пользователя с помощью мультимодальной комбинации биометрических данных становится все более популярной. Стимулирующим фактором этого роста популярности является потребность во все более высокой точности распознавания пользователей при одновременном отражении попыток спуфинга или взлома.

Биометрическая верификация, основанная на технологии машинного обучения, станет одной из ключевых тенденций, определяющих будущее искусственного интеллекта на 2020 год и далее.