Автоматизируйте обработку документов, удостоверяющих личность, с помощью Document AI

Сколько раз вы заполняли формы с запросом личной информации? Наверное, слишком много раз, чтобы сосчитать. Находясь в сети и войдя в систему, вы можете сэкономить много времени благодаря функции автозаполнения вашего браузера. В других случаях часто приходится вводить одни и те же данные вручную снова и снова. Первые процессоры идентификации Document AI теперь общедоступны и могут помочь вам решить эту проблему.

В этом посте вы увидите, как…

Обрабатывайте документы, удостоверяющие личность, с помощью Document AI
Создайте свой собственный автозаполнитель формы идентификации

Случаи использования

Вот несколько ситуаций, с которыми вы, вероятно, сталкивались:

Финансовые счета. Компании должны подтверждать личность отдельных лиц. При создании учетной записи клиента вам необходимо предоставить удостоверение личности государственного образца для проверки вручную.
Транспортные сети. Для управления подписками операторы часто управляют целым парком пользовательских идентификационных карт. Эти карты используются для личной проверки, и для них требуется фотография, удостоверяющая личность.
Входы для удостоверения личности. При пересечении границы (или даже при перелете внутри страны) вам необходимо пройти проверку личности. Главные ворота имеют оптимизированные процессы и, как правило, хорошо оборудованы для масштабирования с учетом трафика. Наоборот, небольшие ворота вдоль границ могут иметь ручные процессы — иногда на въезде и выезде — что может привести к длинным очередям и задержкам.
Отели. При поездке за границу и регистрации на рейс вам часто нужно предъявить паспорт для сканирования. Иногда вам также необходимо заполнить более длинную бумажную форму и записать те же данные.
Преимущества для клиентов. Для сертификатов на льготы или карт лояльности вам, как правило, необходимо предоставить личную информацию, которая может включать портретную фотографию.

В этих примерах запрашиваемая информация, включая портретную фотографию, уже есть в вашем документе, удостоверяющем личность. Более того, официальный орган уже подтвердил это. Проверка или извлечение данных непосредственно из этого достоверного источника не только сделает процессы быстрее и эффективнее, но и избавит конечных пользователей от многих трений.

Процессоры идентификации

Типы процессоров

Каждый процессор идентификации Document AI представляет собой модель машинного обучения, обученную извлекать информацию из стандартного документа, подтверждающего личность, такую как:

Водительские права
Национальный идентификатор
Заграничный пасспорт

Примечание. Идентификатор может содержать информацию с обеих сторон, поэтому процессоры идентификации поддерживают до двух страниц на документ.

Доступность

Общая доступность по состоянию на июнь 2022 г. В рабочей среде можно использовать два процессора идентификации США:

В настоящее время доступно в предварительном просмотре:

Детектор мошенничества с документами, удостоверяющими личность, для проверки того, был ли документ, удостоверяющий личность, подделан.
Три французских процессора идентификации

Примечания:

В разработке находятся дополнительные процессоры идентификации.
Чтобы запросить доступ к процессорам в Preview, заполните Форму запроса доступа.

Создание процессора

Вы можете создать процессор:

Вручную из Cloud Console (интерфейс веб-администратора)
Программно с помощью API

Процессоры зависят от местоположения. Это помогает гарантировать, где будет происходить обработка для каждого процессора.

Вот текущие мультирегиональные локации:

Создав процессор, вы указываете на него его идентификатор (далее PROCESSOR_ID).

Примечание. Чтобы программно управлять процессорами, см. кодовую лабораторию Управление процессорами Document AI с помощью Python.

Обработка документов

Вы можете обрабатывать документы двумя способами:

Синхронно с онлайн-запросом для анализа одного документа и непосредственного использования результатов.
Асинхронно с пакетным запросом для запуска операции пакетной обработки нескольких или более крупных документов.

Онлайн запросы

Пример онлайн-запроса REST:

Метод называется process.
Входной документ здесь представляет собой изображение PNG (в кодировке base64).
Этот запрос обрабатывается в Европейском Союзе.
Ответ возвращается синхронно.

Пакетные запросы

Пример пакетного запроса REST:

Метод называется batchProcess.
Метод batchProcess запускает пакетную обработку нескольких документов.
Этот запрос обрабатывается в США.
Ответ возвращается асинхронно; выходные файлы будут храниться под my-storage-bucket/output/.

Интерфейсы

Document AI доступен через обычные интерфейсы Google Cloud:

RPC API (gRPC с малой задержкой)
REST API (запросы и ответы JSON)
Клиентские библиотеки (оболочки gRPC, в настоящее время доступны для Python, Node.js и Java)
Облачная консоль (интерфейс веб-администратора)

Примечание. С клиентскими библиотеками вы можете разрабатывать на предпочитаемом вами языке программирования. Вы увидите пример позже в этом посте.

Поля идентификации

Типичный ответ REST выглядит следующим образом:

Поля text и pages содержат данные OCR, обнаруженные базовыми моделями ML. Эта часть является общей для всех процессоров Document AI.
Список entities содержит поля, специально обнаруженные процессором идентификации.

Вот обнаруживаемые поля идентификации:

Обратите внимание, что поля Address и MRZ Code являются необязательными. Например, паспорт США содержит MRZ, но не содержит адреса.

Обнаружение мошенничества

Доступный в предварительной версии детектор мошенничества с идентификационными документами помогает обнаруживать попытки фальсификации. Как правило, когда документ, удостоверяющий личность, не «проходит» через детектор мошенничества, ваш автоматизированный процесс может заблокировать попытку или инициировать проверку человеком.

Вот пример возвращаемых сигналов:

Пример демо

Вы можете обрабатывать документ в реальном времени, написав всего несколько строк кода.

Вот пример Python:

Эта функция использует клиентскую библиотеку Python:

Ввод представляет собой file (любой формат, поддерживаемый процессором).
client — это оболочка API (настроенная для обработки в нужном месте).
process_document вызывает метод API process, который возвращает результаты в секундах.
Результатом является структурированный Document.

Вы можете собрать обнаруженные поля, проанализировав документ entities:

Примечание. Эта функция создает сопоставление, готовое к отправке во внешний интерфейс. Аналогичную функцию можно использовать и для других специализированных процессоров.

Завершите ваше приложение:

Определите свой пользовательский интерфейс и архитектуру
Реализуйте свой бэкэнд и его API
Реализуйте свой интерфейс с помощью сочетания HTML + CSS + JS.
Добавьте пару функций: загрузку файлов, образцы документов или снимки с веб-камеры.
Вот и все; вы создали автозаполнение идентификационной формы

Вот пример веб-приложения в действии:

Вот обработка французского национального удостоверения личности с удалением изображений из клиента:

Примечание. Для документов с несколькими страницами можно использовать контейнер PDF или TIFF. В этом примере два загруженных изображения PNG объединяются серверной частью и обрабатываются как файл TIFF.

А это обработка водительских прав США, снятая веб-камерой ноутбука 720p: