Как автоматизировать извлечение документов из страховых документов

Использование пользовательского AI и chatGPT

В современной быстро развивающейся страховой отрасли обработка огромного количества документов является важной, но часто громоздкой задачей. Интеллектуальное извлечение документов стало революционным решением для страховых компаний, упрощающим обработку заявлений о полисе, форм претензий, подтверждений и документов по андеррайтингу. Автоматизируя извлечение важных данных из этих сложных документов, Intelligent Document Extraction решает несколько проблем, с которыми сталкивается отрасль:

Декларации полиса. Эти документы содержат важную информацию, такую как номера полисов, имена застрахованных, сведения о страховом покрытии и даты вступления в силу. Ручное извлечение этой информации требует много времени и чревато ошибками, что может привести к неправильному управлению политиками.
Формы требований. При обработке требований страховые компании должны точно извлекать сведения о заявителе, информацию о происшествии и данные о покрытии, чтобы ускорить процесс рассмотрения требований. Ручная обработка этих форм увеличивает вероятность ошибок и задержек в урегулировании претензий.
Подтверждения. Подтверждения страхования изменяют существующие полисы, требуя извлечения обновленной информации о полисе и отслеживания изменений. Ввод данных вручную увеличивает риск неточностей и несоответствий, что может негативно сказаться на удовлетворенности клиентов и соблюдении нормативных требований.
Андеррайтинговые документы. Для эффективной оценки рисков и определения надлежащего страхового покрытия необходимо извлечь важные данные из различных андеррайтинговых документов. Ручная добыча замедляет процесс, что приводит к задержке принятия решений и снижению конкурентоспособности на рынке.

В этом руководстве мы собираемся обучить пользовательскую модель обработки естественного языка (NLP) для извлечения соответствующей информации из документов деклараций политики и их классификации с использованием нулевой классификации с помощью chatGPT. Для обучения мы специально обучим модель глубокого обучения на помеченном наборе данных. Затем мы создадим собственный рабочий процесс для интеграции нашей модели с chatGPT, используя функцию создания рабочего процесса AI Builder.

Разметка данных и обучение модели

Маркировка данных

Наши декларации о страховых полисах в основном представлены в неструктурированных форматах PDF с различными макетами, которые зависят от страховой компании. Чтобы преодолеть эту проблему, мы собираемся обучить пользовательскую модель NLP, которая идентифицирует конкретную информацию, которая нас интересует. В частности, мы заинтересованы в извлечении следующей информации, характерной для отрасли автострахования:

POLICYHOLDER MOBILE/CONTACT
AGENT/BROKER EMAIL
INSURANCE COMPANY NAME
PLAN NAME
POLICY NO.
POLICY START DATE
ISSUANCE DATE
POLICY EXPIRY
POLICYHOLDER NAME
POLICYHOLDER ADDRESS
ENGINE NUMBER
CHASSIS NUMBER
VEHICLE NUMBER
TOTAL LIABILITY PREMIUM
TOTAL OWN DAMAGE PREMIUM
GST
NET PREMIUM
GROSS PREMIUM
AGENT/BROKER/INTERMEDIARY CODE
AGENT CONTACT
POLICYHOLDER EMAIL ID
AGENT/BROKER/INTERMEDIARY NAME
PERIOD OF INSURANCE
BODY TYPE
ADD ON PREMIUM
FUEL TYPE

Поскольку публично такой модели не существует, нам нужно будет создать собственные обучающие данные и обучить пользовательскую модель. Для этого мы будем использовать Инструмент текстовых аннотаций UBIAI, поскольку он поддерживает маркировку OCR и обучение модели без необходимости написания кода.

Что касается маркировки, лучше маркировать с командой, чтобы повысить качество маркировки и уменьшить предвзятость. Это можно легко сделать и в UBIAI, поскольку он поддерживает комплексную функцию управления командой.

Для этого руководства мы пометили около 210 документов декларации политики, которых должно быть достаточно для начала обучения модели.

Обучение модели

Для обучения модели мы используем 120 эпох, размер партии 4 и отсев 0,35. В серверной части UBIAI использует современную модель глубокого обучения, чтобы учиться на помеченном наборе данных и корректировать его веса.

Обучение занимает примерно 1,5 часа на графическом процессоре. Как только это будет сделано, мы получим оценку для каждой сущности, как показано ниже.

В целом мы получаем относительно хороший результат в 80% и выше. Хотя наш набор данных поставляется в различных форматах, в целом у нас есть примерно 7 шаблонов для каждого поставщика, поэтому модель смогла довольно быстро обобщить даже небольшой объем размеченных данных.

Извлечение документа из страхового документа

Теперь мы готовы развернуть нашу модель в продакшене. Для этой цели мы собираемся использовать недавно запущенный инструмент под названием AI Builder, где мы можем развернуть нашу модель и подключить ее к бизнес-процессу всего за несколько кликов.

Вот краткое введение в приложение AI Builder:

Рабочий процесс, который нас интересует, выглядит следующим образом:

Импорт PDF и изображений
OCR
Извлечение с использованием нашей новой пользовательской модели ИИ
Нулевая классификация с использованием chatGPT: некоторые документы могут содержать другие страховые полисы, такие как медицинское страхование или страхование жилья. Хотелось бы правильно классифицировать тот, который относится к автострахованию.

Теперь мы готовы запустить наш рабочий процесс! Просто перетащите файлы и нажмите «Выполнить»:

После завершения обработки мы можем визуализировать процесс извлечения из нашего пользовательского рабочего процесса:

После просмотра данных мы можем извлечь их в виде CSV-файла:

Синие столбцы — это объекты, извлеченные с использованием нашей пользовательской модели ИИ, а зеленый столбец «Классификатор» — это выходные данные chatGPT с использованием нулевой классификации.

Используя эту структурированную информацию, страховые агенты могут выполнять расширенный поиск и аналитику, настраивать напоминания об истечении срока действия полисов и т. д. для существующих клиентов на основе номеров полисов, номеров транспортных средств и т. д.

Заключение

Интеллектуальные решения для извлечения документов упрощают трудоемкую задачу извлечения необходимой информации из сложных политик, тем самым повышая эффективность и точность.

Сокращая ручной труд и риск человеческой ошибки, он значительно повышает удовлетворенность клиентов и способствует соблюдению нормативных требований, что является ключевым фактором успеха любой страховой компании. Кроме того, возможность интеграции настраиваемой модели ИИ с большими языковыми моделями, такими как chatGPT, позволяет создавать мощные рабочие процессы, которые лучше удовлетворяют любые потребности бизнеса.

Если вы хотите автоматизировать извлечение данных из страховых документов, запланируйте демонстрацию сегодня!

Подпишитесь на DDIntel Здесь.

Посетите наш сайт здесь: https://www.datadriveninvestor.com

Присоединяйтесь к нашей сети здесь: https://datadriveninvestor.com/collaborate