Искусственный интеллект в финансах

Борьба с финансовым мошенничеством с помощью искусственного интеллекта

Использование автоэнкодера для обнаружения аномалий бухгалтерского учета

Мошенничество - огромная проблема для бизнеса; Ассоциация сертифицированных экспертов по расследованию случаев мошенничества обнаружила, что типичная организация теряет около 5% своего годового дохода из-за мошенничества. Ежегодные потери во всем мире составляют 3,7 триллиона долларов. Внутренний и внешний аудит, хотя их часто называют ключевым инструментом для раскрытия мошенничества, несут ответственность только за 14% и 3% случаев выявления мошенничества соответственно. Одна из проблем, с которой сталкиваются аудиторы, - это найти метафорическую иголку в стоге сена: поиск красных флажков среди тысяч законных записей в журнале, когда менее 1% из них могут быть обманчивыми, - определенно непростая задача. Классифицируете очень небольшое количество аномалий в большом наборе данных? Введите автоэнкодеры.

Решение: автоэнкодеры

Автоэнкодеры - это тип нейронной сети, которая пытается воспроизвести входные данные на своих выходах. Кодер, полностью подключенная искусственная нейронная сеть (ИНС), сжимает входные данные в представление в скрытом пространстве (код). Оттуда декодер, также полностью подключенный ИНС, производит вывод, используя только код. Наконец, ошибка восстановления определяет, как работает декодер; нормальные экземпляры будут иметь низкую ошибку восстановления, в то время как выбросы будут иметь высокие ошибки восстановления из-за кода. Подобно ИНС, модель обучается и со временем становится лучше, используя обратное распространение. Из изображения выше мы можем заметить, что архитектура декодера обычно отражает архитектуру кодировщика.

Автоэнкодеры подпадают под категорию обучения без учителя, что означает, что им не требуются явно помеченные данные, чтобы делать выводы из обучающей выборки. Давайте более подробно рассмотрим, как автоэнкодеры могут применяться в нашем случае использования.

Когда наш автоэнкодер обучается с использованием Синтетического набора финансовых данных из Kaggle, который содержит атрибуты записей журнала, код для автоэнкодера становится сжатым представлением входных данных (из которых 99% - обычные записи журнала). Следовательно, декодер становится очень хорошим в восстановлении обычных записей журнала. Однако аномалии - это лишь малая часть входных данных, поэтому декодер дает высокую ошибку восстановления при восстановлении записей журнала, которые отклоняются от нормы. Таким образом, предприятия предупреждаются о возможных случаях мошенничества.

Мы будем искать два типа аномалий: глобальные аномалии и локальные аномалии. Глобальные аномалии бухгалтерского учета относятся к записям журнала, содержащим редкие значения атрибутов, такие как нечетное время разноски. Тем не менее, глобальные аномалии часто можно отнести к таким событиям, как корректировки на конец года, а это означает, что большинство этих выбросов являются ложными срабатываниями. Аномалии локального учета - это записи журнала, показывающие редкую комбинацию часто встречающихся значений атрибутов. Эти необычные бухгалтерские записи часто создаются сотрудниками, намеревающимися замаскировать вредоносную деятельность как обычную деловую активность, что усложняет их обнаружение и повышает вероятность выявления мошенничества.

После запуска наших программ автоэнкодера мы видим, что 80% (56/70) глобальных аномалий и 77% (23/30) локальных аномалий, что отлично, если иметь в виду, что выбросы составляли всего 0,018% от всего набора данных. . Код всего проекта прилагается ниже.

Заключение

Автоэнкодеры могут значительно ускорить процесс обнаружения мошенничества. Они могут просмотреть весь список записей журнала и с большой вероятностью обнаружить аномалии. Между тем, это чрезвычайно утомительная задача для аудиторов, которые не всегда обнаруживают доказательства мошенничества. Хотя процесс аудита еще не готов к полной автоматизации, предприятия могут включить автокодировщики в свои системы внутреннего контроля, чтобы уменьшить количество необнаруженных случаев мошенничества.

использованная литература

[1] М. Шрейер и Т. Саттаров, Обнаружение аномалий в крупномасштабных учетных данных с использованием сетей глубокого автоэнкодера (2017), arXiv

Пока не уходи!

Я Рошан, 16-летний парень, увлеченный пересечением искусственного интеллекта и финансов. Чтобы получить более широкий обзор применения ИИ в финансах, ознакомьтесь с этой статьей.

Свяжитесь со мной в Linkedin