Методы аналитики для обнаружения мошенничества

С появлением Интернета масштабы мошенничества существенно выросли, и потеря прибыли продолжает оставаться основной причиной инвестирования в инструменты и методы обнаружения мошенничества, позволяющие применять превентивные меры для прогнозирования будущих мошенничеств и корректирующие меры, чтобы остановить продолжающееся мошенничество.

Удобные инструменты не более эффективны для решения этой сложной проблемы, вместо этого компании внедрили методы обнаружения мошенничества на основе данных, основанные на алгоритмах аналитики, по трем основным причинам:

· Огромный объем данных для обработки

· Точность и последовательность по сравнению с экспертами по человеческому мошенничеству

· Эффективность времени и затрат за счет автоматизации процессов обнаружения мошенничества, которая работает 24 часа в сутки и 7 дней в неделю.

По сути, цикл обнаружения мошенничества состоит из следующих этапов:

Методы анализа мошенничества:

-1- Система правил на основе экспертов

Это традиционный подход, при котором аналитики по мошенничеству определяют бизнес-правила на основе своего опыта и деловых знаний для реализации программы, основанной на этих правилах, для фильтрации данных и выявления возможных случаев мошенничества.

Ограничение:

· Предполагает ручное расследование выявленного подозрительного случая

· Механизм правил дорого строить, его сложно обслуживать и поддерживать.

-2- Описательная аналитика (обучение без учителя)

Он обнаруживает отклонения от нормального поведения и новые модели мошенничества с помощью кластеризации, которая позволяет выявлять выбросы, используя 3 основных метода:

2.a. Метод обнаружения статистических выбросов:

z-значения: указывает числовое расстояние точки данных от среднего значения выборки. если z-оценка> 3, то точка данных является выбросом.
Анализ контрольных точек: указывает на внезапное изменение поведения учетной записи.
Анализ группы сверстников: указывает на внезапное изменение по сравнению с группой сверстников.
Оценка RFM (с недавнего времени, периодичность, денежное выражение): агрегированная информация о транзакциях, которая показывает, соответствуют ли транзакции нормальному поведению клиентов.
Анализ правил ассоциации: на основе статистики (поддержка и уверенность)

б. Алгоритмы кластеризации:

Иерархическая кластеризация (например, TwoStep): стремится построить иерархию кластеров, оценивая сходство между элементами, используя меры расстояния, такие как евклидово расстояние, и используя дендрограмму, чтобы найти оптимальное число. кластеров.

Разделение кластеризации (например, K-средние): направлено на разделение N наблюдений на K кластеров Sj (K должно быть известно), каждое наблюдение принадлежит к кластеру с ближайшим средним / центроидом, минимизируя сумму квадратов расстояний (например, евклидова) между данными и соответствующим центроидом кластера µj.

• Самоорганизующиеся карты (SOM): это искусственная нейронная сеть, обученная с использованием неконтролируемого обучения, которое снижает размерность данных, чтобы создать 2D-представление набора данных и обнаружить узлы выбросов (странные нейроны), а также способ найти клиентов, сгруппированных под ними.

c. ЕДИНЫЙ КЛАСС SVM: полезен для обнаружения редких случаев мошенничества.

Ограничение:

· Такие методы, как иерархическая кластеризация и самоорганизующиеся карты, не подходят для больших наборов данных.

· Описательная аналитика не становится более эффективной, как только мошенники применяют маскировочные стратегии мошенничества, скрывающие эти закономерности.

-3- Прогностическая аналитика (методы обучения с учителем):

Разрешить обнаружение скрытых сигналов о мошенничестве с помощью регрессии для прогнозирования непрерывной целевой переменной, такой как «количество мошенничества», или классификации для оценки «Вероятность мошенничества» с помощью целевой переменной двоичной категории «мошенничество» против «отсутствия мошенничества» или многоклассовая категория. «Серьезное мошенничество», «среднее мошенничество», «отсутствие мошенничества». У нас может быть оценка, сочетающая регрессию и классификацию, например:

Ожидаемая сумма мошенничества = «Вероятность мошенничества» x «количество мошенничества»

Основные алгоритмы: логистическая регрессия, дерево решений, нейронные сети, SVM, методы ансамблей (бэггинг, бустинг).

Ограничения:

· Исторические примеры, на которых можно поучиться (помеченный набор данных исторически наблюдаемого мошенничества).

· Не обнаруживать мошенничество, которое не было включено в историческую базу данных случаев мошенничества, из которой была извлечена модель прогнозирования.

-4- Анализ миграции кластера:

Кластерный анализ миграции является дополнительным и основан на кластерном анализе, поскольку он исследует изменения членства в кластере с течением времени, которые связаны с изменением данных, вызванным событиями, такими как новые предложения, рекламные акции, маркетинговые кампании и т. Д., Которые влияют на поведение клиентов. Анализ этих изменений в течение определенного периода времени помогает лучше понять шаблоны использования и сигналы мошенничества, такие как резкие изменения кластеризации, и проанализировать, какие атрибуты изменились наиболее существенно, и инициировать миграцию кластеризации.

Ограничение: не подходит для большого набора данных.

-5- Анализ социальных сетей

В социальных сетях люди склонны открыто раскрывать свою личную информацию и отношения в своей реальной жизни. Анализ социальных сетей (SNA) использует это поведение для понимания сетевой структуры и взаимодействий. Таким образом, исследователи мошенничества могут обнаруживать шаблоны данных через графическое представление сети, где узлы - это отдельные лица / организации, а ребра - это взаимозависимости (дружба, родство, финансовые обмены, обмен информацией и т. Д.). Они могут отслеживать мошенников, выявляя группы мошенников и дополнительных лиц / предприятий, которые могут быть связаны с одними и теми же мошенниками, на основе 2 предположений:

• Признание вины за соучастие: совершение мошенничества зависит от людей, с которыми он связан.

• Шесть степеней разделения (эксперимент Стэнли Милгрэма 1967 года): для соединения двух случайных людей необходимо менее шести человек (с появлением социальных сетей в Интернете их количество увеличилось до 4).

У нас есть 4 типа анализа социальных сетей:

Вывод:

Эффективная система обнаружения и предотвращения мошенничества будет применять комбинированную настройку этих различных инструментов для поэтапного получения опыта и понимания.

Методы аналитики для обнаружения мошенничества

Вопросы по теме