Обнаружение мошенничества – это набор методов для выявления незаконной финансовой деятельности, например мошеннических транзакций по кредитным картам, когда злоумышленникимогут попытаться найти код доступа к кредитной картепроверив несколько комбинаций с помощью компьютерной программы. мы говорим об обнаружении мошенничества, когда у нас есть модель искусственного интеллекта, которая может отправлять оповещения, обнаруживая эти программы и поведение. Исторически сложилось так, что методы, используемые для построения моделей обнаружения мошенничества, представляют собой глубокие нейронные сети, но эти методы показывают свои пределы, в частности, делая нечестные прогнозы с высоким уровнем достоверности каждый раз, когда кто-либо отправляет входные данные, которых нет в обучающем наборе. Итак, как решить эту проблему и построить модель, которая может делать точные прогнозы даже с входными данными, которых нет в обучающем наборе?

Метрическое обучение:

Метричное обучение включает в себя создание алгоритмов машинного обучения для изучения функции расстояния, которую можно использовать для измерения того, насколько похожи или связаны между собой функции определенного типа. Эту модель можно использовать для классификации множеств. Его можно использовать для обнаружения банковского мошенничества, и он более эффективен, чем исторически использовавшийся метод, который делает неверные прогнозы с высокой степенью достоверности. Он включает в себя формирование модели, которая указывает число для двух заданных объектов. Это число представляет собой степень сходства между этими двумя объектами. Чем выше это число, тем больше похожи эти два объекта. Существует два метода метрического обучения и два соответствующих типа архитектуры НС.

Метод на основе взаимодействия, который создает локальные взаимодействия между двумя объектами. Глубокие нейронные сети изучают иерархические модели взаимодействия для сопоставления. Примеры архитектур нейронных сетей включают MV-LSTM, ARC-II и MatchPyramid.

Второй метод основан на представлении. В этом случае функция расстояния состоит из двух компонентов: кодерпреобразует объект во встроенное представление, обычно большой вектор с плавающей запятой, а компараторвыполняет интегрирование пару объектов из энкодера и вычисляет их сходство. Самый известный пример такого представления интеграции — Word2Vec.

Сравнение обычно представляет собой очень простую функцию, которую можно вычислить очень быстро. Это может быть косинусное сходство или даже точечное произведение.

Для удобства интеграции можно разместить в специализированном хранилище или векторном поисковике. Эти поисковые системы позволяют управлять интеграциями с помощью API, выполнять поиск и другие операции с векторами.

Наша цель — выявить аномалии во время транзакций. В то время как новые аномалии могут возникнуть в любое время, например, злоумышленники, которые пытаются угадать коды кредитных карт, могут изменить свои методы в любое время. В этом случае, чтобы иметь возможность построить модель для правильного обнаружения этих новых аномалий, модель необходимо снова обучить, отсюда и важность метрического обучения, последнее будет сравнивать характеристики двух поведений, а затем классифицировать новое поведение.

Построение модели

Метричное обучение не требует меток классов, у нас просто есть похожие и непохожие объекты, которые мы будем называть положительными и отрицательными образцами.

Существует несколько способов построения метрической модели обучения. Среди этих методов мы будем говорить о контрастных функциях потерь, это метрическая потеря обучения, которая состоит в том, чтобы вычислить экклюдову или другую метрику расстояния между подобными образцами и наказать их за то, что они находятся далеко друг от друга, и наказать разнородные образцы за то, что существа ближе, чем данная маржа

Применение модели

После того, как мы закончили построение модели, следующая задача состоит в том, чтобы запустить модель в производство, чтобы начать получать результаты, для этого возникает вопрос о хранении и управлении векторами, потому что мы должны упростить добавление новых векторов, которые могут быть рассматривается как появление нового мошеннического поведения, мы также должны иметь возможность добавлять другие условия для фильтрации поведения.

Решение:

В этой части мы расскажем вам об инструменте для выполнения такой задачи, это Qdrant, который является рекомендательным инструментом, он позволяет добавлять и удалять векторы с помощью простого API независимо от используемого языка программирования, а также позволяет дополнительная фильтрация