1. Последствия разреженности и высокой плотности треугольников для обучения графическому представлению(arXiv)

Автор: Ханна Сэнсфорд, Александр Моделл, Ник Уайтли, Патрик Рубин-Деланши.

Выдержка:Недавняя работа показала, что разреженные графы, содержащие много треугольников, не могут быть воспроизведены с использованием конечномерного представления узлов, в котором вероятности связей являются скалярными произведениями. Здесь мы показываем, что такие графы могут быть воспроизведены с использованием бесконечномерной модели внутреннего продукта, где представления узлов лежат на низкоразмерном многообразии. Восстановление глобального представления многообразия невозможно в разреженном режиме. Однако мы можем увеличить масштаб локальных окрестностей, где возможно представление в более низком измерении. Поскольку наши конструкции позволяют точкам быть равномерно распределенными на многообразии, мы находим свидетельство против общепринятого представления о том, что треугольники подразумевают структуру сообщества.

2.Обучение объединенному графическому представлению с использованием самоконтроля(arXiv)

Автор: Сушил Суреш, Дэнни Годбаут, Арко Мукерджи, Маянк Шривастава, Дженнифер Невилл, Пан Ли

Аннотация . Обучение федеративному графическому представлению (FedGRL) позволяет использовать преимущества распределенного обучения графическим структурированным данным, одновременно решая некоторые проблемы конфиденциальности и соответствия требованиям, связанные с курированием данных. Тем не менее, несколько интересных характеристик графических данных реального мира, а именно. Недостаток меток и неоднородность последующих задач не учитываются в текущих настройках FedGRL. В этой статье мы рассматриваем реалистичную и новую постановку проблемы, в которой кросс-хранилищные клиенты имеют доступ к огромным объемам немаркированных данных с ограниченными или немаркированными данными и, кроме того, имеют различные домены меток нижестоящего класса. Затем мы предлагаем новую формулировку FedGRL, основанную на интерполяции моделей, где мы стремимся изучить общую глобальную модель, которая оптимизируется совместно с использованием самоконтролируемой цели и получает контроль над выполнением задач через локальные клиентские модели. Мы предоставляем конкретную реализацию нашей общей формулировки с использованием BGRL, метода обучения графическому представлению SoTA с самоконтролем, и мы эмпирически проверяем его эффективность с помощью реалистичных наборов данных кросс-слио: (1) мы адаптируем сеть Twitch Gamer Network, которая естественным образом имитирует кросс-географический сценарий и показать, что наша формулировка может обеспечить последовательное и среднее значение. 6,1% больше по сравнению с традиционными контролируемыми федеративными целями обучения и в среднем. 1,7 % прироста по сравнению с самостоятельным обучением для отдельных клиентов, и (2) мы создаем и внедряем новый кросс-базовый набор данных под названием Amazon Co-purchase Networks, который обладает обеими характеристиками мотивированной постановки задачи. И, мы наблюдаем на ср. На 11,5% больше по сравнению с традиционным федеративным обучением под наблюдением и в среднем. На 1,9% больше, чем у индивидуально обучаемых моделей с самостоятельным наблюдением. Оба экспериментальных результата указывают на эффективность предложенного нами состава. Наконец, как наша новая постановка задачи, так и вклад в набор данных открывают новые возможности для исследований в FedGRL.

3.LaundroGraph: Самостоятельное обучение графическому представлению для борьбы с отмыванием денег(arXiv)

Автор:Марио Кардосо, Педро Салейро, Педро Бизарро

Аннотация. Положения о борьбе с отмыванием денег (AML) обязывают финансовые учреждения развертывать системы AML на основе набора правил, которые при срабатывании формируют основу для предупреждения о подозрении, которое должно быть оценено аналитиками. Анализ этих случаев — громоздкая и сложная задача, требующая от аналитиков навигации по большой сети финансовых взаимодействий для проверки подозрительных движений. Кроме того, эти системы имеют очень высокий уровень ложных срабатываний (по оценкам, более 95%). Нехватка меток препятствует использованию альтернативных систем, основанных на обучении с учителем, что снижает их применимость в реальных приложениях. В этой работе мы представляем LaundroGraph, новый самоконтролируемый подход к обучению представлению графа для кодирования банковских клиентов и финансовых транзакций в осмысленные представления. Эти представления используются для предоставления информации, помогающей процессу проверки AML, например, для выявления аномальных движений для данного клиента. LaundroGraph представляет базовую сеть финансовых взаимодействий в виде двудольного графа клиент-транзакция и обучает нейронную сеть графа выполнению полностью самоконтролируемой задачи прогнозирования связи. Мы эмпирически демонстрируем, что наш подход превосходит другие сильные базовые показатели при самоконтролируемом прогнозировании ссылок с использованием реального набора данных, улучшая лучший базовый уровень без графика на 12 п.п. АУК. Цель состоит в том, чтобы повысить эффективность процесса рецензирования, предоставляя аналитикам эту информацию на основе ИИ после рецензирования. Насколько нам известно, это первая система с полным самоконтролем в контексте обнаружения ОД.