1. Иерархическая кластеризация на основе трансформаторов для анализа сети мозга (arXiv)

Автор: Вэй Дай, Хэцзе Цуй, Сюань Кань, Ин Го, Санне ван Ройдж, Карл Ян.

Резюме: Сети мозга, графические модели, такие как модели, построенные на основе МРТ, широко используются для прогнозирования патологических процессов и анализа функций мозга. В сложной мозговой системе различия в силе нейронных связей делят мозг на различные функциональные модули (сетевые сообщества), которые имеют решающее значение для анализа мозга. Однако идентификация таких сообществ в мозге была нетривиальной задачей из-за сложности нейронных взаимодействий. В этой работе мы предлагаем новую интерпретируемую модель на основе преобразователя для совместной идентификации иерархических кластеров и классификации сетей мозга. Обширные экспериментальные результаты на реальных наборах данных сети мозга показывают, что с помощью иерархической кластеризации модель достигает повышенной точности и снижает сложность выполнения, обеспечивая при этом правдоподобное представление о функциональной организации областей мозга. Реализация доступна по адресу https://github.com/DDVD233/THC.

2. Многослойный пилинг для линейного расположения и иерархической кластеризации (arXiv)

Автор: Йоси Азар, Дэнни Вайнштейн.

Аннотация: Мы представляем новую технику многослойного пилинга для кластеризации точек в метрическом пространстве. Хорошо известная непараметрическая цель состоит в том, чтобы встроить метрическое пространство в более простое структурированное метрическое пространство, такое как линия (т. е. линейное расположение) или бинарное дерево (т. е. иерархическая кластеризация). Точки, которые находятся близко в метрическом пространстве, должны быть отображены на близкие точки/листья в линии/дереве; аналогично, точки, которые находятся далеко в метрическом пространстве, должны быть далеко на линии или на дереве. В частности, мы рассматриваем проблему максимального линейного расположения \cite{Approximation_algorithms_for_maximum_linear_arrangement} и проблему максимальной иерархической кластеризации \cite{Hierarchical_Clustering:_Objective_Functions_and_Algorithms} применительно к метрикам. Для этих целей разрабатываются схемы аппроксимации (1−ε аппроксимация для любой константы ε›0). В частности, это показывает, что с учетом метрик можно значительно улучшить прежние приближения (0,5 для максимального линейного расположения и 0,74 для максимального иерархического кластеризации). Наша основная техника, называемая многослойной очисткой, состоит в рекурсивном очистке точек, далеких от «ядра» метрического пространства. Рекурсия заканчивается, когда ядро ​​​​становится достаточно плотно взвешенным метрическим пространством (т. Е. Среднее расстояние, по крайней мере, постоянно умножается на диаметр) или когда оно становится незначительным по сравнению с его внутренним вкладом в цель. Интересно, что алгоритм в случае линейного расположения намного сложнее, чем в случае иерархической кластеризации, и использует значительно более деликатную очистку.