Новое исследование иерархической кластеризации, часть 1 (алгоритмы)

Иерархическая кластеризация на основе трансформаторов для анализа сети мозга (arXiv)

Автор: Вэй Дай, Хэцзе Цуй, Сюань Кань, Ин Го, Санне ван Ройдж, Карл Ян.

Резюме: Сети мозга, графические модели, такие как модели, построенные на основе МРТ, широко используются для прогнозирования патологических процессов и анализа функций мозга. В сложной мозговой системе различия в силе нейронных связей делят мозг на различные функциональные модули (сетевые сообщества), которые имеют решающее значение для анализа мозга. Однако идентификация таких сообществ в мозге была нетривиальной задачей из-за сложности нейронных взаимодействий. В этой работе мы предлагаем новую интерпретируемую модель на основе преобразователя для совместной идентификации иерархических кластеров и классификации сетей мозга. Обширные экспериментальные результаты на реальных наборах данных сети мозга показывают, что с помощью иерархической кластеризации модель достигает повышенной точности и снижает сложность выполнения, обеспечивая при этом правдоподобное представление о функциональной организации областей мозга. Реализация доступна по адресу https://github.com/DDVD233/THC.

2. Многослойный пилинг для линейного расположения и иерархической кластеризации (arXiv)

Автор: Йоси Азар, Дэнни Вайнштейн.

Аннотация: Мы представляем новую технику многослойного пилинга для кластеризации точек в метрическом пространстве. Хорошо известная непараметрическая цель состоит в том, чтобы встроить метрическое пространство в более простое структурированное метрическое пространство, такое как линия (т. е. линейное расположение) или бинарное дерево (т. е. иерархическая кластеризация). Точки, которые находятся близко в метрическом пространстве, должны быть отображены на близкие точки/листья в линии/дереве; аналогично, точки, которые находятся далеко в метрическом пространстве, должны быть далеко на линии или на дереве. В частности, мы рассматриваем проблему максимального линейного расположения \cite{Approximation_algorithms_for_maximum_linear_arrangement} и проблему максимальной иерархической кластеризации \cite{Hierarchical_Clustering:_Objective_Functions_and_Algorithms} применительно к метрикам. Для этих целей разрабатываются схемы аппроксимации (1−ε аппроксимация для любой константы ε›0). В частности, это показывает, что с учетом метрик можно значительно улучшить прежние приближения (0,5 для максимального линейного расположения и 0,74 для максимального иерархического кластеризации). Наша основная техника, называемая многослойной очисткой, состоит в рекурсивном очистке точек, далеких от «ядра» метрического пространства. Рекурсия заканчивается, когда ядро становится достаточно плотно взвешенным метрическим пространством (т. Е. Среднее расстояние, по крайней мере, постоянно умножается на диаметр) или когда оно становится незначительным по сравнению с его внутренним вкладом в цель. Интересно, что алгоритм в случае линейного расположения намного сложнее, чем в случае иерархической кластеризации, и использует значительно более деликатную очистку.

Новое исследование иерархической кластеризации, часть 1 (алгоритмы)

Вопросы по теме