1. Взвешенные по спину сферические CNN (arXiv)

Автор: Карлос Эстевес, Амиш Макадиа, Костас Данилидис.

Аннотация: Изучение эквивариантных представлений — многообещающий способ уменьшить сложность выборки и модели и улучшить производительность обобщения глубоких нейронных сетей. Сферические CNN являются успешными примерами, производящими SO (3)-эквивариантные представления сферических входных данных. Существует два основных типа сферических CNN. Первый тип поднимает входные данные к функциям в группе вращения SO(3) и применяет к группе свертки, которые требуют значительных вычислительных ресурсов, поскольку SO(3) имеет одно дополнительное измерение. Второй тип накладывает свертки непосредственно на сферу, которые ограничены зональными (изотропными) фильтрами и, таким образом, имеют ограниченную выразительность. В этой статье мы представляем новый тип сферической CNN, который позволяет эффективно фильтровать анизотропные фильтры, не выходя за пределы сферической области. Ключевая идея состоит в рассмотрении взвешенных по спину сферических функций, которые были введены в физику при изучении гравитационных волн. Это комплекснозначные функции на сфере, фазы которых меняются при вращении. Мы определяем свертку между функциями, взвешенными по спину, и строим CNN на ее основе. Взвешенные по спину функции также можно интерпретировать как сферические векторные поля, что позволяет применять их к задачам, в которых входные или выходные данные являются векторными полями. Эксперименты показывают, что наш метод превосходит предыдущие методы в таких задачах, как классификация сферических изображений, классификация 3D-форм и семантическая сегментация сферических панорам.

2. Эффективные обобщенные сферические CNN (arXiv)

Автор: Оливер Дж. Кобб, Кристофер Г. Р. Уоллис, Огюстин Н. Мавор-Паркер, Огюстен Маринье, Мэттью А. Прайс, Майель д’Авезак, Джейсон Д. Макьюэн.

Аннотация: многие проблемы в компьютерном зрении и естественных науках требуют анализа сферических данных, для которых представления могут быть эффективно изучены путем кодирования эквивалентности вращательной симметрии. Мы представляем обобщенную сферическую структуру CNN, которая охватывает различные существующие подходы и позволяет использовать их вместе друг с другом. Единственный существующий нелинейный сферический слой CNN, который является строго эквивариантным, имеет сложность O(C2L5), где C — мера репрезентативной способности, а L — предел диапазона сферических гармоник. Такая высокая вычислительная стоимость часто не позволяет использовать строго эквивариантные сферические CNN. Мы разрабатываем два новых строго эквивариантных слоя с уменьшенной сложностью O(CL4) и O(CL3logL), что делает более крупные и выразительные модели вычислительно осуществимыми. Кроме того, мы применяем эффективную теорию выборки для достижения дополнительной экономии вычислительных ресурсов. Мы показываем, что эти разработки позволяют строить более выразительные гибридные модели, которые достигают современной точности и эффективности параметров в задачах сферического эталона.