Архитектура нейронной сети, состоящая из множества капсул, которая в контексте компьютерного зрения пытается выполнять инверсную компьютерную графику. [1] [2]
Капсулы
Строительные блоки капсульных сетей, вдохновленные мини-столбцами: подмножество нейронов внутри слоя, которые предназначены для прогнозирования присутствия объекта и его позы. [3]
Фильтрация совпадений
Механизм фильтрации, выполняемый капсулами, основан на идее о том, что совпадения высокой размерности не происходят случайно: капсула более высокого порядка принимает многомерные векторы предсказания из капсул более низкого уровня и выводит высокую вероятность присутствия объекта, если найден кластер предсказаний, которые полностью согласуются. [4]
Координатная рамка
Ссылка, с помощью которой описывается поза объекта.
Теснота
Невозможность распознавать предметы в беспорядке. [5]
Организация
Вещь с отчетливым и независимым существованием; в контексте компьютерного зрения - объект или часть объекта. [6]
Иннатизм
Мнение о том, что ум рождается с определенными идеями или знаниями, в отличие от идеи чистого листа или tabula rasa. [7]
Инверсная компьютерная графика
Процесс, с помощью которого данное изображение отображается на абстрактное описание иерархии частей объектов и их параметров. [8]
Гипотеза многообразия
Гипотеза, утверждающая, что для реальных многомерных данных с N компонентами существует некоторая комбинация n ‹[9]
Мини-колонка
Группа взаимосвязанных нейронов, которые получают общие входные данные, имеют общие выходы и считаются основной вычислительной единицей коры головного мозга. [10]
Эквивалентность с местным кодом
Тип эквивариантности: часть, которая перемещается на большое расстояние, представлена другой капсулой. [11]
(Обобщенная) Поза
Положение и ориентация объекта (или части объекта). Хинтон включает масштаб, деформацию, скорость, цвет и другие параметры объекта в определение обобщенной позы. Капсула предсказывает обобщенную позу объекта на основе средневзвешенного значения входящих векторов предсказания из капсул нижнего уровня. [12] [13]
Эквивалентность с кодировкой скорости
Тип эквивариантности: часть, которая перемещается на небольшое расстояние, представлена той же капсулой, но активность капсулы изменяется. [14]
Маршрутизация
Выбор пути через нейронную сеть для каждой части входа, ведущего к соответствующим специализированным нейронам. [15]
Маршрутизация по договоренности
Предпочтение капсул более низкого уровня посылать результат в капсулы более высокого уровня, с прогнозируемым выходом которых они согласны. [16]
Ограничение единственного родителя
Ограничение, согласно которому каждая часть объекта либо имеет одного родителя, либо не имеет родителя. [17]
Функция сжатия
В контексте капсульных сетей - функция, которая гарантирует, что длина вектора не превышает единицу. [18]
Перевод
Конкретный тип преобразования, при котором каждый пиксель перемещается на одинаковое расстояние в заданном направлении. [19]
Трансляционная инвариантность
Свойство системы компьютерного зрения: перевод ввода не приводит к изменению вывода. [20]
Трансляционная эквивалентность
Свойство системы компьютерного зрения: перевод ввода приводит к эквивалентному изменению вывода. [21]
Инвариантность точки зрения
Свойство системы компьютерного зрения: изменение точки обзора не приводит к изменению результата.