Архитектура нейронной сети, состоящая из множества капсул, которая в контексте компьютерного зрения пытается выполнять инверсную компьютерную графику. [1] [2]

Капсулы

Строительные блоки капсульных сетей, вдохновленные мини-столбцами: подмножество нейронов внутри слоя, которые предназначены для прогнозирования присутствия объекта и его позы. [3]

Фильтрация совпадений

Механизм фильтрации, выполняемый капсулами, основан на идее о том, что совпадения высокой размерности не происходят случайно: капсула более высокого порядка принимает многомерные векторы предсказания из капсул более низкого уровня и выводит высокую вероятность присутствия объекта, если найден кластер предсказаний, которые полностью согласуются. [4]

Координатная рамка

Ссылка, с помощью которой описывается поза объекта.

Теснота

Невозможность распознавать предметы в беспорядке. [5]

Организация

Вещь с отчетливым и независимым существованием; в контексте компьютерного зрения - объект или часть объекта. [6]

Иннатизм

Мнение о том, что ум рождается с определенными идеями или знаниями, в отличие от идеи чистого листа или tabula rasa. [7]

Инверсная компьютерная графика

Процесс, с помощью которого данное изображение отображается на абстрактное описание иерархии частей объектов и их параметров. [8]

Гипотеза многообразия

Гипотеза, утверждающая, что для реальных многомерных данных с N компонентами существует некоторая комбинация n ‹[9]

Мини-колонка

Группа взаимосвязанных нейронов, которые получают общие входные данные, имеют общие выходы и считаются основной вычислительной единицей коры головного мозга. [10]

Эквивалентность с местным кодом

Тип эквивариантности: часть, которая перемещается на большое расстояние, представлена ​​другой капсулой. [11]

(Обобщенная) Поза

Положение и ориентация объекта (или части объекта). Хинтон включает масштаб, деформацию, скорость, цвет и другие параметры объекта в определение обобщенной позы. Капсула предсказывает обобщенную позу объекта на основе средневзвешенного значения входящих векторов предсказания из капсул нижнего уровня. [12] [13]

Эквивалентность с кодировкой скорости

Тип эквивариантности: часть, которая перемещается на небольшое расстояние, представлена ​​той же капсулой, но активность капсулы изменяется. [14]

Маршрутизация

Выбор пути через нейронную сеть для каждой части входа, ведущего к соответствующим специализированным нейронам. [15]

Маршрутизация по договоренности

Предпочтение капсул более низкого уровня посылать результат в капсулы более высокого уровня, с прогнозируемым выходом которых они согласны. [16]

Ограничение единственного родителя

Ограничение, согласно которому каждая часть объекта либо имеет одного родителя, либо не имеет родителя. [17]

Функция сжатия

В контексте капсульных сетей - функция, которая гарантирует, что длина вектора не превышает единицу. [18]

Перевод

Конкретный тип преобразования, при котором каждый пиксель перемещается на одинаковое расстояние в заданном направлении. [19]

Трансляционная инвариантность

Свойство системы компьютерного зрения: перевод ввода не приводит к изменению вывода. [20]

Трансляционная эквивалентность

Свойство системы компьютерного зрения: перевод ввода приводит к эквивалентному изменению вывода. [21]

Инвариантность точки зрения

Свойство системы компьютерного зрения: изменение точки обзора не приводит к изменению результата.

Спасибо за чтение! Если вам понравилась эта статья, нажмите кнопку "Хлопнуть" и подпишитесь на меня, чтобы получать дополнительную информацию о последних ресурсах по машинному обучению. Узнайте больше о капсульных сетях на aisummary.com.