TL;DR
Оператор свертки является эквивалентом трансляции, что означает, что он сохраняет трансляции, однако обработка CNN позволяет обеспечить инвариантность трансляции, которая достигается посредством надлежащего (т.е. связанного с пространственными характеристиками) уменьшения размерности.
Полная версия
Операторы вычисления представления позволяют переходить из пространства ввода (например, необработанного изображения) в пространство функций.
Так, например, каков эффект применения перевода к входному изображению на выходном представлении?
Вообще говорят, что
- Оператор является эквивариантным по отношению к Преобразованию, когда эффект Преобразования обнаруживается в выходных данных оператора.
- Оператор инвариантен по отношению к Преобразованию, когда эффект Преобразования не обнаруживается в Выходных данных Оператора.
Часто ошибочно говорят, что сверточный оператор инвариантен к трансляции, хотя на самом деле он эквивалентен трансляции, потому что показано, что оператор свертки коммутирует с оператором трансляции, и это свойство эквивалентно эквивариантности
В этом примере у нас есть
- Оператор свертки C_ {k (f)} ядра «k», действующий на сигнал «f» (например, изображение)
- оператор трансляции T {\ Delta x} вектора «\ Delta x»
и в результате коммутации мы имеем 3 приложения свертки
- в крайнем левом, оператор перевода, примененный в конце
- посередине - оператор трансляции, примененный к ядру свертки.
- в крайнем правом углу Оператор перевода применил к Сигналу
эквивалентны.
Так как оператор свертки является эквивалентом трансляции, это означает, что по его определению трансляция, работающая с входным сигналом (рис. 1, крайний правый член), все еще обнаруживается в наборе параметров вывода (рис. 1 крайний левый), что противоположно трансляционной инвариантности.
Так как же CNN добиться неизменности перевода?
«Уловка» заключается в другом виде операции, которую выполняет CNN: уменьшение размерности. Уровень объединения выполняет локальное уменьшение размерности, удаляя пространственную информацию, то есть удаляя небольшие (по сравнению с размером оператора объединения) переводы.