TL;DR

Оператор свертки является эквивалентом трансляции, что означает, что он сохраняет трансляции, однако обработка CNN позволяет обеспечить инвариантность трансляции, которая достигается посредством надлежащего (т.е. связанного с пространственными характеристиками) уменьшения размерности.

Полная версия

Операторы вычисления представления позволяют переходить из пространства ввода (например, необработанного изображения) в пространство функций.

Так, например, каков эффект применения перевода к входному изображению на выходном представлении?

Вообще говорят, что

  • Оператор является эквивариантным по отношению к Преобразованию, когда эффект Преобразования обнаруживается в выходных данных оператора.
  • Оператор инвариантен по отношению к Преобразованию, когда эффект Преобразования не обнаруживается в Выходных данных Оператора.

Часто ошибочно говорят, что сверточный оператор инвариантен к трансляции, хотя на самом деле он эквивалентен трансляции, потому что показано, что оператор свертки коммутирует с оператором трансляции, и это свойство эквивалентно эквивариантности

В этом примере у нас есть

  • Оператор свертки C_ {k (f)} ядра «k», действующий на сигнал «f» (например, изображение)
  • оператор трансляции T {\ Delta x} вектора «\ Delta x»

и в результате коммутации мы имеем 3 приложения свертки

  • в крайнем левом, оператор перевода, примененный в конце
  • посередине - оператор трансляции, примененный к ядру свертки.
  • в крайнем правом углу Оператор перевода применил к Сигналу

эквивалентны.

Так как оператор свертки является эквивалентом трансляции, это означает, что по его определению трансляция, работающая с входным сигналом (рис. 1, крайний правый член), все еще обнаруживается в наборе параметров вывода (рис. 1 крайний левый), что противоположно трансляционной инвариантности.

Так как же CNN добиться неизменности перевода?

«Уловка» заключается в другом виде операции, которую выполняет CNN: уменьшение размерности. Уровень объединения выполняет локальное уменьшение размерности, удаляя пространственную информацию, то есть удаляя небольшие (по сравнению с размером оператора объединения) переводы.