В этой истории кратко рассматривается RiR (ResNet в ResNet). RiR пытается обобщить блок ResNet для остаточной сети, сделав ввод с остаточным потоком и временным потоком, чтобы повысить точность . И он опубликован в 2016 arXiv примерно с 80 цитированием. Я отношусь к RiR как к отрывным бумагам для ResNet. (Сик-Хо Цанг @ средний)

RiR разработан таким образом, что входной сигнал может проходить по сети между ResNet и стандартной ConvNet.

Что покрыто

  1. ResNet в ResNet
  2. Результаты
  3. Дальнейший анализ

1. ResNet в ResNet

Обобщенная остаточная архитектура вводится для объединения остаточных сетей и стандартных сверточных сетей в параллельных остаточных и неостаточных потоках.

(a) Is - стандартный блок ResNet, который состоит из пути свертки и пути пропуска соединения.

(b) Это один обобщенный остаточный блок (ResNet Init), который сформулирован следующим образом:

Таким образом, он может параллельно комбинировать остаточные сети и стандартные сверточные сети.

(c) Когда затененные соединения в ResNet Init стремятся к 0, тогда он становится двухуровневым блоком ResNet. Таким образом, RiR добавляет гибкости сети между ResNet и стандартной ConvNet.

(d) Посредством каскадного подключения 2 ResNet Init получается двухуровневый блок RiR.

В таблице ниже приведены условия, при которых остаточные и переходные соединения включены / выключены:

18-слойный + широкий RiR, использованный для экспериментов:

2. Результаты

2.1. СИФАР-10

  • 18-слойный + широкий RiR дает лучшие результаты, чем 110-слойный ResNet.
  • Он дает конкурентные результаты 94,99% по сравнению с дробным максимальным объединением.

2.2. СИФАР-100

  • 18 слоев + ширина RiR обеспечивает лучшую точность 77,10%.

3. Дальнейший анализ

3.1. Эффект обнуления полученных связей

  • При обнулении одного из потоков на разных уровнях вдоль слоев наблюдаются постоянные падения. Это показывает, что как остаточные, так и переходные потоки на каждом уровне также важны для обеспечения точности.

3.2. Добавление дополнительных слоев в остаточный блок

  • При увеличении количества слоев с 8 до 10 точность исходного ResNet сильно падает.
  • RiR остается постоянным для разного количества слоев для каждого остаточного блока.

3.3. Исследование количества блоков и слоев в блоке

  • 9 блоков с 3 слоями в блоке лучше всего подходят для RiR

Помимо RiR, есть еще одна побочная статья, ResNet of ResNet (RoR), впервые появившаяся в arXiv 2016 года и недавно опубликованная в TCSVT 2018 года. Надеюсь, я смогу рассказать об этом в будущем.

использованная литература

[2016 arXiv] [RiR]
ResNet в ResNet: обобщение остаточных архитектур

Мой связанный обзор

[LeNet] [AlexNet] [ZFNet] [VGGNet] [SPPNet] [PReLU-Net] [GoogLeNet / Inception-v1] [BN-Inception / Inception-v2 ] [ Inception-v3 ] [ Inception-v4 ] [ Xception ] [ MobileNetV1 ] [ ResNet ] [ Pre-Activation ResNet ] [ Stochastic Depth ] [ DenseNet ]