Здравствуйте, меня зовут Нишанк, и добро пожаловать в серию ДОКУМЕНТЫ 101, в которых мы обсудим новые интересные исследования, проводимые в области машинного обучения и искусственного интеллекта!

Я хотел бы поблагодарить Two Minute Papers и Károly Zsolnai-Fehér за то, что познакомили меня с этой статьей через их канал YouTube.

Какого черта?

В век камер для смартфонов фотография при слабом освещении просто необходима. Все флагманские телефоны поддерживают фотосъемку при слабом освещении, но, как вы, наверное, заметили, результаты не так хороши.

Это связано с тем, что они в основном используют традиционные методы шумоподавления и устранения размытости, которые эффективны для удаления некоторого шума, но терпят неудачу в экстремальных условиях, таких как темнота, что является большой проблемой.

Этот документ - решение этой проблемы.

Компьютерное зрение - это область искусственного интеллекта, которая вращается вокруг получения визуального ввода и либо осмысления полученного ввода, либо некоторого манипулирования данным вводом для получения желаемого результата. В документе, который нас интересует, рассматривается второй вариант использования.

В своей статье Учимся видеть в темноте исследователи Чен Чен (UIUC), Цифэн Чен (Intel Labs), Цзя Сю (Intel Labs) и Владлен Колтун (Intel Labs) предложили модель, которая позволяет видеть в условиях чрезвычайно низкой освещенности, почти сравнимых с темнотой, с использованием новых конвейеров обработки изображений. с помощью Сверточной нейронной сети.

Результаты поразительны!

Если вы сделаете снимок с помощью камеры без фотографии при слабом освещении (низкий ISO), он будет выглядеть примерно так:

Если щелкнуть ту же картинку камерой при слабом освещении, такой как на флагманских смартфонах, результат будет примерно таким, как показано ниже. Обратите внимание на зернистость изображения из-за фильтров масштабирования, таких как BM3D и более низкого ISO.

Теперь полностью сверточная сеть берет первое изображение и обрабатывает его, чтобы получить изображение ниже (да, я не шучу).

Чего ждать!

Модель здесь использует сквозную обученную полностью сверточную сеть, которая использует набор данных необработанных ночных изображений с короткой экспозицией с соответствующими эталонными изображениями с длинной выдержкой. Это делает получение результатов в экстремальных сценариях, таких как ночная съемка, очень простым и эффективным по сравнению с традиционными методами удаления шума и размытия.

Как обучается CNN?

CNN обучается на двух наборах изображений.

  1. Тускло освещенная (почти темная) сцена или снимок с короткой выдержкой в ​​качестве входных данных.
  2. Соответствующая сцена с нормальным освещением или снимок с длинной выдержкой той же сцены, что и цель.

Нейронная сеть обучается на наборе данных, содержащем 5094 сырых изображения с короткой выдержкой и соответствующие им изображения с длинной выдержкой.

Поэтому, если вы хотите обучить сеть, вам нужно сначала щелкнуть фотографию при нормальных условиях освещения, которая будет использоваться в качестве целевой переменной для получения ошибки по сети.

Затем вам нужно будет щелкнуть фотографию той же сцены с низкой экспозицией, чтобы она выглядела темной. Это будет вводиться в сеть во время обучения.

Пара этих двух фотографий создаст пару (вход, выход) для сети, на которой она будет обучена для использования на тестовых изображениях при слабом освещении.

Обучение проводилось с использованием L1 loss и Adam Optimizer, что дало результаты исключительного качества и делало модель наиболее эффективной до сих пор!

Насколько это хорошо?

Эта модель ставит под сомнение традиционные методы устранения размытости и шумоподавления. Вот сравнение с традиционным шумоподавлением BM3D -

Вы сразу заметите разницу.

Если мы сравним производительность CNN с флагманскими мобильными камерами с использованием различных параметров, таких как выдержка и освещение, результаты могут вас удивить!

Рассмотрим сценарий, в котором в темной комнате зажигается 8 свечей, а на фотографии манекена разными камерами наблюдаются изменения, так как количество свечей каждый раз уменьшается вдвое.

Обратите внимание, как качество фотографии ухудшается в iPhone X и Google Pixel 2 по сравнению с Sony a7S. Это связано с тем, что, с одной стороны, камера Sony имеет более высокий ISO, чем обе мобильные камеры, мобильные камеры используют традиционные методы удаления размытости и шумоподавления для получения фотографий при слабом освещении из необработанных данных.

Теперь фото на обеих камерах смартфона почти темное, и очевидно, что они не смогли справиться в экстремальных условиях, например, в темноте.

Тем не менее, фотография на камеру Sony по-прежнему четкая, потому что, как вы, возможно, заметили, она ловко изменила время экспозиции с 0,8 секунды до 1,6 секунды, позволяя проникать большему количеству света и, следовательно, давать более качественные фотографии.

Это непрактично для камер смартфонов, так как это приведет к размытому изображению, поэтому это можно сделать только на дорогих высококачественных камерах, которые имеют лучшую отражающую линзу и высокоэффективный датчик.

Но давайте посмотрим, что произойдет, если мы уменьшим время экспозиции до 1/30 секунды, то есть насколько хорошо камеры работают при очень низкой освещенности и малой выдержке.

Как вы можете видеть на этом этапе, все камеры вышли из строя, и мы наблюдаем полную темноту. Это происходит по двум разным причинам -

  1. В мобильных камерах это произошло из-за того, что они используют традиционные методы устранения размытости и шумоподавления, такие как шумоподавление BM3D, которые не работают, когда количество света очень мало и не с чем работать.
  2. В камере Sony это произошло из-за меньшего времени экспозиции, поэтому в камеру попало меньшее количество света, что привело к темному изображению.

Но подожди. Можем ли мы сделать что-нибудь, чтобы получить лучшее изображение за 1/30 секунды выдержки и в условиях чрезвычайно низкой освещенности (‹0,1 люкс)?

Будьте готовы удивиться, ведь эта газета сделала именно то, что мы хотели!

Если необработанные данные датчика из приведенного выше изображения (с самыми темными фотографиями) с 1 свечой и низкой экспозицией подать в полностью сверточную сеть, мы получим результат, который будет выглядеть следующим образом!

Удивлен? Я тоже был!

Я надеюсь, что эта технология очень скоро будет реализована в камерах смартфонов, и вы начнете получать удовольствие от фотосъемки при очень слабом освещении, которую может предложить машинное обучение!

И в этом сила машинного обучения и нейронных сетей.

Подобные приложения мотивируют все больше и больше людей изучать машинное обучение и нейронные сети. Это точная причина появления ДОКУМЕНТОВ 101!

Не стесняйтесь оставлять в комментариях, что вы думаете об этой статье. Чтобы узнать больше о процессе, посетите сайт газеты.

Кроме того, в комментариях приветствуются предложения и благодарности по поводу ДОКУМЕНТОВ 101.

Что ж, на этой неделе и до следующего раза!

Прощай!