Увлечение глубоким обучением вызвало множество проблем с информационным статус-кво. В некоторых случаях его успех имеет смысл и кажется неизбежным. Для других, таких как обработка изображений, его стремление превзойти закаленные алгоритмы сжатия и оптимизации казалось труднее предсказать, что вызывало вопрос о том, какие подвиги компьютерной инженерии безопасны от его понимания. Сегодня мы рассмотрим только то, как машинное обучение меняет то, как мы храним, создаем и оптимизируем изображения, но в каждом уголке информатики наблюдается подобное противостояние глубокого обучения.

Сжатие изображения и разрешение

В прошлом году Google выпустил RAISR, алгоритм, сочетающий традиционную повышающую дискретизацию с глубоким обучением, чтобы превратить изображения с низким разрешением в убедительные аналоги с высоким разрешением. Для этого требовалось изучить сильные и слабые стороны как анализа изображений старой школы, так и глубокого обучения, взять лучшие части обоих и создать алгоритм-химеру, который быстрее, чем большинство других методов глубокого обучения, с превосходными результатами.

Аналогичным образом компания WaveOne утверждает, что научила модель сжимать изображения до крошечных размеров с гораздо большим успехом, чем популярные кодеки, такие как JPEG. Похоже, это не последний случай, когда мы слышим о том, что машинное обучение превосходит алгоритмы сжатия, которые мы знаем и любим.

Улучшение изображения

Эй, это снова Google (с помощью Массачусетского технологического института). Взгляните на Глубокое двустороннее обучение для улучшения изображения в реальном времени. Теперь машинное обучение используется для ретуширования фотографий в режиме реального времени на вашем телефоне. Таким образом, вместо того, чтобы делать снимок и отправляться в Instagram, чтобы применить кучу художественных фильтров, модель может показать вам, как ваши фотографии будут выглядеть с профессиональным улучшением изображения, когда вы кадрируете свой снимок. Это делается с помощью умных предсказаний аффинных преобразований с низким разрешением, которые можно масштабировать перед применением, и, эй, мы даже написали пост в блоге об этом.

Манипуляции с изображениями и их генерация

Состязательные сети сталкивают две отдельные нейронные сети друг с другом, чтобы соперничать друг с другом до конвергенции. Или, если вы наполовину полный стакан, одна сеть учит другую, как генерировать некоторые данные (менее захватывающие). Это использовалось для некоторых умопомрачительных целей, включая удаление дождя с фотографий, превращение ночи в день и так далее. Способность враждебных сетей учиться генерировать новые данные является беспрецедентной и чрезвычайно мощной, и по мере улучшения исследований в области современного искусства ожидайте услышать о них довольно много. Кроме того, пока вы это делаете, вы можете начать не доверять всему, что видите.

Подробнее →

Первоначально опубликовано на blog.filestack.com 28 февраля 2018 г.