Если вы не живете под камнем, то уже должны были заметить, что алгоритм Google DeepDream в настоящее время является самой приятной машиной со времен Power Tools Кая. Из него получаются щенки и слизни, и его внешний вид настолько узнаваем, что на нем большими черными буквами написано «ОН ЭТО ПРОСТО ФАД». Итак, давайте двигаться дальше, через 4 недели все возненавидят его, и лишь несколько упрямых уродов будут использовать его на своей странице MySpace.

А может и нет.

Обилие разноцветных щенков в потоке вывода DeepDream, видимом в данный момент, может легко привести к выводу, что этот инструмент мало пригоден в реальном мире, за исключением людей, которым требуется постоянный приток психоделических визуальных эффектов. Но DeepDream - это нечто большее. Это как проигрыватель (извините, я олдскульный, я должен сказать «это как iTunes») - к сожалению, сейчас в магазинах только один альбом, и он называется «bvlc_googlenet», и да, в нем есть неясная смесь милые домашние животные, рептилии и моллюски на нем. На самом деле доступно еще несколько независимых альбомов, но все они были записаны ботаниками, что означает, что они посвящены зданиям или цветам, они доступны только на черном рынке, известном как «ModelZoo», и вам придется пройти через несколько обручи еще до того, как в них можно будет играть, так что они скорее для начинающих знатоков.

Что нам нужно, чтобы выбраться из «щенячьей долины», так это больше альбомов. На практике это означает, что необходимо обучать новые модели, содержащие материал менее жуткого и более полезного характера. Представьте себе сеть, обученную работе с частями тела, текстурами кожи или волосами - при правильной настройке это может позволить очень тонкое ретуширование фотографий и красоту или уродливость портретов. Модель, полная текстур или типографики, может придать плоскому графическому дизайну органичный вид. Стиль комиксов? Детали машин? Полностью абстрактные узоры? Любая новая модель может дать результаты, совершенно отличные от тех, что мы видим до сих пор. Проблема в том, что обучение новой модели - утомительный процесс: сначала вам нужно вручную собрать множество различных примеров изображений одной и той же категории, а затем вы должны тренировать ее на мощной машине в течение нескольких дней или даже недель. Но я уверен, что некоторые люди уже работают над новыми моделями прямо сейчас, так что через несколько недель мы, надеюсь, увидим новые стили.

Было бы неплохо, если бы мы могли ускорить этот процесс, превратив его в усилия сообщества. Как звучит идея кампании на Kickstarter, которая будет финансировать сайт, позволяющий собирать и сортировать категории изображений, а также оплачивать время на мощном облачном сервере с графическим процессором, способном изучать новые модели? Конечно, каждому спонсору также будет предоставлена ​​собственная категория личных объектов. Просто выбросить это там - может быть, кто-то более организованный, чем я, сможет мне помочь.

Но DeepDream на этом не заканчивается. Еще лучшая метафора, чем проигрыватель, - это сравнение алгоритма с музыкальным инструментом. Созданный инопланетянами инструмент настолько сложен, что до сих пор мы только догадывались, куда взорваться, и сумели извлечь из него единственную ноту сомнительного качества. С практикой и упорным трудом мы поправимся и разберемся в тонкостях этого устройства, мы найдем способы его улучшить и упростить игру. Например, в настоящее время я экспериментирую с изменениями кода, надеясь получить больший контроль над тем, о чем мечтает алгоритм. Но это больше похоже на операцию на мозге сознательного пациента: вы действительно пытаетесь сделать ошибку в сложной сети нейронов: покачиваетесь на этом нерве - ах, да, дергается нога, но также мигает левый глаз. Часы веселья.

То, что кажется пиком мечты, - это только начало. Прямо сейчас процесс запуска его на вашей машине не для слабонервных. Но не беспокойтесь - очень скоро на рынке появятся первые простые в использовании приложения, а чуть позже этот принцип найдет свое применение в популярных фоторедакторах или инструментах для рисования. И DeepDream не заканчивается статичными изображениями. Люди уже применили его к видео - все еще немного нервно и экспериментально, но оно наверняка улучшится. Тот же самый основной алгоритм будет применяться к звуку и генерации 3D-объектов и целых миров. MineCraft с глубокими сновидениями абсолютно возможен, если у компьютера достаточно мощности для изучения вокселей, а не пикселей. DeepDream открывает дверь в новый мир творчества, дополненного искусственным интеллектом, и он обязательно останется.

Так что лучше к этому привыкнуть.