Введение в генеративные состязательные сети и то, как они революционизируют индустрию машинного обучения.

В будущем, если вам понадобится изображение для чего-то (возможно, для новой статьи на Medium, над которой вы работаете * подмигивает *), вместо поиска в Google вы можете просто попросить модель машинного обучения создать его. для вас с нуля. Похоже на научную фантастику? Взгляните на эти фотографии…

Они выглядят вполне реально, не так ли? На самом деле они были созданы с помощью особого типа модели машинного обучения (ML), называемой генеративной состязательной сетью (GAN). Этот конкретный был разработан NVIDIA, влиятельной компанией, которая изобрела графический процессор, и может создавать невероятно реалистичные изображения, похожие на фотографии человеческих лиц. Я знаю, страшно, правда?

Чтобы понять, как эта модель достигает таких потрясающих результатов, нам нужно взглянуть на внутреннюю работу GAN.

Давайте посмотрим на структуру GAN

Генеративная состязательная сеть состоит из двух частей: генератора и дискриминатора. Обе из них представляют собой отдельные глубокие нейронные сети, конкурирующие друг с другом (отсюда состязательная в GAN).

Чтобы понять, что делает каждая сеть, давайте начнем с простой аналогии.

Допустим, вы хотите купить Мона Лизу, а мастер по подделке документов пытается воспроизвести ее, чтобы продать ее вам за много долларов. Но вы, очевидно, не позволите этому случиться, поэтому вы нанимаете эксперта для проверки подлинности.

Фальсификатор пытается продать вам подделку, но ваш эксперт быстро обнаруживает ее. Итак, теперь фальсификатор настроен улучшить качество своих копий, чтобы ваш эксперт не сорвал его генеральный план.

На этот раз он находит ту же краску, которую использовал Леонардо да Винчи, и использует ее, чтобы нарисовать копию. Чувствуя себя уверенно в своей работе, он пытается снова продать ее вам. Вашему эксперту сложнее установить его подлинность, но в конце концов он выясняет это и предупреждает вас.

Теперь это продолжается и продолжается очень долго (вы, должно быть, действительно хотите эту картину). С каждым разом фальсификатор становится все лучше и лучше, производя подделки, а ваш эксперт все лучше и лучше их распознает.

Теоретически, если так будет продолжаться вечно, фальшивомонетчик станет настолько хорош, что подделка будет практически неотличима от настоящей, и эксперт будет вынужден сделать безумное предположение.

Хорошо, но как все это применимо к GAN?

Генеративная состязательная сеть работает примерно так же. В этом случае фальсификатор будет генератором, а эксперт - дискриминатором.

Когда начинается обучение, генератор получает случайный шум в качестве входных данных, который он использует, чтобы попытаться создать изображения, которые выглядят так, как будто они получены из набора данных реальных изображений. Сначала изображения, которые он производит, будут представлять собой беспорядок явно поддельных изображений. Затем он передает это изображение дискриминатору, который также получил выборку из набора данных реального изображения.

Затем дискриминатор пытается решить, принадлежит ли полученное изображение к набору данных реального изображения или нет. Если он правильно классифицирует его как подделку, генератор будет оштрафован, а дискриминатор будет вознагражден. Это ключ.

Со временем генератор изменит свой алгоритм и сделает изображения лучше, а дискриминатор станет лучше различать их. Но, как я уже упоминал ранее, генератор со временем станет настолько хорош, что дискриминатор просто начнет гадать.

Именно тогда генератор может создавать изображения высокой четкости, подобные этим ..

Что дальше у GAN?

Генеративным состязательным сетям еще предстоит пройти долгий путь, прежде чем они смогут надежно создавать полезные изображения. GAN, разработанная NVIDIA, представляет собой новейшую модель, но она не всегда работает идеально. Для обучения требуется очень большой набор данных высококачественных изображений, и он ограничивается только созданием лиц.

В будущем мы можем ожидать появления более универсальных сетей GAN, способных создавать более одного типа изображений.

Игровая индустрия действительно может выиграть от такой модели. Создание аватаров и игрового окружения для 3D-игр чрезвычайно трудоемко и дорого. Если бы существовала GAN, способная создавать реалистичные аватары и карты, это могло бы значительно сократить расходы и время производства.

По мере того, как со временем GAN становятся все более продвинутыми, становится все труднее определить, является ли изображение или видео, которое мы смотрим, настоящими. Что, если человек, с которым вы познакомились на этом сайте знакомств, является сгенерированным изображением? К счастью, тебе не о чем беспокоиться ... пока. 😅

Ключевые выводы:

  • Генеративные состязательные сети - это нейронные сети с глубоким обучением, которые способны создавать изображения, аналогичные изображениям в их наборе обучающих данных.
  • Они состоят из двух частей: генераторов и дискриминаторов. Оба они постоянно совершенствуются и соревнуются.
  • GAN еще предстоит пройти долгий путь, прежде чем они смогут создавать разнообразные высококачественные изображения.
  • Это поле постоянно улучшается, поэтому важно оставаться в курсе!

Спасибо за прочтение!

Если у вас есть какие-либо вопросы, обращайтесь:

Электронная почта: [email protected]

Twitter: @santiarrecif

Кроме того, вот ссылка на мой ежемесячный информационный бюллетень, где вы можете быть в курсе того, над чем я работаю! :)

Http://eepurl.com/gG8M-1