Генеративно-состязательные сети

Фальсификатор произведений искусства против следователя

Я хотел бы начать с аналогичного примера, который обычно используется для объяснения концепции генеративно-состязательных сетей (GAN).

Есть фальшивомонетчик и есть искусствовед, а весь остальной арт-мир — идиоты, они не могут отличить настоящую работу от подделки — они покупают что угодно. Учитывая идиотизм мира искусства, качество работы фальсификатора начинается с крайне низкого качества. Фальсификатору просто нужно нацарапать имя художника и год на раскрашенной копии, чтобы продать работу. Первые несколько раз, когда это искусство попадает на стол следователя, следователь еще не может точно сказать, настоящее оно или поддельное. Однако со временем исследователь начинает замечать различные несоответствия между подделкой и оригинальным произведением искусства и формирует некоторые правила относительно того, почему они являются подделками. Например, определенная скульптура была изготовлена из железа, а не из бронзы. В свою очередь, фальшивомонетчик вынужден улучшать свои подделки, так как сейчас их убирают с рынка, и они тратят свое время на изготовление подделок ниже номинала. Теперь фальсификатор начинает создавать скульптуры из бронзы, и снова следователя обманывают, и работа фальсификатора покупается незамеченной. Следователь теперь должен найти еще одну черту, которая отличает настоящее от подделки и помешать фальсификатору обмануть мир искусства. Затем это приводит к тому, что фальсификатор улучшает свою работу, и цикл продолжается — обе стороны заставляют друг друга совершенствоваться до тех пор, пока, возможно, фальсификатор не станет настолько опытным, что у человека не будет возможности отличить его подделку от настоящей. Учитывая рассматриваемую тему, фальсификатора можно рассматривать как генеративную модель, а исследователя — как дискриминатора.

Давайте разбираться

Модель машинного обучения GAN относится к генеративному классу моделей, которые выдают новый контент на основе данных, на которых они были обучены. В приведенном ниже примере показаны фотографии спален, сгенерированные GAN, с использованием обучения с учителем и сверточных нейронных сетей.

Кроме того, они также включают дискриминационную модель классификации, такую как сверточная нейронная сеть или машина опорных векторов. Эти две модели соревнуются друг с другом, обычно в игре с нулевой суммой (математическое представление ситуации, в которой выигрыш или потеря полезности каждого участника точно уравновешиваются потерями или выигрышами полезности других участников). Генеративная модель научится генерировать новые данные на основе обучающего набора, а дискриминативный классификатор оценит, являются ли они реальными изображениями или созданы синтетически. GAN настолько круты, что на семинаре 2016 года Yann LeCun назвал GAN самой крутой идеей в машинном обучении за последние двадцать лет (по сути, он изобрел сверточные сети)!!!

Генератор

Генеративная модель — это модель условной вероятности наблюдаемого X при заданной цели y. Эта модель принимает в качестве входных данных случайный вектор фиксированной длины и генерирует выборку в домене. Вектор случайным образом выбирается из нормального распределения, и вектор используется для начала процесса генерации. После обучения точки в этом многомерном пространстве будут соответствовать точкам в проблемной области. Это многомерное пространство является скрытым пространством, состоящим из скрытых переменных. Это определяется как пространство, представляющее сжатые данные, в котором сходные точки данных расположены ближе друг к другу в пространстве. В случае GAN генеративная модель применяет значение к точкам в скрытом пространстве, чтобы их можно было использовать в качестве входных данных и использовать для создания новых и различных выходных данных. Модели машинного обучения могут изучать скрытое пространство изображений, музыки и другого контента, а затем делать выборки из этого пространства, создавая новые выходные данные с характеристиками, аналогичными тем, которые модель видела ранее!

Дискриминатор

Дискриминационная модель — это классификационная модель. Он берет пример из предметной области в качестве входных данных, либо реальный, либо сгенерированный пример, и предсказывает метку бинарного класса реального или сгенерированного синтетическим путем. После обучения дискриминационную модель можно отбросить, так как нас интересует лучший генератор.

Дуэль — игра с нулевой суммой

Генеративная модель (то, что мы хотим получить) — это задача обучения без учителя, однако обучение генеративной модели оформлено как задача обучения с учителем (учитывая дискриминатор). Обе модели обучаются вместе — так же, как исследователь обучал фальсификатора произведений искусства, и наоборот — и обновляются в зависимости от того, насколько хорошо или нет, в зависимости от того, насколько хорошо образцы обманули дискриминатор. Этот процесс можно рассматривать как процесс с нулевой суммой, потому что, когда дискриминатор успешно идентифицирует подделку, он вознаграждается без изменений, тогда как генератор наказывается обновлениями параметров модели и наоборот. Цель состоит в том, чтобы генерировать данные, где дискриминатор может только случайно предсказать их происхождение — 50/50. Это идеальная концовка, однако любая подобная концовка будет считаться полезной генеративной моделью.

Приложения — искусство фальшивых новостей

Приложения GAN чрезвычайно разнообразны и постоянно развиваются. Эдмонд де Белами — исключительный пример ажиотажа вокруг этого пространства. Это картина, созданная GAN, разработанная парижским художественным коллективом Obvious. Она получила известность, когда в 2018 году аукционный дом Christie’s продал картину за 432 500 долларов!

Еще одно примечательное приложение было реализовано в Вашингтонском университете, где исследователи создали синтетического Обаму. Исследователи натренировали свой генератор мимических движений на 14-часовой записи бывшего президента США, чтобы они могли передать любой звук и создать впечатление, что Обама действительно говорит это. Вот ссылка https://www.youtube.com/watch?v=AmUC4m6w1wo!

Генеративно-состязательные сети

Вопросы по теме