Это не человек, но она угроза

Сети GAN генерируют реалистичных фальшивых людей, и они вызывают большие вопросы в СМИ, законодательстве и искусственном интеллекте.

Взгляните на человека в верхней части этой статьи. Она выглядит дружелюбной - возможно, это тот, с кем вы связались в Linkedin или наняли для ведения ваших социальных сетей. Если бы вы видели ее на уроке гимнастики вашего ребенка, вы бы поздоровались и завели неловкую светскую беседу. В зависимости от вашего убеждения, вы можете даже смахнуть вправо по ее профилю в Tinder, если представится такая возможность.

Есть только одна проблема - ее не существует. Изображение выше было создано с использованием новой техники машинного обучения под названием Generative Adversarial Networks (GAN). Эта техника, изобретенная в 2014 году, приобрела популярность и возможности. Лауреат премии Тьюринга Янн ЛеКун назвал это самой крутой идеей в области машинного обучения за последние 20 лет. Его используют в видеоиграх, астрономии и искусстве. И это захватывает СМИ и юридические миры.

GANs под капотом

GAN работает, беря две нейронные сети глубокого обучения и противопоставляя их друг другу в мини-битве. Первая сеть - это генеративная сеть. Обычно это сверточная нейронная сеть, обучаемая на наборе образцов изображений. Как и все CNN, он изучает атрибуты и шаблоны обучающего набора и может создавать похожие изображения с нуля.

Вторая сеть - это дискриминативная сеть. Он также обучен на исходных данных и предназначен для оценки того, соответствует ли конкретное изображение статистическому распределению исходного набора данных. Проще говоря, при получении нового изображения он пытается угадать, принадлежит ли изображение к исходному набору изображений или нет.

Здесь все становится интересно. Вместо того, чтобы позволить сетям тихо гудеть самостоятельно, GAN настраивает их друг против друга. Цель генеративной сети - создавать фальшивые изображения, достаточно хорошие, чтобы обмануть распознающую сеть. А цель дискриминационной сети - избежать обмана - точно угадать, какие изображения являются поддельными, а какие действительно принадлежат исходным данным.

Снова и снова генерирующая сеть будет создавать новое изображение, а дискриминативная сеть будет оценивать его. Затем они будут проверять свою работу, чтобы узнать, кто выигрывал в каждом раунде. Поскольку они противостоят друг другу на протяжении тысяч и тысяч раундов, обе сети используют обратное распространение, чтобы учиться на своих ошибках и успехах. Генеративная сеть становится лучше в создании реалистичных подделок, а дискриминирующая сеть - в их обнаружении. Со временем обе сети улучшаются за счет конкуренции друг с другом. Этот метод основан на последних достижениях в области параллельных вычислений для быстрого обучения сетей - NVIDIA и другие производители графических процессоров были первыми его сторонниками.

К концу тренировки генеративная сеть стала очень хорошо создавать реалистичные поддельные изображения. Работая самостоятельно - после всех полезных улучшений от своих заклятых врагов - различающей сети - теперь он может создавать подделки, которые зачастую достаточно хороши, чтобы обмануть человека.

Это немного похоже на бейсболиста, размахивающего битой с утяжелением перед тем, как подойти к тарелке, или на студента колледжа, который задает более сложные вопросы, чем они ожидают на экзамене. Тренируясь с хитрым противником, который становится лучше с каждым испытанием, генеративная сеть постоянно улучшает свою игру. Когда сильный противник убран и ему нужно обмануть заурядного человека, задача сравнительно проста.

GAN вызывают проблемы

Неудивительно, что системы искусственного интеллекта, которые могут создавать убедительных поддельных людей, вызывают настоящий ажиотаж, причем далеко за пределами мира глубокого обучения. В средствах массовой информации сети GAN представляют собой серьезную угрозу авторитету. Они естественным образом связаны с Deep Fakes - где нейронная сеть выдает себя за реального человека, создавая видео или изображения, на которых они, кажется, делают или говорят то, чего на самом деле никогда не делали и не говорили.

Конечно, люди всегда могли изобразить в Photoshop знаменитость или политика на мероприятии, на которое они никогда не были, или показать им рукопожатие с кем-то, кого они никогда не встречали на самом деле. Но создание настоящего видео, в котором они, кажется, делают расистское замечание или говорят что-то, что может воспламенить их собственную партию, - это гораздо более сложная возможность, и GAN часто помогает ей. Это реальная угроза для средств массовой информации, где (не считая фейковых новостей) достоверность контента является ключевым фактором. Как узнать, что скрытая камера, сделанная информатором, настоящая, или это тщательно продуманная подделка, созданная GAN с целью подорвать репутацию оппонента?

И есть еще более мрачные и острые проблемы. Порнография с поддержкой GAN уже появилась в Интернете, часто с изображениями лиц настоящих знаменитостей. Проблема может распространяться. Знаменитости - это легкая добыча, поскольку их фото уже доступно в Интернете, а общественный интерес к их личной жизни уже высок. Это позволяет сравнительно легко найти обучающие данные для GAN, а также очень прибыльным делом выпустить фальшивое видео или фотографию. Но по мере совершенствования технологий и уменьшения необходимого размера обучающих наборов хакеры потенциально могут создавать фальшивые клипы с рейтингом X практически любого человека, используя их в схемах вымогательства или шантажа.

Кому принадлежат фальшивые люди?

Помимо этих экзистенциальных угроз и жутких рисков, даже сети GAN, созданные по положительным причинам, поднимают некоторые сложные юридические вопросы. Один из центральных вопросов - кому на самом деле принадлежат права на изображения, создаваемые GAN.

Закон об авторском праве США довольно четко определяет, что произведение, защищенное авторским правом, должно иметь автора-человека. Противодействие этой основной посылке терпело неудачу разными и часто сенсационными способами, от дел о праве собственности на записи наблюдения, созданные автоматической камерой до печально известного дела об обезьяньих селфи, где PETA пыталась заявить, что права принадлежат хохлатой макаке. к фотографиям, сделанным на камеру фотографа природы.

Если работа нуждается в авторе-человеке для защиты авторских прав, то владеет ли кто-нибудь правами на изображения, созданные GAN? В конце концов, они сняты не человеком с фотоаппаратом, а конечным результатом двух сражающихся компьютерных программ. Это сложный вопрос, но, к счастью, есть прецеденты из других областей, о которых я расскажу ниже.

И если выходить за рамки владения, есть ли ограничения на то, что можно делать с GAN? Можете ли вы использовать его, чтобы выдать себя за кого угодно?

Люди сопротивляются

Столкнувшись с угрозой GAN, многие организации и законодатели уже сопротивляются. Гильдия киноактеров (SAG), которая представляет интересы актеров и артистов, активно лоббирует регулирование, которое не позволяет продюсерским компаниям заменять живых актеров голограммами с поддержкой GAN.

В этом есть большой смысл - если вы можете создать фальшивого фотореалистичного Брэда Питта и заставить его выполнять ваши приказы, зачем вообще нанимать настоящего актера? Версия, придуманная GAN, не требует перерывов, не забывает свои реплики и вряд ли потребует семизначной зарплаты. Однако когда дело доходит до скончавшихся актеров, все становится сложнее. SAG хотела бы навсегда заблокировать права на создание синтетической знаменитости, но это наталкивается на серьезные проблемы с Первой поправкой.

Несколько государств тоже уже вступают в борьбу. 3 октября 2019 года Калифорния приняла AB-602, который запрещает использование GAN для создания фальшивой порнографии или фальшивых видеороликов с изображениями политиков в течение 60 дней после выборов. Нью-Йорк рассматривает закон, который подходил бы к GAN через право на гласность.

GAN на благо

Абсолютно необходимо некоторое регулирование для GAN. Конечно, в случае синтетической порнографии или другого эксплуататорского контента для законодателей имеет смысл вмешаться и отсеять плохих актеров.

Однако существуют риски чрезмерного регулирования GAN. При правильном использовании Generative Adversarial Networks могут быть невероятно мощной технологией с потенциалом для множества мощных преимуществ.

Возьмем, к примеру, причину, по которой GAN были изначально созданы. Изначально технология была разработана не для создания убедительных фальшивых людей в иллюстративных целях, а для создания больших наборов данных для обучения других систем глубокого обучения.

В машинном обучении вообще сложно найти хорошие данные. Специалистам по данным, особенно с новыми сетями и технологиями, требуется много изображений для обучения новой системы визуального ИИ - иногда миллион изображений или больше. Покупка всех этих изображений непомерно дорога, особенно для отдельных ученых или исследовательских групп.

Для решения этой проблемы были созданы сети GAN. С GAN ученому-исследователю, который, например, создает новую систему распознавания лиц, не нужно будет покупать миллионы изображений человеческих лиц. Скорее, они могут обучить GAN один раз, а затем использовать его для создания необходимого количества поддельных изображений лиц и обучить им свою новую систему.

GAN по-прежнему используются в основном для этой цели. Это не идеальное решение - коллега из IBM описал этот процесс как похожий на фотокопирование фотокопии, а не на фотокопирование оригинального документа, с такими же искажениями и потерями качества, - но это все же важный инструмент в поясе специалиста по данным. GAN также важны там, где доступны ограниченные реальные данные обучения. Они были предложены, например, как частичное решение проблемы нехватки обучающих изображений, изображающих лица людей, помимо мужчин европеоидной расы, и, таким образом, как способ увеличить разнообразие систем глубокого обучения. Вы можете поэкспериментировать со своими фальшивыми людьми на ThisPersonDoesNotExist.com

Помимо машинного обучения, у GAN есть множество реальных приложений. В стоковой фотографии и моде они могут создавать правдоподобные портреты без необходимости нанимать моделей или снимать помещение. Это значительно упрощает фотографу или дизайнеру - особенно тем, кто только начинает - реализовать концепцию или показать новый предмет одежды без больших первоначальных вложений.

В других областях GAN используются везде, где присутствует визуальный паттерн. Они могут моделировать темную материю в астрономии, создавать 3D-модели физических объектов из 2D-фотографии, создавать поддельные комнаты и пространства для видеоигр, показывать, как человек может стареть, и даже генерировать идеи для новых молекул или белков в исследованиях рака.

GAN развиваются

В будущем GAN станут еще более мощными. На данный момент в визуальной сфере они в основном ограничиваются созданием относительно ограниченных изображений с сильным рисунком, для которых доступно множество обучающих данных. Прекрасный пример - лица - они различаются у разных людей, но имеют многие из тех же основных атрибутов. А учитывая, что в мире более 6 миллиардов реальных людей, у GAN есть множество лиц, у которых можно поучиться (опять же, если предположить, что у ее создателя достаточно ресурсов для скупки больших наборов данных).

Однако по мере совершенствования технологий эти препятствия станут менее важными. Широко распространено мнение, что в следующие 3-5 лет GAN достигнут точки, когда они смогут создавать совершенно новые сцены с нуля, а не только крупные планы лиц. Дизайнер может, например, сказать: «Я хотел бы снять женщину, спускающуюся по лестнице, держась за перила и смотрящую вверх и через плечо», и GAN мог бы создать эту точную сцену с фотореалистичными деталями.

Дразнящие взгляды на это будущее уже существуют. Сеть под названием Stack GAN уже может делать это для отдельных объектов, генерируя изображение фальшивой птицы на основе текстового описания ее внешнего вида. А другой GAN уже может создать приличную - если не идеальную - уличную сцену, используя блочную карту автомобилей, людей и т. Д.

Очевидно, что по мере развития этих технологий они могут заменить огромные части фотографии, создания фильмов, дизайна интерьера или любой другой области, полагающейся на визуальные средства массовой информации.

Следует ли кому-либо в этих отраслях немедленно искать новую работу или рисковать быть замененным GAN? Все ли изобразительное искусство заменят машины?

Назад в будущее

Прежде чем мы войдем в режим полного сбоя, важно ненадолго остановиться и вспомнить, что поле уже существует со многими из тех же атрибутов и конечных продуктов, что и GAN.

В этой области кто-то окунается в память о миллионах людей, мест или объектов, которые они видели. Они опираются на обширную подготовку, иногда у суровых или хитрых критиков. В некоторых случаях они также принимают текстовые описания желаемой сцены или концепции. Затем они берут некоторые инструменты и используют их для создания совершенно нового изображения. На изображении может быть изображен известный человек в новых обстоятельствах или изображен воображаемый человек в сцене, которой на самом деле не существует. Это поле называется «иллюстрацией».

Иллюстраторы, аниматоры и художники CGI обычно делают то же самое, что и GAN - вся их работа - придумывать новые сценарии, людей и места и воплощать их в жизнь на странице или экране. Во многих случаях их творения фотореалистичны - особенно сегодня, когда творения компьютерной графики часто неотличимы от реальных мест или реальных актеров.

GAN, рассматриваемые как инструмент для иллюстрации, а не как совершенно новая угроза, намного менее страшны. Конечно, они делают создание реалистичных иллюстраций намного проще и (в зависимости от навыков иллюстратора или аниматора) более реалистичными. Но в конце концов они не делают ничего нового; они просто применяют глубокое обучение к старой художественной концепции, восходящей к первому человеку, который нарисовал буйвола на стене пещеры.

Рассмотрение GAN как инструмента для иллюстрации также решает многие юридические вопросы, связанные с сетями. Суды постоянно постановляли, что произведения, созданные CGI, имеют право на защиту авторских прав, потому что они созданы благодаря творческому выбору человека-оператора.

И инструменты CGI также не всегда детерминированы - следуя указаниям человека, они обычно «заполняют» действие между ключевыми кадрами или иным образом создают новые последовательности, не смоделированные непосредственно дизайнером. Никто не станет спорить с тем, что аниматор должен потерять защиту авторских прав на свой фильм, потому что After Effects заполнила некоторые действия между ключевыми кадрами или добавила текстуры и освещение к своим каркасам. Имеет значение ее творческий выбор и то, как они приводят к конечному продукту.

GAN существуют в аналогичном пространстве. Они могут вообразить новые сцены, но для получения полезного результата им все же нужны указания людей относительно того, что создавать. Даже когда GAN генерирует лица случайным образом, все равно требуется участие человека и его указание, чтобы решить, какие из них являются правдоподобными, соответствуют конкретному творческому проекту и т.д. . И результаты GAN не идеальны - во многих случаях им по-прежнему требуется человеческая помощь, чтобы получить полезные результаты.

Возьмем, к примеру, фото вверху этой статьи. На первый взгляд женщина выглядит реалистично, но приглядитесь. Что с ее ухом? Это серьга? Какой-то шмут? Базовое изображение выглядит довольно неплохо, но его можно очистить и настроить этим (мягко говоря) опытным человеком-оператором. Все эти настройки и варианты являются творческими актами, которые превращают исходный результат GAN в полезную и убедительную иллюстрацию.

Куда отсюда?

Генеративные состязательные сети представляют некоторые важные проблемы, которые общество должно продолжать размышлять и исследовать. Эксплуатационное использование технологий - для глубоких подделок и откровенного контента - вызывает беспокойство, и именно такие вещи регулирующие органы должны решать раньше, чем позже.

В то же время, однако, общество должно быть осторожным, чтобы не слишком усердствовать в регулировании этих новых технологий, тем самым подавляя их положительное применение. Хотя продукция GAN может быть пугающей - или просто очень жуткой, - она также может произвести революцию во многих изобразительных искусствах, сделать моду и фотографию более инклюзивными, внести свой вклад в открытие лекарств и решить всевозможные пока еще невообразимые проблемы. Существующая область иллюстраций обеспечивает правовую и этическую основу для решения вопросов о GAN и их влиянии.

Фальшивые люди могут пугать, но они здесь, чтобы остаться. Как общество, мы должны осознавать их угрозы, но также осознавать их преимущества. Где-то в их улыбающихся лицах - и в GAN за ними - есть возможность реализовать долгосрочные преимущества для реальных людей, которые вообразили их существование.