Изображения, созданные искусственным интеллектом — Следующий шаг в вычислительной фотографии

Изображения, созданные искусственным интеллектом — следующий шаг в вычислительной фотографии

Для творческих людей тяжелая работа и усилия стоят за великолепной картиной, отмеченной наградами фотографией или четко срежиссированным видео. Все начинается с ума творца. Это талант, который делает творческих людей признанными в отрасли, они работают в медиа, искусстве и развлечениях. Что, если творческое мышление может осуществляться компьютером, а также создавать образ?

Теперь это возможно в области компьютерного программного обеспечения ИИ (искусственный интеллект). Можно указать приложению, что вы хотите визуализировать, и это будет сделано автоматически, без каких-либо дополнительных действий со стороны пользователя. Представьте, что вы просто печатаете или говорите то, что хотите создать, и программа все сделает за вас. Это будет не только прорывом в индустрии искусства и фотографии, но также может создать новую форму индустрии изображений для творческих людей.

Другие методы включают генетическое размножение (с использованием методов Style-GAN), генерацию случайных изображений, и вскоре появятся редактирование изображений на естественном языке.

Примечание. На момент написания статьи большинство этих методов все еще были экспериментальными или использовались ограниченно.

Это так просто, каждый может это сделать

Платформы, обеспечивающие машинное обучение и вычислительную визуализацию, позволяют пользователям создавать свои собственные изображения с помощью приложения. Теперь это настолько просто, что это может сделать любой, у кого установлено приложение. Примером может служить система DALL-E 2 от Open AI. Алгоритм позволяет пользователям говорить или печатать на естественном языке, который компьютер затем интерпретирует и преобразует в визуализированное изображение.

Пользователи просто дают описание изображения, которое они хотят, чтобы программа генерировала. Например, пользователь может ввести или сказать:

«Енот-астронавт с отражением космоса в стекле шлема мечтает о звездах»

Программное обеспечение, использующее DALL-E 2, создало следующее изображение (примечание: это не иллюстрация, созданная человеком) из этого описания:

Рендеринг был выполнен программным обеспечением без какой-либо дополнительной помощи человека. Open AI разработал систему с использованием нейронной сети, которая представляет собой тип процесса, в котором используется обученный набор изображений, на которые ссылается программное обеспечение. Затем он использует другой метод искусственного интеллекта, называемый обработкой естественного языка (NLP), чтобы понять данное пользователем описание (напечатанное или произнесенное голосом). для создания изображения (при этом используется библиотека GPT-3).

Что удивительно в этом, так это точность и скорость генерации изображения. Что делает его еще лучше, так это то, что он не требует от пользователя ничего, кроме описания того, что он хочет. Когда оно станет массовым приложением, интегрированным со смартфонами, каждый сможет создавать свои собственные изображения, печатая или произнося его. Это может быть для развлечения и развлечения. Более серьезное использование этой технологии — создание коммерческого контента (например, стоковые фотографии или изображения, мемы, миниатюры и т. д.).

Создатель на YouTube может использовать приложение для создания миниатюры для своего видео. Студенты могут использовать его для создания изображений, которые они могут использовать для классных отчетов или проектов. Чтобы быть более креативными, создатели контента могут использовать эту функцию (вместо сайтов со стоковыми фотографиями), чтобы создавать именно то, о чем они думают. Это можно сделать просто из приложения, установленного на смартфоне. Отсюда начинают открываться возможности для многих приложений.

Создайте свою собственную модель для фотосессии

Вы фотограф и ищете моделей для съемки? Что, если вы можете просто создать свою собственную модель онлайн? Собственно говоря, вы уже можете это сделать. Следующие лица на этих фотографиях не являются реальными людьми и были сгенерированы компьютером.

Эти изображения были сгенерированы онлайн из Этот человек не существует. Любой может создать фальшивого человека. В приложении используется генеративно-состязательная сеть (GAN), основанная на стилях генератор изображений. Из обучающего набора многих лиц со всего мира (различные типы лиц, этнические группы, расы и т. д.) программа генерирует лицо на лету. Нет нужных параметров. Программное обеспечение создает случайное лицо, когда пользователь нажимает кнопку Создать.

Это может быть съедобно, если вы боитесь, что это выглядит настолько реальным, что может заменить настоящего человека. Существуют даже приложения виртуальные модели, которые могут визуализировать не только лицо, но и тело (включая руки, ноги, туловище, ступни и другие детали). Это означает, что розничный продавец продуктов может использовать виртуальные модели в своей следующей рекламной кампании, чтобы сэкономить на найме реальной модели. Станет ли это на самом деле большим бизнесом, может зависеть от рыночных предпочтений и текущего состояния мира.

CM Models добавила линейку виртуальных моделей на свой веб-сайт. Одну из их виртуальных моделей зовут Зоя. Вы можете сказать, что Зои не настоящий человек, так как она выглядит очень сгенерированной компьютером. Дело здесь в том, что ее можно использовать в виртуальных мирах, как модель в зарождающейся метавселенной. Зои может появляться в спортивных версиях популярных модных брендов, которые также являются NFT (невзаимозаменяемыми токенами). Зои, скорее всего, не появится на подиуме во время недели моды, но в ближайшее время примет участие в виртуальном мероприятии в метавселенной.

Что может благоприятствовать использованию виртуальных моделей вместо реального человека? Есть разные причины. Одна из них может быть связана с отсутствием доступной модели человека, когда она нужна рекламной кампании. Кампания может временно заменить человека виртуальной моделью. Если в связи с ограничениями по здоровью будут введены дополнительные блокировки, продюсеры и креативные директора могут больше заняться виртуальной фотографией (то есть удаленными фотосессиями)и виртуальными моделями. Приложение может даже заменить настоящего фотографа и модель, что сэкономит время и деньги.

Создание генетического изображения

Пользователи приложения ArtBreeder могут изучить возможности применения ИИ для создания уникальных изображений лиц, произведений искусства и персонажей. Они используют машинное обучение для создания потрясающих изображений. Это не только люди, но и предметы, и почти все, что выходит за рамки воображения. Программное обеспечение генерирует изображения на основе их отличительных особенностей или генов (как в генной инженерии). Программное обеспечение может комбинировать эти гены для создания новых уникальных изображений.

Это приложение в основном используется для развлечения. Это форма социального приложения, поскольку пользователи могут использовать изображения друг друга для создания новых изображений. Изображениям присваиваются права на их создателей, и приложение делает их доступными для использования другими пользователями. Пользователям, которые создают много изображений, предлагается платная подписка со многими дополнительными преимуществами (в зависимости от уровня). Таким образом, это пример коммерческого приложения ИИ.

Пользователи могут комбинировать разные изображения (что похоже на размножение генетической информации), когда они создают свое собственное изображение. Затем его можно отследить с помощью «карты происхождения», которая показывает «происхождение» созданного образа. Пользователи могут продолжать создавать столько портретов и стилей изображений, сколько захотят, в то же время общаясь с другими пользователями. Это одновременно и творчество, и совместная работа, предоставляющая пользователям интерактивный опыт.

В искусстве это может быть способом проследить цифровую родословную творческой работы. Это в первую очередь для создания цифрового контента, а не для физического контента реального мира. С помощью этой системы художников можно приписывать и даже компенсировать (гонорар) в будущем, если кто-то захочет использовать их работу в коммерческих целях.

Редактирование изображений с помощью голосовых команд

Ретушеры и все, кто использует приложение для работы с фотографиями на своем смартфоне, скоро смогут использовать голосовые команды для редактирования своих фотографий. Это возможно благодаря интеграции естественного языка с программным обеспечением для обработки изображений. Например, пользователь может просто сказать:

"Осветлить фото"

Приложение будет понимать слово «осветлить» из подготовленного набора словарного запаса на языке, который оно распознает. После этого изображение станет ярче. Для более продвинутого пользователя должен быть какой-то способ контролировать детализацию функций. Они могут сказать:

"Осветлить фото +12"

Затем приложение отрегулирует яркость на 12 уровней из, скажем, 100. По-прежнему будет ручной способ сделать изображение ярче, но возможность использовать функции ИИ, которые могут понимать естественный язык, обеспечивает больше удобства, когда дело доходит до редактирования.

В истинном смысле естественного языка пользователь может говорить то, что ему нужно, как ему угодно. Структура не в синтаксисе, как в компьютерном коде. Вместо этого программа будет анализировать словарный запас и предложение, чтобы правильно интерпретировать команду. Это похоже на взаимодействие с помощником по громкой связи для выполнения задачи.

Синопсис

Художники и фотографы могут рассматривать эти новые приложения как инструменты, которые можно добавить в свой арсенал. Это может помочь в создании изображения, требуя только большего творчества в конечном результате. Художник может создать изображение, которое он имеет в виду, а затем продолжить работу с этим изображением, чтобы создать свою работу. Фотографы могут использовать приложение для редактирования своих изображений (в режиме реального времени) для достижения наилучшего возможного результата, что является отличительной чертой вычислительной фотографии. Мы уже видим это на некоторых смартфонах (например, iPhone), которые применяют методы искусственного интеллекта при обработке изображений.

Они также могут рассматривать искусственный интеллект как угрозу для сохранения занятости. Если обычный человек может просто создавать потрясающие изображения на лету, зачем ему платить художнику? Кому нужен фотограф, когда вы можете делать свои собственные фотографии на свой смартфон? Многие люди уже снимают собственные портреты или селфи с расширенными функциями камер смартфонов. Это сбои, которые вызывают сдвиг парадигмы, который всегда заставляет людей вносить коррективы.

Правда в том, что ни одна из этих технологий не заменит сразу хорошего художника, фотографа или модели. У этих креативщиков есть навыки, которые востребованы, несмотря ни на что. ИИ станет альтернативой норме, по крайней мере, до тех пор, пока технология не улучшится. Они имеют преимущество в скорости, экономии средств и удобстве. Несмотря на эти преимущества, креативный директор, скорее всего, по-прежнему будет работать с живой моделью и фотографом, а не использовать виртуальную модель для кампании. Художники по-прежнему будут востребованы, потому что их видение не заменит ни один компьютер.

Эти системы ИИ также не находятся на том же уровне, что и их человеческие аналоги. Это примеры общего ИИ, а не чего-то, что превзошло человеческие способности к творчеству. Компьютеры могут создавать впечатляющие изображения с тем, что доступно в ИИ, но они по-прежнему склонны к ошибкам и могут быть не в состоянии создавать контент, который ищут пользователи (на основе набора данных).

Изображения, созданные искусственным интеллектом — Следующий шаг в вычислительной фотографии