Вычислительное творчество (CC) направлено на подражание или копирование человеческого творчества с помощью компьютера. Его алгоритмы используются для создания новой и комбинированной музыки с эстетической ценностью. Интеллект, основанный на машинном обучении, предполагает синтез новых идей или идей на основе заданных данных. Если можно научиться разуму, то можно и творчеству.

Парадокс творческого подхода к программированию заключается в том, что его неограниченный характер используется алгоритмами ИИ, которые создают детерминированные правила для уменьшения масштабов проблемы. Творчество бесконечно, нонконформистское, абсурдное и бесконечно сложное. Таким образом, необходимо ввести «правила» для решения проблемы сложности и управления структурой, эффективностью и качеством, при этом жертвуя вариативностью, абстрактностью и количеством.

Музыкальное метакреобразование означает программирование системы, которая создает новое разнообразие музыки. Существует множество концепций и алгоритмов создания музыки, некоторые из которых я обсуждаю.

Цепь Маркова - это последовательность узлов или событий, в которой вероятность текущего состояния зависит от предыдущего. Таким образом, вы можете вычислить вероятности перехода из одного состояния в другое и объединить их в матрицу. Например, вы играете в Марио, и текущий экземпляр ведет к различным следующим экземплярам - вы можете прыгать, оставаться на месте, бежать и т. Д. У каждого экземпляра будет вероятность появления, учитывая текущее положение Марио, поведение игрока и игровые ограничения. Будет последовательность или несколько идеальных действий, которые принесут наивысшее вознаграждение - например, монеты.

Точно так же, используя ноты в качестве состояний, будут лучше звучать последовательности нот. Это используется для определения частей, которые с высокой вероятностью будут хорошо звучать вместе в перестановке. Эта концепция может быть использована для создания эстетических мелодий. Он упускает из виду более сложные шаблоны между заметками, поскольку учитывает только предыдущую заметку как текущую. Он также склонен к повторному использованию шаблонов из обучающих данных, что приводит к менее оригинальным результатам.

Правила генеративной грамматики могут использоваться для описания структур музыки точно так же, как грамматика может использоваться для описания языка. В грамматике есть терминальные символы и переменные. Сгенерированный язык - это набор всех строк терминальных символов, которые могут быть получены из начальной точки и последовательного применения любого количества правил перезаписи.

Для описания музыкального материала используется грамматика. Это можно настроить для определенного жанра или звука. Если вы хотите создать джаз, вы можете использовать грамматику Стидмана для последовательностей джазовых аккордов или создать свою собственную грамматику. Вы можете представлять последовательности аккордов в виде символов и использовать ИИ для создания последовательностей аккордов, соответствующих правилам грамматики.

Связанная идея состоит в том, чтобы использовать алгоритмы сопоставления с образцом для анализа «сигнатур», коротких музыкальных последовательностей, которые определяют анализируемый стиль, и для определения того, когда и как использовать эти сигнатуры, возможно, встраивая их символические представления в грамматику. Затем можно использовать Переходную сеть для создания музыки в стиле композитора. Этот метод обычно приводит к повторному использованию материала, взятого из усвоенного корпуса, новым способом. В дальнейшем творчество можно запрограммировать на более оригинальное.

Нейронные сети - это структуры данных, которые упрощают машинное / глубокое обучение. Дизайн нейронных сетей вдохновлен биологической нейронной сетью животных. Нейронные сети отлично подходят для захвата архетипов мелодий и использования этой информации для создания новых мелодий.

Рекуррентные нейронные сети (RNN) используются в условиях последовательных данных, когда время имеет важное значение и имеет значение. Они выполняют одну и ту же функцию для каждого отдельного элемента последовательности, причем результат зависит от предыдущих вычислений. Тайминг является фундаментальным в музыке, и RNN кодируют время для информирования и создания новых произведений.

Сети с долгосрочной памятью (LSTM) - это эффективные RNN, способные изучать долгосрочные шаблоны. В сетях используются специальные ворота для определения количества информации, полученной из новых входных данных, и того, что сохраняется из старых входных данных. Концептуальное пространство сложное, а выходы содержат нюансы. Однако на вычисления требуется больше времени. DeepBach - это творческая программа искусственного интеллекта, которая генерирует новые хоралы в стиле Баха, состоящие из современных нот. Он неплохо справляется.

Генеративные состязательные сети (GAN) используют две нейронные сети, противостоящие друг другу, для создания более надежных результатов. Один генерирует звуки, имитирующие то, что можно узнать из реальных примеров, а другой пытается различать настоящие и имитированные звуки. По мере того, как один становится лучше, другой также должен становиться лучше, чтобы «победить» другую сеть (отсюда «состязательная»). Эту алгоритмическую структуру можно использовать для создания RNN с прямой и обратной связью, что приводит к более творческим результатам. Природа нейронных сетей в виде черного ящика затрудняет понимание творческого процесса ИИ.

Эволюционные алгоритмы начинаются с набора случайных подходящих решений проблемы. Алгоритмы объединяют эти решения для получения новых решений, выбирая решения, которые лучше отвечают на проблему. Вы постепенно приближаетесь к оптимальному решению, которое необходимо представить. Вам также понадобится фитнес-функция, чтобы оценить качество создаваемой музыки. Создаваемая музыка становится лучше благодаря большему количеству итераций комбинирования, оценки и исследования.

У музыки, как и у искусства, есть субъективное восприятие, поэтому трудно выбрать музыку, которая звучит однозначно, а не другую. Популярность или сложность можно использовать, чтобы приблизиться к предоставлению структуры оценки созданной музыки. Правила теории музыки можно использовать для разработки фитнес-функции. Явный контроль или использование людей для оценки пригодности может дать более творческие результаты. Идеальное решение само по себе может быть ограничением, ограничивающим создаваемые музыкальные произведения.

Многоагентная система (MAS). Агент - это представление человека / объекта в среде. Алгоритм Voyager использует 64 агента проигрывателя, которые генерируют мелодии в соответствии с одним из различных алгоритмов генерации звука, написанных программистом по своему вкусу. Затем он строит модель поведения, которая описывает общий тембр, темп, диапазон высоты тона и другие особенности, которые регулируют развитие пьесы. Это моделирует группу, в которой все импровизируют, но все же следует некоторому общему согласию.

MAS можно использовать для имитации социальных взаимодействий с агентами, имеющими разные эмоции, убеждения, идиосинкразии и способность выражать их с помощью звука. Идея состоит в том, чтобы смоделировать двух агентов - композитора и оценщика. Композитор использует теорию музыки и запрограммированные убеждения для создания музыки. Намерения двух агентов представлены алгоритмами, применяемыми для применения и проверки теоретических правил, формирующих их убеждения. Преднамеренное общение между ними приводит к созданию творческой части.

Точно так же агенты могут быть запрограммированы на основе установленных убеждений и желаний. Агент может передать определенную эмоцию через свое пение, и это может повлиять на другого агента с его собственными вкусами и сообщить пение этого агента. Субъективные вкусы могут быть запрограммированы в агентах для создания музыки с большей индивидуальностью.

Одними из самых серьезных проблем в этой области являются оценка, структура и творчество созданной музыки. Трудно согласиться с объективной системой оценки - идеей, которая подчеркивает, что определенная музыка всегда лучше, чем другая. Часто человек используется для оценки того, насколько креативна музыка, что приводит к субъективной оценке. Трудно создавать длинные пьесы с разными частями в музыкальной форме. Структура может быть запрограммирована в правила грамматики. Трудно дать определение творчеству и дать количественную оценку. Трудно составлять фрагменты с развивающимся рассказом и эмоциями.

Музыка, созданная искусственным интеллектом, будет только улучшаться. Идеи из человеческих песен можно использовать для воздействия на музыку с искусственным интеллектом, чтобы она звучала более человечно. Понимание и контроль творческого процесса могут дать лучшие результаты, некоторые из которых уже замечательны. Это песня, сделанная AI для Евровидения. Я с нетерпением жду появления хит-парадов AI в чартах.

Больше контента на plainenglish.io