Технореализм и музыка: на пути к сбалансированному взгляду на искусственный интеллект и музыкальную композицию

23 апреля 2019 г.

Изображения искусственного интеллекта склонны к преувеличению, как положительному, так и отрицательному, с изображениями доброжелательных спасителей и экзистенциальных угроз, регулярно появляющихся в массовой культуре, технической журналистике и академической теории. [1] В одном случае у нас есть утопический взгляд, принятый Предприниматели из Кремниевой долины, такие как Питер Тейл и Рэй Курцвейл, которые верят, что технология автоматизации освободит человечество от тяжелого труда и страданий[2]. В эссе в технопозитивистском издании Wired Кевин Келли предсказывает: Скоро у всех нас будут личные рабочие боты, которые будут у нас на побегушках. Они будут выполнять ту же работу, что и мы, и делать ее намного лучше… они позволят нам сосредоточиться на том, чтобы стать более человечными. [3] На другой стороне этого грандиозного видения освобождения — предупреждения Стивена Хокинга и Илон Маск, которые видят в появлении AI General Intelligence (AGI) [4] серьезную угрозу. Как сказал Хокинг на технологической конференции Web Summit 2017 года: Если мы не научимся готовиться к потенциальным рискам и избегать их, ИИ может стать худшим событием в истории нашей цивилизации. Он несет с собой опасности, такие как мощное автономное оружие или новые способы для немногих угнетать многих. >2001: Космическая одиссея (1968) и совсем недавно в сериале HBO Мир Дикого Запада (2016).

Хотя эти утопические и антиутопические нарративы об ИИ заставляют задуматься и являются мощным средством для философских и драматических исследований, они могут ввести в заблуждение относительно природы современных исследований ИИ, которые, как правило, сосредоточены на использовании ИИ для выполнения узко определенных задач. [6] Сегодня искусственный интеллект используется для помощи людям в различных процессах, начиная от управления самолетом и заканчивая анализом компьютерной томографии и рентгеновских снимков. В задачах, где точность и аккуратность имеют первостепенное значение, искусственный интеллект с его способностью обрабатывать данные экспоненциально быстрее, чем человеческий мозг, кажется естественным. Однако использование искусственного интеллекта в художественных начинаниях, в том числе в музыке, вряд ли ново. Первая сгенерированная компьютером партитура, The Illiac Suite, была разработана в 1957 году Лежареном Хиллером и Леонардом Исааксоном. В 1980-х и 90-х годах появление технологий машинного обучения позволило композитору и ученому-компьютерщику Дэвиду Коупу разработать EMI, программную платформу, способную генерировать музыкальные партитуры в самых разных жанрах, от хоралов Баха до балийского гамелана. Коупу и его сторонникам казалось, что искусственный интеллект обладает безграничным потенциалом для увеличения творческих способностей человечества»[7]. В двадцатом веке исследования музыки с помощью ИИ были в основном прерогативой академических кругов. Однако сегодня его преследуют Google, IBM, Sony и стартапы, включая AIVA, Jukedeck и Amper. В своей статье 2018 года для The Guardian Мечтают ли андроиды об электрических битах? Тирхака Лав предупреждает о потенциальных опасностях полностью автоматизированного коммерческого музыкального ИИ: Утопическая синергия проектов экспериментаторов, несомненно, уступит место манипуляциям. — даже откровенная эксплуатация — в коммерческих целях». [8] Но прежде чем мы рассмотрим полезность и риски технологии композиции ИИ в коммерческих условиях, мы должны выяснить, способен ли искусственный интеллект вообще создавать музыку, убедительную и выразительную в первое место.

Искусственный интеллект с его способностью выполнять задачи, которые ранее считались по силам только людям, не является ни спасителем, ни разрушителем, а скорее инструментом, который следует использовать с большой осторожностью. Появление крупномасштабного коммерческого производства музыки с использованием искусственного интеллекта не является основанием для отказа луддитов от музыкальных технологий. Однако это должно заставить тщательно пересмотреть значение творчества, социальную функцию музыки и источники музыкального значения. Следуя примеру Дэвида Коупа, сегодняшние музыкальные стартапы ИИ переводят музыку в данные, сводя их к предполагаемой сущности высоты тона, ритма и формы. культурные, социальные и эмоциональные аспекты музыки вырезаются и отбрасываются. Музыка, создаваемая этими механизмами ИИ, функциональна и может соответствовать стилистическим и формальным требованиям, предъявляемым конечным пользователем, но поскольку музыкальные механизмы ИИ создают музыку исключительно на основе данных, а не живого опыта, воплощенных знаний или личного понимания, музыка ИИ в его нынешней форме не хватает выражения, эмоционального воздействия и точки зрения.

В следующем документе будут рассмотрены философские и этические вопросы, связанные с использованием искусственного интеллекта в музыкальной композиции, с особым акцентом на его использование в музыке для кино и средств массовой информации. Центральным элементом моей критики автоматизации музыкального сочинения будет вопрос о вычислительном мышлении — вере в то, что все явления могут быть атомизированы в данные — поскольку это относится конкретно к воплощенному человеческому опыту музыки. Я применяю широкую критику автоматизации, изложенную в Стеклянной клетке Николаса Карра, конкретно к области музыки, исследуя последствия предвзятости автоматизации и самоуспокоенности. [10] Предоставление технического понимания машинного обучения и сильные и слабые стороны музыкальной композиции ИИ — это Виртуальная музыка Дэвида Коупа: компьютерный синтез музыкального стиля. Я сравню подход и философию Коупа с подходом и философией нового поколения музыкальных предпринимателей ИИ, анализируя опубликованные интервью и материалы конференций Пьера Барро, генерального директора AIVA, и Эдварда Ньютона Рекса из Jukedeck. Наконец, я продемонстрирую, как книга Ханса Эйслера и Теодора Адорно Сочинение для фильмов 1947 года с критическим анализом гомогенизирующей практики крупных киностудий и призывом к более глубокому пониманию социологических аспектов киномузыки , остается остро актуальным.

И. Возможности и ограничения музыкальной композиции с помощью ИИ

Композитор Дэвид Коуп (р. 1941) начал работу над программой, которая впоследствии стала Experiments in Musical Intelligence, или EMI, в 1981 году. Его первоначальным импульсом было желание преодолеть период писательского кризиса, и, таким образом, он начал работу над программой, которая мог создавать новую музыку, основанную на стиле его предыдущей работы. [11] Коуп изменил направление, когда понял, что отсутствие критической дистанции от его собственной работы помешает ему провести объективный анализ своей музыки, необходимый для построения такой программы. В своей книге 2001 года Virtual Music он говорит: Я был слишком близок к своей музыке, чтобы осмысленно определить ее стиль или, по крайней мере, так, чтобы его можно было легко запрограммировать в компьютерной программе. [12]» Вместо этого Коуп начал разрабатывать программу, которая могла бы извлекать значимые данные из анализа партитур классических композиторов периода общепринятой практики, от Баха до Шопена.

В своем выступлении на конференции Slush в Финляндии в 2016 году Эдвард Ньютон-Рекс, генеральный директор британского стартапа Jukedeck, специализирующегося на искусственном интеллекте, описал грамматический подход Дэвида Коупа к музыкальной композиции ИИ как важное достижение по сравнению с подходом, основанным на правилах. используется с конца 1950-х годов. [13] Согласно анализу Рекса, программное обеспечение Cope EMI было способно давать убедительные результаты, потому что его выходные данные были основаны на грамматике отдельного композитора, а не на общих правилах. можно найти в учебнике по теории музыки. Как и Коуп, Ньютон-Рекс получил музыкальное образование и является программистом-самоучкой. Он начал разработку Jukedeck в 2014 году, и после нескольких первоначальных тестов с системами, основанными на правилах, Ньютон-Рекс использовал нейронные сети и машинное обучение в качестве основы музыкального движка Jukedeck.[14] В интервью The Guardian's в техническом подкасте Chips with Everything Ньютон-Рекс описал процесс обучения нейронной сети на больших наборах данных из музыкальных партитур: На самом деле вам не нужно систематизировать правила, вы вместо этого может заставить компьютер учиться самостоятельно. [15] Преимущество этого подхода заключается в том, что движок ИИ изучает неявные правила музыкальной композиции, как это практикуют композиторы-люди, а не полагаясь на явные правила гармонии, голосоведения и контрапункта. Ньютон-Рекс обнаружил, что использование нейронных сетей для композиции позволяет системе получать более разнообразный и нюансированный музыкальный вывод. [16]

Хотя EMI Дэвида Коупа и движки музыкальных композиций Aiva и Jukedeck были разработаны в разные десятилетия и с разными музыкальными целями, они в своей основе опираются на базы данных. Музыкальные партитуры, переведенные в MIDI-данные, являются топливом для создания музыки ИИ. Как описывает Коуп в Virtual Music, Experiments In Musical Intelligence почти полностью полагается на свою базу данных для создания новых композиций. [17] EMI синтезирует новые музыкальные композиции на основе рекомбинантной системы, посредством которой музыкальные фразы извлекаются из базы данных произведений схожего стиля, часто написанных одним и тем же композитором. Затем фразы изменяются и комбинируются новыми способами. [18] Зная, что баллы в базе данных имеют прямое и глубокое влияние на результат программы, Коуп описывает процесс тщательного прояснения с помощью программного обеспечения для записи, чтобы убедиться, что есть никаких ошибок или несоответствий в записи». ) система анализа каждого аккорда в композиции, которая определяет его роль в структуре произведения. [20] Система тегов метаданных SPEAC контекстуализирует структуры, которые могут иметь эквивалентное музыкальное написание (например, CEG или ACE), но служат различные функции в зависимости от размещения метрики, продолжительности или местоположения во фразе.

В поддержку методов и достижений своего программного обеспечения Cope и Newton-Rex приравнивают свои музыкальные ИИ-движки к человеческому обучению и композиторской практике. Что касается рекомбинантных основ его системы, Коуп заявляет, что Рекомбинация более крупных групп высоты тона и длительности, я считаю, составляет основу музыкальной композиции и помогает установить сущность как личных, так и культурных музыкальных стилей. Ньютон Рекс описывает процесс обучения нейронной сети композиции как аналогичный методу, используемому для обучения нейронных сетей распознаванию изображений, но вместо того, чтобы программа отвечала на вопрос есть ли на этом изображении кошка? вместо этого она должна ответить какая нота должна быть следующей?[21] В процессе обучения делать прогнозы на основе предыдущего ввода система изучает музыкальный синтаксис и в конечном итоге развивает способность создавать целые музыкальные произведения.

Хотя рекомбинация, безусловно, играет роль в составе человека, а нейронные сети, по крайней мере метафорически, похожи на некоторые структуры человеческого мозга, композиция с помощью компьютерной программы остается эпистемологически отличной от композиции человека. По мере того, как компьютерные технологии продолжают развиваться, возникает соблазн описать примеры расширенной функциональности, используя термины человеческих способностей, таких как проницательность и понимание. Однако, как утверждает Николас Карр в Стеклянной клетке, термин нейронная сеть может ввести нас в заблуждение, заставив поверить в то, что компьютеры работают по принципу, прямо аналогичному нашему мозгу. Карр подчеркивает, что, хотя компьютеры могут воспроизводить результаты человеческого интеллекта, такие как сочинение музыки или вождение автомобиля, они не могут воспроизводить процесс человеческого мышления, поскольку мы еще не знаем, как работает мозг, как мысль и сознание возникают в результате взаимодействия нейронов, мы не можем построить компьютеры, которые делают то, что делает мозг. [22]

Это различие между результатами и процессом применительно к музыкальному сочинению ИИ исследуется Эланор Селфридж-Филд в ее эссе Композиция, комбинаторика и моделирование, опубликованном в разделе комментариев к книге Virtual Music Дэвида Коупа. Селфридж-Филд стремится контекстуализировать программное обеспечение EMI ​​в истории западной мысли о композиции, от ее тесной связи с астрономией и гуманитарными науками в средние века, через акцент на гении и вкусе в Эпоха Просвещения, к диалектике формы и содержания в немецком идеализме XIX века. В конечном счете, Селфридж-Филд с трудом помещает программное обеспечение Коупа в эту историю, заявляя, что по сравнению с историческими моделями музыкальной композиции, ранее рассмотренные «Эксперименты в музыкальном интеллекте, кажутся пустыми». [23] Хотя она признает впечатляющие способности EMI создавать новые музыкальные партитуры в стиле многих великих композиторов классической традиции, заключает она: С философской точки зрения симуляция — это не то же самое, что симулируемая деятельность. Это не сама вещь. Это приближение, представление, абстракция. [24] Как рекомбинантные, так и нейронные сети создают новые музыкальные партитуры исключительно на основе данных, и им не хватает знаний об историческом и культурном контексте их создания.

II. Пределы вычислительного мышления и музыки

В главе Автоматизация для людей книги Стеклянная клетка Николас Карр утверждает, что доминирующим подходом к проектированию, используемым технологическими компаниями, является автоматизация, ориентированная на технологии.[25] автоматизация смотрите на быстрое развитие компьютерных технологий и сравнивайте людей с медлительностью, неточностью и ненадежностью. При разработке программного обеспечения с использованием этого подхода инженеры и программисты возлагают тяжелую работу на компьютер, а человеку отводят вспомогательную роль. Карр находит связующую нить, которая связывает взгляды многих технических руководителей, журналистов, выступающих за автоматизацию, и технологов, которые можно резюмировать в риторическом вопросе: Кому вообще нужны люди?[26]Яркий пример такой антигуманистической точки зрения можно найти в статье Wired 2013 года об авиационной отрасли, где теоретик технологий Кевин Келли заявил, что Мы должны позволить роботы берут верх. Компьютеризированный мозг, известный как автопилот, может управлять Боингом 787 без посторонней помощи, но мы иррационально помещаем пилотов в кабину, чтобы они присматривали за автопилотом на всякий случай. [27]

Хотя может показаться заманчивым возразить такому аргументу в пользу полной автоматизации авиаперелетов, приведя примеры, когда системы автопилота приводили к авариям со смертельным исходом, более важно обратиться к основным предположениям, лежащим в основе этой точки зрения, а именно к философии решения и вычислительное мышление. Автор Джеймс Бридл описывает эти две концепции как взаимосвязанные: Вычислительное мышление является расширением того, что другие называют решенчеством: верой в то, что любая данная проблема может быть решена путем применения вычислений. [28] Бридл считает, что оба решения и вычислительное мышление основаны на вере в то, что мир можно свести к данным и что, обрабатывая эти данные, можно понять, отобразить и предсказать любой процесс. [29] как программного обеспечения EMI Дэвида Коупа, так и нового поколения систем музыкальной композиции на основе ИИ на основе нейронных сетей, показывая, что обе они построены на представлениях музыки, сведенных к данным. В этом разделе я расскажу, как музыкальная композиция и исполнение в значительной степени зависят от неявных знаний, человеческого восприятия и воплощенного опыта мира. Присущая этим элементам не поддающаяся количественной оценке природа делает музыку, сочиненную ИИ, неспособной пройти музыкальный тест Тьюринга без существенного редактирования композиций людьми, нарушающими правила.

В 1988 году исследователь робототехники Ганс Моравек постулировал, что, вопреки традиционным предположениям, аналитическое мышление требует очень мало вычислений, но сенсомоторные и бессознательные навыки требуют огромных вычислительных ресурсов[30]. Например, компьютеру относительно легко выполнять сложные математические вычисления. расчеты, но очень сложно научить робота ходить или открывать дверь. Моравек далее исследует эту идею, известную как парадокс Моравека, в своей книге Дети разума: будущее роботов и человеческого интеллекта:Сравнительно легко заставить компьютеры демонстрировать на уровне взрослых в тестах на интеллект или игре в шашки, и трудно или невозможно дать им навыки годовалого ребенка, когда речь идет о восприятии и подвижности. [31] Моравек объясняет это тем фактом, что человеческое восприятие и двигательные навыки развивались в ходе эволюции в течение миллиардов лет, в то время как сложные рассуждения — относительно новое явление в человеческом мозгу, возможно, ему всего сто тысяч лет. Преднамеренный процесс, который мы называем рассуждением, — это, я считаю, тончайшая оболочка человеческого мышления, эффективная только потому, что она поддерживается этим гораздо более древним и очень мощным, хотя обычно бессознательным, сенсомоторным знанием. [32]»

В западной классической традиции композиция часто рассматривается как интеллектуальное занятие, конечным результатом которого является создание музыкального произведения[33]Даже если рассматривать композицию в узких рамках интеллектуального акта, есть существенные элементы, которые опираются на сенсорные, психологические и физиологические состояния. Многие композиторы, как современные, так и исторические, сочиняют с помощью инструмента, добавляя к композиции элемент перформанса. Даже без использования слухового аппарата, такого как фортепиано или функции воспроизведения нотной записи, физический элемент создания музыки сохраняется. Звонимир Надь утверждает в своей книге Воплощение музыкального творчества, что размышление о звуке подразумевает динамическую взаимосвязь между телесным слуховым восприятием звука и психологической концепцией звука в том, что касается музыкальной композиции»[34]. ]»

Как обсуждалось в первом разделе этой статьи, сторонники музыкальной композиции ИИ часто изображают то, как компьютеры учатся и сочиняют музыку, очень похоже на процесс, которым занимаются люди. Однако двигатели ИИ отличаются от человеческого мозга тем, что знания и процедурные инструкции в них отделены от другой информации и процессов, содержащихся в компьютере. Перефразируя психолога и чемпиона по шахматам Элиота Херста, в мозгу нет музыкального модуля. [35] Для Херста шахматы были глубоко переплетены со всем, что представляет собой человек. То же самое можно сказать и о музыке. Компьютеры не способны познать радость, страдание или тоску, равно как и любопытство, юмор и иронию. Хотя искусственный интеллект может быть способен побеждать людей в шахматы или сочинять стилистически убедительную тональную музыку для обычной практики, как в случае с программным обеспечением EMI Дэвида Коупа, их результаты достигаются с помощью вычислений грубой силы, основанных на обработке данных. [36] Чтобы применить парадокс Моравека к музыке: компьютеру требуется относительно небольшая вычислительная мощность, чтобы понять самую тонкую оболочку человеческой музыки — высоту тона, ритм и форму, — но потребуется гораздо больше обработки, чтобы понять музыкальный смысл, подтекст и культурное значение. исполнительской практики. На сегодняшний день не существует системы ИИ, которая могла бы сочинять с таким уровнем намерения и понимания.

III. Музыкальный рынок ИИ

Критически важным для заявлений о ценности как AIVA, так и Jukedeck является идея демократизации и персонализации музыкальной композиции. [37] Для тех, у кого нет необходимого опыта для сочинения музыки или у кого нет финансовых ресурсов, чтобы нанять композитора, Музыкальный движок AI может показаться идеальным решением для удовлетворения музыкальных потребностей. На веб-сайте Jukedeck, например, все, что нужно сделать, чтобы создать новое и уникальное музыкальное произведение, — это сделать выбор из ряда подсказок, включая жанр, настроение, инструментовку, темп и продолжительность. [38] В несколько коротких минут, трек готов и готов к загрузке в виде аудиофайла. Сосредоточившись на создании музыки специально для кино, Пьер Барро из AIVA планирует разработать систему для анализа и извлечения ключевых слов из сценариев. [39] из аналогично помеченных наборов данных. Музыкальные стартапы с искусственным интеллектом позиционируют настраиваемую оригинальную музыку по запросу как демократизирующую силу, открывающую возможность создания музыки непосредственно кинематографистам и другим создателям контента. Кроме того, стартапы в области ИИ продвигают свои композиционные движки как инструменты, которые композиторы могут использовать для генерации идей, повышения творческого результата и решения писательского тупика. [40]

Следуя предложенной Селфридж-Филдом точке зрения о том, что симуляция не эквивалентна той деятельности, которую она имитирует, мы можем увидеть недостатки в слепом принятии музыкального программного обеспечения ИИ как действительно персонализирующей и демократизирующей силы. Выбор атрибутов и прослушивание их эффекта на выходе — это всего лишь симуляция настоящей музыкальной персонализации. Извлечение ключевых слов, предложенное Барро, сводит драматические темы к метаданным и работает только как заполнитель для понимания. Например, ИИ, извлекающий слово «одиночество» из сценария, свяжет его с музыкальными фразами, помеченными соответствующими эмоциональными индикаторами. Сравнительное узнавание не эквивалентно пониманию тем, смысла и подтекстов.

Чтобы понять потенциальное влияние использования музыкальных движков ИИ на рабочий процесс композиторов, мы должны рассмотреть влияние автоматизации в других отраслях и практиках. В своей работе Стеклянная клетка Николас Карр рассматривает влияние автоматизации на широкий круг профессий, включая архитектуру, медицину и авиаперевозки. Карр цитирует исследование, проведенное социологом из Массачусетского технологического института Шерри Теркл, которое показало, что архитекторы с гораздо большей вероятностью проверяли измерения на чертежах, нарисованных от руки, чем на созданных компьютером, что свидетельствует о предвзятости участников в отношении точности компьютерной системы. [41] Когда мы используем компьютеры для выполнения задач, мы становимся склонными к тому, что Карр описывает как два когнитивных недуга: предвзятость автоматизации и самодовольство автоматизацией. [42] Предвзятость автоматизации возникает, когда мы доверяем достоверность компьютерной информации выше нашей собственной. Самоуспокоенность в области автоматизации является результатом чрезмерной зависимости от программного обеспечения для решения проблем и обнаружения ошибок. [43]

AIVA продвигает идею музыкальной технологии ИИ как генератора музыкальных тем в блоге своей компании, заявляя:

В настоящее время мы разрабатываем Music Engine на базе AIVA, чтобы усилить творческие способности композиторов, используя искусственный интеллект, чтобы предоставить им множество музыкальных идей для создания. В конечном счете, мы считаем, что писательский кризис должен уйти в прошлое, чтобы у композиторов было больше времени, чтобы продвигать свою работу — и самих себя — к совершенству[44]

Однако вместо того, чтобы связать композитора с визуальным и тематическим содержанием фильма, использование программного обеспечения ИИ отделяет композитора от материала. В то время как композитор, работающий автономно, будет разрабатывать темы на основе интуиции, ассоциаций и приобретенных знаний, тот, кто работает с движком ИИ, может вместо этого бросать музыкальные кости, создавая темы с помощью программного обеспечения, пока не услышит ту, которая будет сочтена подходящей. Использование движка ИИ для создания идей подталкивает композитора от более активной к более пассивной роли в творчестве. В этой более пассивной роли важность оригинальности и креативности снижается, и композитор становится склонным к автоматизму и самоуспокоенности. Сам процесс сочинения музыки становится, как описывает писатель и теоретик технологий Лэнгдон Виннер, окутанным абстракцией, когда он скрывается за электронной сложностью.[45] Когда мы полагаемся на технологию как на средство генерации идей, мы рискуем заменить наши намерения и идеи предположениями и присущими технологии предубеждениями. [46]

IV. ИИ-музыка в кино и медиа

В своей книге 1947 года об эстетике и практике киномузыки Сочинение музыки для киноХансЭйслер и Теодор Адорно проводят различие между автономной музыкой, музыкой, предназначенной для исполнения, и музыкой для фильмов. . В автономной музыке, особенно в тональной музыке, форма и идеи могут развиваться постепенно в течение произведения, а модуляции и повторения добавляют контекст и значение по мере развития произведения. [47] Музыка в кино, напротив, должна двигаться вместе, а иногда и предвосхищать действие в фильме. Для Эйслера и Адорно музыка, использовавшаяся в фильмах 1930-х и 40-х годов, имела тенденцию плыть по экрану, как дымка, затемняя визуальную резкость изображения и противодействуя реализму, к которому в принципе обязательно стремится фильм [48]. ]» В значительной степени опираясь на приемы, заимствованные из романтизма 19-го века, включая парящие мелодии, пышную оркестровку и в основном тональную гармоническую лексику, музыка, сопровождавшая эти голливудские фильмы, затемняла и чрезмерно драматизировала их визуальные элементы. Эйслер и Адорно предположили, что музыкальные инновации композиторов-модернистов Арнольда Шенберга и Игоря Стравинского могут обеспечить решение этой проблемы разрыва между визуальными эффектами и фильмом — не обязательно для более широкого использования диссонанса в произведениях этих композиторов, — но скорее для растворения условная музыкальная парадигма верхней мелодии с гармоническим сопровождением. [49]

Начиная с 1950-х годов такие композиторы, как Бернард Херрманн, создавали более компактные и более психологически ориентированные партитуры, которые соответствовали духу сочинения музыки для фильмов. Херрманн нарушил отраслевые условности, используя электронные инструменты, более скудные оркестровки и необычные сочетания инструментов в своей музыке, создавая уникальный звуковой мир для каждой сочиненной им музыки к фильму. [50] Его внимание к тембру, инструментам, а психологические эффекты, создаваемые музыкой, помогли пересмотреть искусство озвучивания фильмов. Нынешний подход AIVA к созданию музыки, напротив, сосредоточен на создании лейтмотива темы, особенно в симфонических стилях, и кажется довольно архаичным, восходящим к музыкальным практикам композиторов Золотого века Голливуда. такие как Макс Штайнер и Эрих Корнгольд. В конце 20-го и 21-го века акцент на текстуре и психологическом воздействии при озвучивании фильмов заменил длинные мелодичные темы в качестве доминирующей практики. [51] Было бы трудно представить мелодию из восьми или шестнадцати тактов, оказывающую такое же влияние. как повторяющаяся двухнотная музыкальная ячейка, которая является Jaws Theme Джона Уильямса[52]Сосредоточенность AIVA на создании темы, возможно, не обусловлена ​​тем, что наиболее критично для композиторов в процессе озвучивания фильмов, но тем, что легче всего производить в массовом порядке. Большая часть оценки изображения зависит от визуального и слухового восприятия, а также от понимания того, как добавление музыки будет взаимодействовать с визуальными эффектами, звуковыми эффектами и диалогами. Поручение этих задач программному обеспечению потребует гораздо более продвинутых технологий и программирования, чем это возможно с помощью одного механизма генерации тем с поддержкой нейронной сети.

Из-за ограничений систем нейронных сетей в творческих приложениях аналитик по медиа и технологиям Марк Маллиган считает, что в настоящее время в музыкальной композиции ИИ основное внимание уделяется фоновой музыке — композициям, которые не обязательно предназначены для аналитического прослушивания или чистого удовольствия. Маллиган описал эту тенденцию в интервью Стюарту Дреджу: Музыка с искусственным интеллектом далеко не настолько хороша, чтобы стать «хитом, но это не главное [курсив добавлен]. Он создает музыку 21 века. Точно так же, как девяносто пять процентов людей не будут жаловаться на качество музыки в лифте, так и большинство людей сочтут музыку ИИ совершенно приемлемой на фоне видео». [53] Есть настройки, при которых этот тип музыки работает исключительно хорошо, например, в корпоративных обучающих видеороликах или в материалах о путешествиях и образе жизни на YouTube. Музыкальный ИИ имеет явное преимущество перед композиторами-людьми, когда речь идет о количестве продукции, поскольку он способен создавать тысячи музыкальных композиций в день со скоростью производства, привязанной только к скорости сети и процессора.

В своей статье 2009 года Computer Models of Creativityнейробиолог Маргарет Боден описывает скорость создания творческого ИИ как одно из его основных преимуществ. [54] Боден называет исследовательским творчеством. При наличии набора правил и указаний механизмы ИИ могут генерировать бесконечные вариации, иногда с неожиданными и новыми результатами. [55] Однако для написания музыки к полнометражным повествовательным или документальным фильмам требуются навыки и понимание, выходящие за рамки такого исследовательского творчества. . Стремясь создать драматическую дугу или создать звуковой ландшафт, напоминающий определенный сеттинг, композиторы должны комбинировать музыкальные идеи неожиданными и новыми способами, что требует обширных культурных, исторических и материальных знаний. Например, при выборе инструментов композитор-человек может принять во внимание коннотации валторны и фагота или обветренного пианино и нетронутого Steinway Grand. Озвучивание фильмов требует внимания к драматическому повествованию и визуальным образам. Междисциплинарное сотрудничество, такое как озвучивание фильмов, требует того, что Маргарет Боден называет комбинированным творчеством.[56] Хотя люди от природы преуспевают в комбинированном творчестве, таком как образы, метафоры и каламбуры, этот тип творчества является одним из самых сложных для систем ИИ. .

Механизмы ИИ способны создавать неограниченное количество музыкальных тем, но бывают обстоятельства, когда осмысленное повторение и развитие гораздо более желательны и эффективны, чем создание массивного хранилища музыкальных вариантов. Композитор Бернард Херрманн был известен своей способностью оказывать эмоциональное воздействие при большой экономии музыкальных средств. давний соавтор Альфреда Хичкока. В 1975 году режиссер Мартин Скорсезе нанял Херрманна для написания музыки к фильму Таксист. Скорсезе искал композитора за его способность изображать психологические состояния в музыке. Позже режиссер размышлял о своей реакции на музыку, говоря, что он не … знаете, можете ли вы сказать, что его музыка — это то, что я ожидал. Это была музыка Херманна. Это послужило психологической основой на протяжении всего [фильма]... Его музыка похожа на водоворот. Он идет все глубже и глубже. Такое ощущение, что оно никогда не завершится. Он имеет глубокую психологическую силу. [58] Саксофонная мелодия главной темы полна одиночества, репрезентируя жизнь главного героя фильма. Элементы партитуры с оттенком джаза, барабанная установка и тяжелые медные реплики культивируют эстетику, которую Скорсезе описывает как нью-йоркскую готику, представляя город, переживающий бедствие в эпоху экономической и социальной борьбы. [59] В то время как тщательный Анализ музыкальных приемов, которые Херрманн использовал в своих партитурах для передачи характера, настроения и обстановки, выходит за рамки этой статьи, ясно, что для создания убедительного музыкального портрета травмированного персонажа, такого как Таксист главного героя Трэвиса Бикла или мрачного Нью-Йорка 1970-х годов, нужно иметь глубокое и детальное понимание того, что это такое и почему его стоит исследовать. Музыкальный ИИ в его нынешнем виде был разработан на основе анализа музыкальных партитур, но ему не хватает знаний о нюансах, которыми музыка в конечном итоге связана с человеческим опытом.

В. Выводы

Технологические инновации и прорывы во многом повлияли на историю музыки 20-го и начала 21-го веков. Композиция искусственного интеллекта окажет огромное влияние в ближайшие пять-десять лет, особенно на композиторов, работающих в области библиотечной и производственной музыки.[60] Понимая, как работают ИИ и нейронные сети, мы можем понять, какие типы музыки, которую они могут производить, и каковы их ограничения. Стартапы в области искусственного интеллекта, финансируемые инвесторами, и транснациональные корпорации имеют сильный экономический стимул продвигать, а иногда и преувеличивать возможности своих продуктов. Важно не принимать за чистую монету их обещания о демократизации композиции и персонализации саундтреков.

Обещания демократизации с помощью технологий не уникальны для сегодняшних компаний, занимающихся искусственным интеллектом, но были преобладающим клише среди политиков в течение последних сорока лет. В 1989 году Рональд Рейган сказал, что Голиаф тоталитаризма будет свергнут Давидом микрочипа. где либеральная демократия будет распространяться вместе с информационной революцией, подпитываемой персональными компьютерами и зарождающимся интернетом. Однако за последние 30 лет послужной список технологий в области демократизации был в лучшем случае неоднозначным. Арабская весна 2011 года подпитывалась Twitter и другими платформами социальных сетей, но не смогла принести демократию, что привело к контролируемому военными правительству в Египте и, казалось бы, бесконечной гражданской войне в Сирии. Надежда на то, что только технология может помочь миру решить крупномасштабные проблемы, является ярким примером того, что технические критики Евгений Морозов и Джеймс Бридл назвали бы решенничеством.[62]»

Одни только технологии не могут решить глобальные проблемы, такие как бедность, политическое угнетение или изменение климата. Точно так же музыкальная технология ИИ сама по себе не может демократизировать создание музыки. Нынешние подходы к созданию музыки на основе искусственного интеллекта, как правило, соответствуют концепции Николаса Карра об технологической автоматизации, либо полностью заменяя композитора, как в случае с системой загрузки аудио Jukedeck, либо уменьшая количество композиторов. помощникам по оркестровке, как в случае с системой генерации тем AIVA, которая ставит алгоритм на место водителя. Это не означает, что технология искусственного интеллекта изначально плоха для музыкального сочинения, но мы должны сосредоточиться на ее реализации таким образом, чтобы расширять возможности, а не заменять или ослаблять людей-композиторов с помощью автоматизации, ориентированной на человека.[63] ] Чем больше композиторы и музыканты в целом понимают ценность своего жизненного опыта, культурных знаний и уникальных человеческих качеств, тем больше они могут настаивать на технологиях, которые работают на повышение их творчества, инструментах, которые помогают им активно участвовать в своей работе. а не пассивные способы, и программное обеспечение, которое помогает использовать их таланты и способности. Наконец, не следует забывать, что музыкальные движки ИИ производят не музыку, а партитуры — в виде MIDI-файлов или синтезированных реализаций MIDI-файлов, а партитура — это не то же самое, что музыка как таковая. Как заметил философ Альфред Коржибски об отношениях картографии и физического пространства: Карта — это не та территория, которую она представляет. [64]

Библиография

Адорно, Теодор и Ханнс Эйслер. Сочинение музыки для фильмов. 1947. Перепечатка, Нью-Йорк:

Континуум, 2010.

Баллантайн, Кристофер Джон. Музыка и ее социальные значения. Нью-Йорк: Гордон и Брич

Издательство науки, 1984.

Барро, Пьер. «Как ИИ может создать персонализированный саундтрек к вашей жизни». ТЕД. апрель

2018. https://www.ted.com/talks/pierre_barreau_how_ai_could_compose_a_personalized

_саундтрек_к_вашей_жизни.

– – –. Беседовал Майкл Коупленд. «Эп. 34: Пьер Барро объясняет, как Айва использует Deep

Учимся делать музыку». Подкаст ИИ. 22 августа 2017 г. https://blogs.nvidia.com/blog/2017/08/09/ai-podcast-aiva-ai-music-gtc-pierre-barreau/.

Боден, Маргарет А. «Компьютерные модели творчества». Журнал AI 30, 7 июля 2009 г.

23–34. дои: 10.1609/aimag.v30i3.2254.

Карр, Николас Г. Стеклянная клетка: автоматизация и мы. Нью-Йорк: WW Norton, 2014.

Справляйся, Дэвид. Виртуальная музыка: компьютерный синтез музыкального стиля. Кембридж, Массачусетс: MIT Press,

2000.

– – –. Компьютерные модели музыкального творчества. Кембридж, Массачусетс: MIT Press, 2005.

– – –. Беседовал Крис Гарсия. Музей компьютерной истории. Устная история Давида

Справиться. 12 марта 2018 г. https://youtu.be/f4NUrB7ZNrk

Дрейфус, Хьюберт Л. Чего еще не умеют компьютеры: критика искусственного разума. 1979. 8 место

изд., Кембридж, Массачусетс: MIT Press, 1994.

Дредж, Стюарт. «ИИ и музыка: станем ли мы рабами алгоритма?» Хранитель. 06 августа,

2017. https://www.theguardian.com/technology/2017/aug/06

/искусственный-интеллект-и-будем-мы-рабами-алгоритма

Эд Ньютон-Рекс. «Может ли нейронная сеть сочинять музыку, которую вы хотите услышать?» Интервью

Ли Александр и Иэн Чемберс. Chips With Everything (аудиоподкаст), 14 апреля 2017 г. https://www.theguardian.com/technology/audio/2017/apr/14/can-a-neural-network

-сочинить-музыку-техно-подкаст, который вы хотите услышать

Харари, Юваль Ной. Homo Deus: краткая история завтрашнего дня. Нью-Йорк: Харпер

Многолетник, 2018.

С любовью, Тирхака. «Мечтают ли андроиды об электрических битах? Как искусственный интеллект меняет музыку навсегда».

Хранитель. 22 октября 2018 г.

https://www.theguardian.com/music/2018/oct/22/ai-artificial-intelligence-composing

Миранда, Эдуардо Рек., изд. Чтения по музыке и искусственному интеллекту. Амстердам:

Издательство Harwood Academic Publishers, 2000.

Моравец, Ганс. Дети разума: будущее роботов и человеческого интеллекта. Кембридж, Массачусетс:

Издательство Гарвардского университета, 1988.

[1] Арджун Харпал, Стивен Хокинг говорит, что ИИ Может быть «худшим событием в истории нашей цивилизации, CNBC, 06 ноября 2017 г. https://www.cnbc.com/2017/11/06/stephen-hawking-ai-could-be-worst- событие-в-цивилизации.html.

[2] Николас Г. Карр, The Glass Cage: Automation and Us (Нью-Йорк: WW Norton, 2014), 227.

[3] Карр, Стеклянная клетка, 225.

[4] Согласно определению Общества AGI, Общий искусственный интеллект (AGI) — это развивающаяся область, направленная на создание «мыслящих машин; то есть системы общего назначения с интеллектом, сравнимым с человеческим разумом». (http://www.agi-society.org/) ОИИ контрастирует с подходом, используемым в большинстве современных исследований ИИ, которые сосредоточены на разработке механизмов ИИ для конкретных задач.

[5] Арджун Харпал, Стивен Хокинг

[6] Асгард и Роланд Бергер, Глобальный ландшафт искусственного интеллекта, Medium, 22 мая 2018 г., https://medium.com/@bootstrappingme/global-artificial-intelligence-landscape-включая-database-with- 3-465-ai-companies-3bf01a175c5d.

[7] Дэвид Коуп, Виртуальная музыка: компьютерный синтез музыкального стиля, (Кембридж, Массачусетс: MIT Press, 2000) 36.

[8] Tirhakah Love, Мечтают ли андроиды об электрических битах? Как искусственный интеллект меняет музыку к лучшему The Guardian, 22 октября 2018 г., https://www.theguardian.com/music/2018/oct/22/ai-artificial-intelligence-composing.

[9] Пьер Барро, Как ИИ может создать персонализированный саундтрек к вашей жизни. TED, апрель 2018 г., https://www.ted.com/talks/pierre_barreau_how_ai_could_compose_a_personalized_soundtrack_to_your_life.

[10] Карр, Стеклянная клетка, 67 лет.

[11] Коуп, Virtual Music, 93.

[12] Коуп, Виртуальная музыка, 93.

[13] Эд Ньютон-Рекс, Творческий ИИ: когда компьютеры освоят музыкальную композицию? Слякоть, 5 декабря 2016, видео,

https://www.youtube.com/watch?v=YbKhy16Kewg

[14] Эд Ньютон-Рекс, Может ли нейронная сеть сочинять музыку, которую вы хотите услышать? интервью Ли Александра и Иэна Чемберса, Chips With Everything (аудиоподкаст), 14 апреля 2017 г., https://www.theguardian.com/technology/audio/ 2017/apr/14/can -а-нейронная-сеть-сочиняет-музыку-вы-хотите-услышать-технологический-подкаст

[15] Ньютон-Рекс, Нейронная сеть

[16] Ньютон-Рекс, Нейронная сеть

[17] Коуп, Виртуальная музыка, 144.

[18] Коуп, Virtual Music, 96.

[19] Коуп, Виртуальная музыка, 147.

[20] Коуп, Виртуальная музыка, 130.

[21] Ньютон-Рекс, Нейронная сеть

[22] Карр, Стеклянная клетка, 119.

[23] Коуп, Виртуальная музыка, 205

[24] Коуп, Виртуальная музыка, 215

[25] Карр, Стеклянная клетка, 161.

[26] Карр, Стеклянная клетка, 153.

[27] Карр, Стеклянная клетка, 153.

[28] Джеймс Бридл, New Dark Age: Technology and the End of the Future (London:Verso, 2018), гл. 1, iBooks.

[29] Джеймс Бридл, Мир не может быть сведен к данным, выпуск Verso Books, 20 июля 2018 г., видео, https://youtu.be/EX33grqBVP8.

[30] Ханс Моравек, Дети разума: будущее роботов и человеческого интеллекта (Кембридж, Массачусетс: издательство Гарвардского университета, 1988), 15.

[31] Моравец, Будущее интеллекта, 15.

[32] Моравец, Future of Intelligence, 15–16.

[33] Эндрю Каниа, Философия музыки, Стэнфордская философская энциклопедия, 11 июля 2017 г., https://plato.stanford.edu/entries/music/#BeyoPureMusi.

[34] Звонимир Надь, Воплощение музыкального творчества: когнитивная и перформативная причинность музыкальной композиции (Лондон: Routledge, 2016), гл. 1, https://books.google.com/books/about/Embodiment_of_Musical_Creativity.html?id=_FduDQAAQBAJ&printsec=frontcover&source=kp_read_button#v=onepage&q&f=false.

[35] Cope, Virtual Music, 35. Дословная цитата Хиста: В мозгу нет шахматного модуля.

[36] Коуп, Virtual Music, 36.

[37] Ньютон-Рекс, Нейронная сеть и Барро, Персонализированный саундтрек

[38] Jukedeck, Создавайте уникальную музыку AI без лицензионных отчислений для ваших видео, по состоянию на 1 апреля 2019 г., https://www.jukedeck.com/make.

[39] Барро, Персонализированный саундтрек

[40] Aiva Technologies, Как мы использовали наш музыкальный движок для создания первого альбома китайской музыки, сгенерированного искусственным интеллектом, Medium, 10 сентября 2018 г., https://medium.com/@aivatech/how-we -использовал-наш-музыкальный-движок-для-создания-первого-сгенерированного-ИИ-альбома-на-китайском- music-9d6fa984b4e8.

[41] Карр, Стеклянная клетка, 69 лет.

[42] Карр, Стеклянная клетка, 67 лет.

[43] Карр, Стеклянная клетка, 153.

[44] Aiva Technologies, Наш музыкальный движок.

[45] Карр, Стеклянная клетка, 2019–210.

[46] Карр, Стеклянная клетка, 210.

[47] Адорно, 36

[48] Адорно, 21 год

[49] Адорно, 21 год

[50] Дэвид Мермельштейн, Дерзкий и оригинальный, Бернард Херрманн изменил музыку к фильмам, The Washington Post, 24 июня 2011 г., https://www.washingtonpost.com/entertainment/music/daring-and-original- bernard-herrmann-changed-movie-music/2011/06/21/AGG0YXjH_story.html?noredirect=on&utm_term=.7eb6610c7cf6.

[51] Келли Эванс Рао, Лейтмотив в американской звуковой киномузыке, доступ 23 апреля 2019 г., https://filmleitmotif.weebly.com/the-leitmotif.html.

[52] Келли Эванс Рао, Лейтмотив

[53] Стюарт Дредж, ИИ и музыка: будем ли мы рабами алгоритма? The Guardian, 06 августа 2017 г. https://www.theguardian.com/technology/2017/aug/06/artificial-intelligence-and-will-we-be-slaves-to-the-algorithm

[54] Маргарет А. Боден, Компьютерные модели творчества Журнал AI 30, 7 июля 2009 г., doi:10.1609/aimag.v30i3.2254.

[55] Боден, Модели творчества

[56] Боден, Модели творчества

[57] Дэвид Мермельштейн, Дерзкий и оригинальный

[58]Музыка в кино (отрывок), реж. Джошуа Валецки, Мартин Скорсезе говорит о Бернарде Херрманне, 9 января 2018 г., https://www.youtube.com/watch?v=LZG-wvlPRjk&feature=youtu.be.

[59] Музыка в кино (отрывок), реж. Джошуа Валецки

[60] Dredge, ИИ и музыка

[61] Майкл Мейер, Евгений против Интернета, Columbia Journalism Review, январь/февраль 2014 г., https://archives.cjr.org/cover_story/evgeny_vs_the_internet.php.

[62] Майкл Мейер, Евгений против интернета.

[63] Карр, Стеклянная клетка, 153.

[64] Карр, Стеклянная клетка, 220.