Как самообучающийся ИИ может переопределить наши представления о творчестве

Триумф Google AlphaGo в 2016 году против чемпиона мира по го Ли Седола со счетом 4: 1 вызвал настоящий ажиотаж, который вышел далеко за пределы сообщества го: более ста миллионов человек смотрели матч во время матча. Это была веха в развитии искусственного интеллекта: Go долгое время выдерживал попытки компьютерных ученых создать алгоритмы, которые могли бы работать на человеческом уровне. А теперь был создан искусственный разум, доминирующий над кем-то, кто посвятил тысячи часов практики относительной легкости оттачивания своего мастерства.

Это уже было большим достижением, но затем появилась AlphaGoZero и накормила AlphaGo своим собственным лекарством: она победила AlphaGo с отрывом 100: 0 всего через год после поражения Ли Седола. Это было даже более зрелищно, и по более чем очевидным причинам. AlphaGoZero был не только улучшенной версией AlphaGo. Если AlphaGo тренировалась с помощью профессиональных игр, в которые играли лучшие игроки в го, AlphaGoZero начинала буквально с нуля, работая над тонкостями игры без какого-либо надзора.

Не имея ничего, кроме правил игры и того, как выиграть, он заперся в своей виртуальной комнате и играл против себя всего 34 часа. Он не просто сочетал в себе исторически сложившееся гуманитарное понимание принципов и эстетики игры с бесспорно превосходящей числовой мощью компьютеров, но сам по себе стал доминирующей силой Го в известной вселенной.

Как этого добиться?

Шахматы против Го

Шахматы гораздо популярнее на Западе, чем го. Частично это могло быть связано с культурными причинами, с определенной близостью, которая была связана с интеллектуальными персонажами Востока и Запада. Шахматы иногда сравнивают с западным умом, основанным на правилах, а го больше похоже на целостные тенденции восточного ума. Го считается более открытым и интуитивно понятным, чем шахматы.

Этот угол может быть полезен для объяснения большой разницы в успехах ученых при создании компьютера для игры в го по сравнению с шахматным компьютером. В конце концов, доминирование искусственного разума - довольно старая новость для шахматного сообщества.

Люди пытались создать компьютеры для игры в шахматы, как только появились компьютеры (пионеры информатики Бэббидж, Тьюринг, Шеннон и фон Нейман разработали конкретное шахматное оборудование), что сделало шахматы исторически наиболее тщательно изученной проблемой в мире. весь искусственный интеллект .

Кульминацией этого развития стало то, что Deep Blue выиграл у чемпиона мира Гэри Каспарова в 1997 году и получил международное признание. Три года спустя лучший компьютер Го все еще побеждал 9-летний мальчик (с учетом гандикапа в девять ходов).

Это различие весьма существенное и связано с различиями в фундаментальной структуре игр. Понимание этого помогает объяснить, почему создание движка Go было намного сложнее, чем шахматного движка, а также почему он, будучи однажды успешным, стал такой вехой в наших поисках искусственного интеллекта.

Тактика против стратегии

«Шахматы - это искусство, выражающее науку логики».

Михаил Ботвинник

Шахматы и го представляют собой сочетание краткосрочной тактики и долгосрочной стратегии, как Дэвид Эпштейн объясняет в своей книге Диапазон. Компьютеры действительно хороши в краткосрочной тактике, потому что они могут буквально просто перебрать каждую возможную комбинацию в своей маленькой механистической головке и оценить лучшую, но им труднее при долгосрочном стратегическом мышлении.

Это относится к комбинаторному взрыву в пространстве всех ходов: дерево возможностей растет экспоненциально, и после 50 ходов возможностей во Вселенной больше, чем атомов, поэтому ограничения конечных вычислительных мощностей вступают в силу довольно быстро. Чтобы преодолеть эту проблему, программистам нужны хорошие эвристики и таблицы решений, чтобы исключить заведомо плохие ходы и заглушить дерево решений (см. Здесь хорошее введение о деревьях решений в шахматы).

Они более доступны в шахматах, чем в го: пешка стоит примерно 1, слон и конь 3, ладья 4, ферзь 9, если вы контролируете центр, вы обычно лучше, если ваши фигуры развиты, это обычно хорошо, если ваши пешки связаны, это хорошо и т. д. (как и во всем, исключения подтверждают правила).

После глубокого эвристического поиска по дереву будущих ходов шахматные позиции могут быть оценены численно как имеющие определенное значение для черных или белых. Таким образом, символический, основанный на правилах подход к ИИ, который был наиболее популярен и казался наиболее многообещающим в существенные периоды прошлого века, естественно, подходил для применения в шахматах, и вопрос создания лучших движков заключался в поиске более эффективных алгоритмов поиска. деревья решений и наращивание вычислительной мощности.

Но для го это не сработало: гораздо сложнее оценивать позиции го таким же образом. То, что люди называют «интуицией» и долгосрочной стратегией, играет большую роль. Даже профессиональные игроки в Го во многих случаях не могут объяснить свои интуитивные представления о том, что происходит в игре. Просто слишком много всего может случиться, и дерево поиска слишком быстро разрастается, чтобы создавать алгоритмы с четкими критериями, позволяющими им конкурировать с людьми.

Итак, Go нужно было взламывать с совершенно другим подходом. Революция глубокого обучения произошла в удобное время, предлагая широкий спектр новых методов. Как объясняет Дэвид Сильвер, лидер команды AlphaGo, AlphaGo был первым в своем роде алгоритмом, который не полагался на структурированный поиск, а вместо этого использовал обучение с подкреплением и глубокие нейронные сети.

И, как показал их успех, это сработало очень хорошо.

Обучение с подкреплением

«Обучение с подкреплением похоже на интеллект».

Дэвид Сильвер

Обучение с подкреплением можно примерно определить как интеллектуального агента, взаимодействующего в среде. Как уже было использовано мной здесь слово «интеллектуальный», проблема обучения с подкреплением более четко формулирует общую проблему искусственного интеллекта. Наш собственный интеллект наиболее ярко проявляется в нашей способности действовать в сложной и неопределенной среде, которую мы называем миром. Мы можем ставить собственные цели или преследовать их, исследуя окружающую среду и решая проблемы, которые стоят между нами и нашими целями.

Мы можем представить себе игрока в го, сидящего и игриво исследующего игру, можем представить, что значит обнаружить таким образом новую и творческую идею. Таким образом, принципы AlphaGoZero очень близки к нашему интуитивному пониманию интеллекта.

Вот почему Дэвид Сильвер считает, что будущее искусственного интеллекта вполне может быть основано на обучении с подкреплением.

Роль интуиции в шахматах

Хотя создание символического ИИ возможно в шахматах, не следует забывать, что то, что мы называем «интуицией», играет огромную роль и для игроков-людей в игре. В то время как современные шахматные движки могут оценивать любую позицию, вычисляя с помощью большого набора возможных ходов и сравнивая их с экспертными базами данных игр, гроссмейстеры не имеют такой роскоши, и, хотя они могут рассчитывать на много ходов вперед, они также полагаются на интуитивно понятные оценки достоинств. позиций и качества ходов, особенно в форматах с более быстрым временем, таких как быстрые, блиц или ракетные шахматы (только от 15 до 1 минуты на часах на игрока).

«Хотя все художники не являются шахматистами, все шахматисты - художники».

Марсель Дюшан

Шахматы никогда не были только наукой. Шахматы - это тоже спорт, и шахматы - это еще и искусство, уникальное зрелище, в котором композиция вневременной красоты может происходить одновременно с выступлением, почти как на джазовой пластинке. Итак, в шахматах всегда есть взаимодействие между художественным и научным элементами. Они объединяются в каждом хорошем шахматисте и в каждой шахматной партии, хотя и с совершенно разными акцентами. Но, как и следовало ожидать, за последние двадцать лет этот акцент сместился.

Появление компьютеров оставило след в современных шахматах и ​​привело к захватывающей динамике в шахматном мире. Это развитие может предвещать множество событий, ожидающих человечество, ставя под сомнение то, как мы определяем себя и некоторые из того, что делает нас наиболее человечными: наше искусство, наше творчество, наше чувство прекрасного.

Как машины изменили шахматы

Играть на ничью, во всяком случае белыми, - это до некоторой степени преступление против шахмат.
Михаил Таль

После поражения чемпиона мира Каспарова над Deep Blue в 1997 году шахматы уже не были такими, как раньше. Если компьютеры играют в шахматы лучше людей, то, безусловно, есть чему у них поучиться. И поэтому современные шахматные гроссмейстеры начали изучать позиции с помощью двигателей, проверять комбинации, оценивать позиции и изучать лучшие ходы, опираясь на комбинационную мощь и дальновидность. Матч за первенство Ананд против Карлсена в 2013 году многими считался игрой между старым поколением шахматистов и совершенно новым поколением восходящих звезд, которые были первыми, кто всю свою жизнь тренировался с помощью суперкомпьютеров. Карлсен победил, открыв новую эру шахмат, которая, возможно, лучше всего выразилась в игре на первенство мира 2018 года, в которой Карлсен и Каруана завершили все двенадцать партий чемпионата вничью.

Конечно, для шахматной партии ошибки не годятся, но ошибки неизбежны и в любом случае игра без ошибок, или, как говорят, «безупречная игра», бесцветна.
Михаил Таль

Некоторые критикуют, что в высокоуровневых шахматах все меньше связано с смелыми жертвами и красивыми атаками, а с отсутствием ошибок, хорошим пониманием позиций и знанием лучших ходов во многих дебютах изнутри (с последующим выигрышем в ничейных эндшпилях, как чемпион мира). Карлсен так хорошо известен). Конечно, это также связано с чрезвычайно высоким качеством игры, которое необходимо сегодня для достижения вершин шахматного мира.

Человеческий фактор в шахматах

Для меня шахматы - больше искусство, чем наука.
Михаил Таль

Но отчасти это также связано с движками: некоторые в сообществе заявляют, что машины разрушили шахматы, и что современным шахматам не хватает человеческого элемента, не хватает вдохновения и свежести, которые были обнаружены в классических играх первые дни мастеров. Игры Пола Мерфи или Адольфа Андерсена, такие как Эвергрин или Ночь в опере, все еще анализируются спустя 150 лет после того, как в них сыграли, а игры таких мастеров, как Капабланка или Таль, продолжают заставлять людей влюбляться в игру. Но действительно ли дни человеческих шахмат, определяемых сокрушительными атаками и вдохновляющими ударами, закончились?

У Михаила Таль было много прозвищ: многие в шахматном сообществе называли его просто Рижский маг. Как и многие другие, он представляет шахматиста как художника, как поэта, как эксцентричного, смелого и веселого человека. Его многочисленные драматические жертвы получили легендарный статус в шахматном сообществе. Он не играл в рисование, а играл так, чтобы каждая партия была как стихотворение: неповторимая, захватывающая, эмоциональная и, если все складывалось удачно, красивая. Тем не менее, многие думают, что современные гроссмейстеры легко выиграют у более старых мастеров. Поскольку драматические жертвы иногда могут подавить противника, дестабилизировать позиции, вызвать ошибки (Таль сравнил это с ведением своего противника в темный лес) и привести к преимуществам в эндшпиле, если им осторожно противостоять, они также могут легко привести к потере материала. нестабильные позиции и, в конечном итоге, к поражению.

Но, возможно, наша дихотомия неверна. Должен ли машинный разум олицетворять механическую жесткость, грубый расчет? Должен ли он убивать дух игры? Неужели искусственный разум обязательно кажется нам искусственным и устаревшим? Или можно найти другую красоту?

AlphaZero говорит «да»: и это может снова изменить современные шахматы.

AlphaZero и красота искусственного разума

Машины загубили шахматы. Самообучающийся ИИ может спасти шахматы.
agadmator

AlphaZero - мастер нескольких профессий: он перешел от го к изучению шахмат и после менее чем 24 скудных часов тренировок победил Stockfish, самый мощный на сегодняшний день шахматный движок на рынке.

Есть что-то особенное в игре AlphaZero в шахматы. Он делает шаги, которые кажутся человечными и в основе своей творческими. AlphaZero может играть агрессивно, преследуя долгосрочные стратегии, казалось бы, дразня своих оппонентов, умело и изобретательно отключая фишки. Почти как человек, почти как те поэты за шахматной доской, почти как Таль, но лучше: как Таль на стероидах.

Я всегда задавался вопросом, как было бы, если бы высший вид высадился на Землю и показал нам, как они играют в шахматы. Теперь я знаю.
Питер Хайне Нильсен

Просмотр некоторых игр AlphaZero может быть вдохновляющим опытом. Он играет таким образом, который почти немыслим для игроков-людей. Чужие шахматы даже для гроссмейстеров. И очень многие, в том числе чемпион мира Магнус Карлсен, изучали шахматные партии AlphaZero. По словам Карлсена, они принесли ему новые идеи и взгляды на игру и помогли ему улучшить свой стиль. Также с интересом изучается то, как Alpha проходила различные« человеческие открытия во время фазы обучения».

Спустя 20 лет после Deep Blue искусственный разум снова меняет шахматы.

Похожая картина наблюдалась и с Го: во второй игре против Ли Седола AlphaGo сделала знаменитый «37-й ход». Это противоречило всем правилам, которым игроков учат с юных лет, и никто из профессиональных игроков этого не ожидал. Он был обнаружен компьютером и стал частью общих знаний человечества. Точно так же, после первоначального шока от поражения, Ли Седол зашел так далеко, что сказал, что AlphaZero вернула ему радость от игры, потому что он понял, что в игре, которую он исследовал все свои жизнь.

Куда это может нас привести

«Творчество - это развлечение интеллекта».
Альберт Эйнштейн

Творчество означает открытие чего-то, о чем раньше не знали. По мере того, как AlphaZero тренируется в процессе открытия, у него есть пространство, чтобы стать по-настоящему творческим, даже ставя под вопрос, что мы подразумеваем под творчеством.

Для Гэри Каспарова появление AlphaZero - более важный момент в истории искусственного интеллекта, чем DeepBlue, именно потому, что он основан на открытиях. Когда мы думаем о заре ИИ, мы думаем о холодной рациональности машинного разума, медленно овладевающего человечеством. Обычно мы не думаем о творчестве, о том удовольствии, которое может быть получено от этого.

Мы обезьяны, которым гравитация не могла помешать выйти в космос. Мы обезьяны, которые стреляют протонами друг в друга со скоростью, близкой к скорости света, и обнаруживают гравитационную рябь черных дыр на расстоянии миллиардов световых лет от нас. Мы - агенты невероятной сложности и запутанности реальности, когда-либо исследуем, когда-либо учимся. AlphaZero показывает нам, как открытия искусственного разума могут послужить источником вдохновения для нашего постоянного любопытства. Есть много других областей, в которых взаимодействие замысловатых узоров обогащает наше существование. Есть музыка (с Deepfake музыка начинает раздражающе хорошо звучать), поэзия, искусство, наука.

Области, в которых мы можем слишком сильно придерживаться нашего идеала о том, что значит быть творческими и значимыми.

AlphaZero так хорош именно потому, что показывает, что ИИ может добавить к этому миксу: ИИ не должен отнимать радость от того, что, по нашему мнению, делает нас самыми человечными.