Нам действительно нравится играть в игры, не так ли? Но играть в игры против машины проще, чем играть в игры с людьми. По понятным причинам человек выстраивает стратегию в зависимости от ситуации, а видеоигры — нет.

Нам, людям, всегда нравится получать вознаграждение, а откуда берется вознаграждение? Ответ заключается в том, чтобы преодолеть проблемы, которые мы получаем от них. Поэтому, когда мы думаем о видеоиграх, мы хотим, чтобы нам немного было трудно играть. Но у видеоигр есть некоторые ограничения, например, видеоигры не знают, как разработать стратегию для победы. Это чертовски простая логика, которую он должен выполнять. Каждый раз, когда вы находитесь на этапе игры, в нем происходят одни и те же события и ходы.

Короче говоря, компьютер не может думать и делать ходы, как мы в играх. Конечно, теперь у нас есть несколько настольных игр, в которых используются возможности искусственного интеллекта и машинного обучения. Но эта концепция не нова. Почти 50 лет назад, в 1962 году, великий математик Мартин Гарднер создал настольную игру под названием HEXAPAWN, которая учится на своих ошибках и становится лучше, играя как игрок-человек

Теперь давайте посмотрим, что такое машинное обучение или ML. Позвольте мне выразить это так, если мы играем во множество игр, в которые можно играть с компьютером в качестве противника. Если мы выиграем, это весело, но если мы потерпим неудачу на этапе, когда мы попытаемся повторить попытку, мы всегда склонны отбрасывать наши прошлые плохие ходы, которые привели нас к неудаче. Эта тенденция увеличивает наши шансы на победу в игре. Эта концепция называется «обучение». Поскольку мы вели учет наших предыдущих неудачных ходов, которые мы не использовали в будущей игре.

Вы когда-нибудь задумывались, что, если машина может учиться на своих предыдущих ходах и отбрасывать плохие? Можем ли мы когда-нибудь получить шанс победить эту машину?

Как здорово, должно быть, бросить вызов машине?😎

Hexapawn также ведет учет неудачных ходов. Чтобы играть в эту игру, Гарднер предложил построить аналоговый «компьютер» с машинным обучением, используя спичечные коробки для каждой возможной доски и цветные конфеты для представления возможных ходов. Правила этой игры довольно просты и аналогичны шахматам.

Правила:-

Игра похожа на шахматы, в ней используются только пешки. Цель

1- Чтобы добраться до другой стороны доски или захватить все вражеские фигуры.

2- Или оставить врага без возможных ходов. Чтобы уменьшить объем работы, необходимой для алгоритма, мы предполагаем, что человек всегда играет белым и ходит первым, а алгоритм играет черным и ходит вторым. Кроме того, вместо полной шахматной доски мы используем только квадрат 3 на 3, всего 9 плиток.

Играть в игру-

Гарднер предложил сделать первый ход человеком, чтобы уменьшить вероятность неправильного хода. Если человек ходит первым, он пойдет с центральной или угловой пешкой, как показано на рисунке ниже.

Машина будет играть во 2,4 и 6-м ходах. Что ж, 7-й ход определит победителя.

Есть 24 возможных изображения доски для игры во 2, 4 и 6-й ход. Многие доски являются зеркальным отражением других.

За второй ход машина передвинула только центральную пешку или одну из угловых пешек.

На 4-м и 6-м ходу у машины есть 11 возможных ходов.

Как работает алгоритм-

Чтобы играть, каждый раз, когда машина делает ход, мы случайным образом выбираем скрепку с карты, которая представляет текущую доску. Мы продолжаем делать это до тех пор, пока игрок не выиграет.

Когда алгоритм проигрывает, мы возвращаемся к карточке с последним сделанным алгоритмом ходом и удаляем скрепку, соответствующую этому ходу. Если во время игры на карточке, представляющей текущее игровое поле, не осталось скрепок, алгоритм признает поражение и сдается.

Поначалу алгоритм легко обыгрывается, но после многих игр его становится все труднее и труднее обыграть. Примерно после 50 игр алгоритм играет отлично. Таким образом, набор бумаги и скрепок может стать таким же умным, как человек-игрок. Здесь я публикую полное дерево игры



Сейчас вы скажете .. ок! Я понял, вы говорите о сделанном вами аналоговом компьютере (который даже не может загрузиться 😊 😊). Как это связано с машинным обучением?

Ну, Вы заметили, что мы убираем скрепки из игры, это все равно, что давать наказание, когда он делает ошибку. Это аналогично ученику, когда ученик поступает правильно, учитель ставит ему положительную оценку (вознаграждение в ОД), а за ошибки учитель ставит ему отрицательную или нулевую оценку (наказание в ОД).

Эта игра не для развлечения, но она демонстрирует, что машина может быть сложной, как человек. В настоящее время машинное обучение и искусственный интеллект являются модными словами, мы пытаемся внедрить их во все области, такие как здравоохранение, наука и исследования, сельское хозяйство и развлечения. Сейчас мы используем ИИ в повседневной жизни — от развлечений до рекламы. Надеемся, скоро мы сможем сыграть в Assassin’s Creed против ИИ 😵 😵.

Для следующего поста, пожалуйста, предложите мне тему.

Я планирую написать код игры, дайте мне знать, если хотите.

И, как всегда, «САН АТЧОМАРИ ЙЕРААН!»😉😉

Источники: https://en.wikipedia.org/wiki/Hexapawn

www.rigb.org/christmaslectures08/html/activities/sweet-computer.pdf

ai.aeortiz.com/2017/07/10/machine-learning-with-hexapawn/

www.di.fc.ul.pt/~jpn/gv/hexapawn.htm

https://www.chessvariants.com/small.dir/hexapawn.html