Равновесие Нэша, лучший ответ

Введение

Мы очень подробно обсуждали концепцию решения строгого доминирования в прошлом блоге. Его применение ограничено и применимо только к некоторым разделам игр (игры со строгой доминирующей стратегией). Строгой доминантной стратегии часто не существует.

Рассмотрим игру Битва полов.



Нет доминирующей стратегии.
В прошлом блоге мы обсуждали понятие веры. Игрок будет вести себя оптимально (лучший ответ) в соответствии со своими убеждениями. Крис может вести себя оптимально и пойти на футбол, учитывая его уверенность в том, что Алекс идет на футбольный матч. Но их убеждения могут быть ошибочными.

В этом блоге мы обсудим одну из самых центральных и самых известных концепций решения в теории игр. Это устраняет многие недостатки, с которыми сталкиваются другие концепции решений, разработанные Джоном Нэшем.

Концепция решения равновесия Нэша

Давайте определим концепцию решения Нэша. Равновесие Нэша представляет собой набор стратегий, для которых каждый игрок выбирает наилучший ответ на стратегии всех других игроков.
Каждая стратегия в равновесии Нэша является лучшим ответом на все другие стратегии в этом равновесии. Формально определим равновесие Нэша:

Определение: профиль чистой стратегии s*= (s*, s*,..., s*n ) ∈ S является равновесием по Нэшу, еслиs*ᵢ является лучшим ответом на s*₋ᵢ для всех i ∈ N, то есть

v(s∗ᵢ , s∗₋ᵢ) ≥ v(sᵢ, s∗₋ᵢ) для всех sᵢ ∈ Sᵢ и все i ∈ N.

Обратите внимание, что s* — это профиль стратегии, а не стратегия. Профиль стратегии относится к набору действий, предпринимаемых всеми игроками в стратегической среде/игре.

Пример 1

давайте попробуем понять это определение, разработав пример.

Рассмотрим это матричное представление. Теперь давайте запишем все возможные профили стратегий.
S = {(L,U), (C,U),(R,U),(L,M), (C,M),(R,M), (L,D), (C,D),(R,D)}.
Теперь давайте оценим платежные функции по отношению к наилучшему ответу.
если игрок 1 выбирает U, лучшим ответом для игрока 2 будет L: BR₂(U) = L
BR(U) = L, BR₂ (M) = C, BR₂(D) = R
BR(L) = U, BR₁(C) = D, BR₁(R) = U
Теперь внимательно наблюдайте. Если игрок 2 выбирает L, то лучшим ответом игрока 1 будет {U}; в то же время, если игрок 1 выбирает U, то лучший ответ игрока 2 {L}. Он явно подходит под определение выше.

Итак, это s*: {L, U} равновесие Нэша.

Пример 2

давайте применим концепцию решения Нэша к дилемме заключенных.

S = {(RS,BE), (BE,BE), (BE,RS), (RS, RS)}
Равновесие Нэша s* равно (BE,BE)
Я призываю читателей решить это и узнать, как (BE, BE) равновесие Нэша.

Предположения о равновесии Нэша

Вот предположения для равновесия Нэша:

  1. Каждый игрок разыгрывает лучший ответ на свои убеждения.
  2. Представления игроков о своих противниках верны.

Мы не будем углубляться в эти предположения, так как это может поставить нас в гущу философских дискуссий.

Сравнение с другими концепциями решений

Пример 1

Давайте сравним концепцию решения Нэша с другими концепциями решения:

Здесь легко сделать вывод, что для обоих игроков не существует стратегии строгого доминирования: таким образом, концепция строгого доминирования терпит неудачу.
Нет строго доминируемой стратегии для любого игрока, поэтому метод повторного исключения неприменим.

Давайте проверим, существует ли равновесие Нэша в чистой стратегии.
BR₁(L) = D, BR(C) = M, BR₁(R) = M
BR₂(U) = L,BR(M) = C, BR₂(D) = L
находим, что (M, C) — это равновесие Нэша в чистой стратегии — и оно уникально.

Концепция решения лучше всего, если она предсказывает или предписывает уникальную стратегию. Необходимо понять, всегда ли равновесие Нэша дает единственную стратегию.

Пример 2

Давайте рассмотрим игру Битва полов.

Решим равновесие Нэша для этой игры.
S = {(O, F), (O, O), (F, F), (F,O )}
BRa(O) = O, BRa(F) = F
BRc(O) = O, BRa(F) = F

Мы можем ясно заметить, что у нас может не быть уникального равновесия Нэша, но обычно это приводит к более точным предсказаниям, чем предсказания строгой концепции доминирующего решения и итеративного исключения.

Концепция решения равновесия по Нэшу широко применяется в экономике, политологии, юридических исследованиях и даже биологии.

Дополнительные примеры равновесия Нэша

Давайте обсудим пример, в котором мы можем применить концепцию решения Нэша к реальной проблеме.

Пример 1: Охота на оленей (социальное сотрудничество)

Два человека выходят на охоту. Каждый может индивидуально выбрать охоту на оленя или охоту на зайца. Каждый игрок должен выбрать действие, не зная выбора другого. Если человек охотится на оленя, он должен заручиться поддержкой своего партнера, чтобы добиться успеха. Человек может сам добыть зайца, но заяц стоит меньше оленя. Это было воспринято как полезная аналогия для социального сотрудничества, такого как международные соглашения об изменении климата. Платежная матрица выглядит следующим образом

BR₁(S) = S, BR₁(H) = H
BR₂(H) = H, BR₂(S) = S
Игра имеет два равновесия чистых стратегий: (S, S) и (H , Х). Однако выигрыш от (S, S) по Парето доминирует над выигрышем от (H, H).

Если игрок ожидает, что другой человек не будет сотрудничать, он выберет охоту на зайца. Но если он считает, что другой человек будет сотрудничать, тогда мы выберем оленя. Когда оба человека выбирают олень, то есть когда оба считают, что другой человек будет сотрудничать, в целом им обоим будет лучше.

Давайте закроем на этом обсуждение равновесия Нэша для дискретных действий. Мы обсудим больше о равновесии Нэша в следующем блоге из моей серии блогов.