Студопедия — Решение игр в смешанных стратегиях аналитическим методом. Игра 2х2
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Решение игр в смешанных стратегиях аналитическим методом. Игра 2х2






Если в платежной матрице игры не обнаруживается седловая точка, то из этого следует что игра имеет решение, но не в чистых, а смешанных стратегиях. При этом оптимальная стратегия S*А=<P*1,P*2>

S*B=<Q*1,Q*2>

P1,P2 – вероятности использования своих первой или второй чистой стратегий

Qi – вероятность применения игроком B своих чистых стратегий B1 или В2

Пусть платежная матрица такой игры задана:

P=

  В1 В2
A1 a11 a12
A2 a21 a22

Где аij – элемент матрицы, определяющий выигрыш (проигрыш) игрока А(В) в случае если игрок А примет свою стратегию iую, в ответ на которую игрок В применяет свою jую чистую стратегию. Эта игра является парной, т.к. учавствуют только 2 игрока А и В.

И в то же время игрой 2х2, т.к. у А всего две стратегии и у В тоже 2е стратегии.

В теории игр принято считать, что стратегия игрока А указывается по строка платежной матрицы, а стратегии игрока В по столбцам.

Решение такой задачи начинается с проверки наличия в платежной матрице седловой точки. Если таковая существует, то решение игры однозначно и выражается в одной из чистых стратегий игроков А и В. В этом случае всегда выигрыш одного игрока равен проигрышу другого игрока цена игры находится на пересечении строки соответствующей нижней цене игры и столбца соответствующего верхней цене игры.

Если в платежной матрице не обнаруживается седловая точка, то оптимальной стратегией игрока А будет стратегия а1 или а2 применяющиеся соответственно с вероятностями P*1 P*2.

Тогда выигрыш игрока А будет определяться V=a11*P1+a21*P2

A1 A2
P*1 P*2

Такая запись соответствует применением игроком B стратегии В1.

Если игрок В примет стратегию В2, то цена выигрыша игрока А будет определяться вторым столбцом матрицы V=a12*P1+a22*P2

Учитывая, что стратегий всего 2е как у А так и у В и что никаких других вариантов не существует следовательно события применения той или другой стратегии составляют полную группу событий.

Для того чтобы получить искомые значения Р*1, P*2

Система уравнений

V=a11*P1+a21*P2 <- B1

V=a12*P1+a22*P2 <-B2

P1+P2=1

 

P2=(a11-a12)/ (a11+a22-a12-a21)

P1=1-P2

 

V=(a22*a11-a12*a21)/ (a11+a22-a12-a21)

Рассуждая аналогично и применяя теорему об активных стратегиях можно точно так же рассчитать оптимальные значения Q*1 и Q*2, но по столбцам

Q*1=(a22-a12)/(a11+a22-a12-a21)

Q2=1-Q1

 

Задача

Поиск

Игрок А имеет возможность спрятаться в одном из убежищ I или II.

Игрок В отыскивает игрока в одном из убежищ I или II

Если игрок В отыскал игрока А, то игрок А выплачивает игроку В штраф в одну денежную единицу. Если же игрок В не отыскал игрока А, то игрок В выплачивает одну денежную единицу.

Требуется получить решение игры.

Решение:

  1. Сформулируем стратегии игроков.

Стратегия а1 – игрок А спрятался в убежище 1

Стратегия а2 – игрок А спрятался в убежище 2

Стратегия b1 –игрок В ищет в убежище 1

Стратегия b2 – игрок В ищет в убежище 2

Тогда если игрок А принял стратегия А1 и игрок В принял стратегию В1, то игрок В обнаруживает игрока А в убежище 1 и игрок А должен выплатить игроку В штраф в 1 денежную едиицу. Значит элемент платежной матрица а11 равен -1.

Если А ->a2 and B->b2 значит а22=-1

Если A->a1 and B->b2 значит a12=1

P=

 

-1  
  -1

Седловой точки не имеет альфа=-1, бетта=1

 

Таким образом оптимальная стратегия игрока А выбирать убежище 1 или 2 с вероятностью 0,5, а оптимальная стратегия В искать или в первом или во втором 0,5

Р1=(a22-a21)/(a11+a22-a12-a21)

P2=1-P1=0.5

 







Дата добавления: 2015-08-17; просмотров: 1232. Нарушение авторских прав; Мы поможем в написании вашей работы!



Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

ПУНКЦИЯ И КАТЕТЕРИЗАЦИЯ ПОДКЛЮЧИЧНОЙ ВЕНЫ   Пункцию и катетеризацию подключичной вены обычно производит хирург или анестезиолог, иногда — специально обученный терапевт...

Ситуация 26. ПРОВЕРЕНО МИНЗДРАВОМ   Станислав Свердлов закончил российско-американский факультет менеджмента Томского государственного университета...

Различия в философии античности, средневековья и Возрождения ♦Венцом античной философии было: Единое Благо, Мировой Ум, Мировая Душа, Космос...

Седалищно-прямокишечная ямка Седалищно-прямокишечная (анальная) ямка, fossa ischiorectalis (ischioanalis) – это парное углубление в области промежности, находящееся по бокам от конечного отдела прямой кишки и седалищных бугров, заполненное жировой клетчаткой, сосудами, нервами и...

Основные структурные физиотерапевтические подразделения Физиотерапевтическое подразделение является одним из структурных подразделений лечебно-профилактического учреждения, которое предназначено для оказания физиотерапевтической помощи...

Почему важны муниципальные выборы? Туристическая фирма оставляет за собой право, в случае причин непреодолимого характера, вносить некоторые изменения в программу тура без уменьшения общего объема и качества услуг, в том числе предоставлять замену отеля на равнозначный...

Studopedia.info - Студопедия - 2014-2024 год . (0.012 сек.) русская версия | украинская версия