Студопедия — Пример 5.3.3-1.
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Пример 5.3.3-1.






Два игрока А и В играют в игру, основанную на подбрасывании монеты. Игроки одновременно и независимо друг от друга выбирают герб (Г) или решку (Р) Если результаты двух подбрасываний монеты совпадают (т.е. ГГ или РР), то игрок А получает один доллар от игрока В. Иначе игрок А платит один доллар игроку B.

Следующая матрица платежей игроку А показывает величины минимальных элементов строк и максимальных элементов столбцов, соответствующих стратегиям обоих игроков.

  ВГ ВР Минимумы строк
  -1 -1
-1   -1
Максимумы столбцов      

Максиминная и минимаксная величины (цены) для этой игры равны -1 доллар и 1 доллар соответственно. Так как эти величины не равны между собой, игра не имеет решения в чистых стратегиях. В частности, если игрок А использует стратегию АГ, игрок В выберет стратегию ВР, чтобы получить от игрока А один доллар. Если это случится, игрок А может перейти к стратегии АР, чтобы изменить исход игры и получить один доллар от игрока В. Постоянное искушение каждого игрока перейти к другой стратегии указывает на то, что решение в виде чистой стратегии неприемлемо. Вместо этого оба игрока должны использовать надлежащую случайную комбинацию своих стратегий. В рассматриваемом примере оптимальное значение цены игры находится где-то между максиминной и минимаксной ценами для этой игры:

максиминняя (нижняя) цена < цена игры < минимаксная (верхняя).

Следовательно, в данном случае цена игры должна лежать в интервале [-1,1], измеряемом в долларах.

[ Таха 11к]

Обозначим p1 вероятность выбора игроком А стратегии АГ. Соответственно, вероятность выбора игроком А стратегии АР будет (1- p1). Тогдасредний платеж игроку А при первой стратегии игрока В равен

,

а при второй стратегии игрока В соответственно

.

поэтому при выборе оптимальной смешанной стратегии

Отсюда .

Подставляя числовые значения, получаем

,

т.е. в оптимальной смешанной стратегии игроку А следует использовать обе стратегии с одинаковой вероятностью. Цена игры в этом простейшем случае будет равна

.

В общем случае следует ожидать, что в игре двух уча­стников с нулевой суммой оба игрока применяют свои оптимальные смешанные стратегии. В частном случае вполне определенной игры оптимальной смешанной стра­тегией будет такая стратегия, в которой чистой стратегии, соответствующей седловой точке, приписана вероятность, равная единице, т. е. векторы оптимальных стратегий единичные. Вообще число ненулевых элементов в векторе оптимальной смешанной стратегии не должно превышать минимальное количество чистых стратегий, имеющихся в распоряжении каждого игрока.

Применяя смешанные стратегии, партнеры ни в одной из партий игры не открывают друг другу своих истинных стратегий. Данная стратегия выбирается с помощью како­го-нибудь механизма случайного выбора (бросание монеты или игральной кости, таблица случайных чисел и т. д.), причем используемые стратегии находятся в соответствии с оптимальными вероятностями. Если бы противнику бы­ло известно, какая именно стратегия будет применена в данной партии, то он мог бы использовать это знание с выгодой для себя. Однако он не может извлечь никакой полезной информации из знания оптимальных вероят­ностей партнера.







Дата добавления: 2015-08-17; просмотров: 524. Нарушение авторских прав; Мы поможем в написании вашей работы!



Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Характерные черты официально-делового стиля Наиболее характерными чертами официально-делового стиля являются: • лаконичность...

Этапы и алгоритм решения педагогической задачи Технология решения педагогической задачи, так же как и любая другая педагогическая технология должна соответствовать критериям концептуальности, системности, эффективности и воспроизводимости...

Понятие и структура педагогической техники Педагогическая техника представляет собой важнейший инструмент педагогической технологии, поскольку обеспечивает учителю и воспитателю возможность добиться гармонии между содержанием профессиональной деятельности и ее внешним проявлением...

ЛЕЧЕБНО-ПРОФИЛАКТИЧЕСКОЙ ПОМОЩИ НАСЕЛЕНИЮ В УСЛОВИЯХ ОМС 001. Основными путями развития поликлинической помощи взрослому населению в новых экономических условиях являются все...

МЕТОДИКА ИЗУЧЕНИЯ МОРФЕМНОГО СОСТАВА СЛОВА В НАЧАЛЬНЫХ КЛАССАХ В практике речевого общения широко известен следующий факт: как взрослые...

СИНТАКСИЧЕСКАЯ РАБОТА В СИСТЕМЕ РАЗВИТИЯ РЕЧИ УЧАЩИХСЯ В языке различаются уровни — уровень слова (лексический), уровень словосочетания и предложения (синтаксический) и уровень Словосочетание в этом смысле может рассматриваться как переходное звено от лексического уровня к синтаксическому...

Studopedia.info - Студопедия - 2014-2024 год . (0.008 сек.) русская версия | украинская версия