Федеральное агентство по образованию Санкт-Петербургский государственный архитектурно-строительный университет
К. В. ГР...
4 downloads
219 Views
903KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Федеральное агентство по образованию Санкт-Петербургский государственный архитектурно-строительный университет
К. В. ГРИГОРЬЕВА
БЕСКОАЛИЦИОННЫЕ ИГРЫ В НОРМАЛЬНОЙ ФОРМЕ Часть 1 Учебное пособие
Санкт-Петербург 2007 1
УДК 51 Рецензенты: канд. физ.-мат. наук Парилина Е. М. (каф. математической теории игр и статистических решений ф-та прикладной математики – процессов управления Санкт-Петербургского государственного университета); канд. физ.-мат. наук, доц. Куликов К. Г. (каф. высшей математики, Санкт-Петербургский государственный технический университет)
Григорьева К. В. Бескоалиционные игры в нормальной форме. Часть 1: учебное пособие / СПб. гос. архит.-строит. ун-т. – СПб., 2007. – 78 с. Рассматриваются два вида конечных бескоалиционных игр двух лиц: матричные (антагонистические) и биматричные. Много внимания уделено понятию ситуации равновесия как решению бескоалиционных игр. В качестве методов решений предлагаются, в частности, равновесие по Нэшу, оптимальность по Парето, решение игр с помощью линейного программирования, графоаналитический и итеративные методы решения матричных игр. Данное пособие подготовлено на основе прочитанных лекций по курсу «Теория игр и исследование операций» в 2006/2007 гг. студентам специальности «Прикладная математика», предназначено для студентов и аспирантов этой специальности, может быть полезным для всех, кто интересуется теорией игр. Табл. 1. Ил. 1. Библиогр.: 2 назв. Рекомендовано Редакционно-издательским советом СПбГАСУ в качестве учебного пособия
© К. В. Григорьева, 2007 © Санкт-Петербургский государственный архитектурно-строительный университет, 2007
2
ЗАНЯТИЕ № 1 1.1. Содержание теории игр Теория игр (GT – Game Theory) – это раздел теории управления, в котором исследуются задачи о существовании и нахождении оптимального управления в условиях конфликта (в условиях столкновения сторон, каждая из которых стремится воздействовать на развитие конфликта в своих интересах). Существует множество определений того, что есть GT и каковы ее задачи. «Теория игр – это теория рационального поведения людей с несовпадающими интересами» [8]. «Теория игр – наука о стратегическом мышлении» [9]. «Теория игр – это теория математических моделей принятия решений в условиях неопределенности, когда принимающий решение “игрок” располагает информацией лишь о множестве возможных ситуаций, в одной из которых он в действительности находится, о множестве решений (“стратегий”), которые он может принять, и о количественной мере “выигрыша”, который он мог бы получить, выбрав в данной ситуации данную стратегию» [1]. Неопределенность в GT является следствием сознательной деятельности другого лица (лиц), отстаивающего свои интересы. В связи с этим под «теорией игр понимается теория математических моделей принятия оптимальных решений в условиях конфликтов» [2]. Таким образом, содержание теории игр – это установление принципов оптимального поведения в условиях неопределенности, доказательство существования решений, удовлетворяющих этим принципам, указание алгоритмов нахождения решений. Моделями GT описываются экономические и правовые конфликты, взаимодействие человека с природой, биологическая борьба за существование, военное дело и т. д. [3, 4, 11, 12, 13, 15, 19]. Теоретикоигровой подход к изучению формирования коалиций является своего рода традицией в социальных и политических науках [14, 16, 17, 18, 20, 21]. В книге «Game Theory and the Law» (D. Baird, R. Gertner, С. Picker, 1994) 3
аппарат GT впервые применяется к анализу того, как законы влияют на поведение людей, партий и т. д. Особая роль теории игр выделяется в экономическом моделировании: «Суть теории игр в том, чтобы помочь экономистам понимать и предсказывать то, что будет происходить в экономическом контексте» [10]. «Аппарат теории равновесия и теории игр послужил основой для создания современных теорий международной торговли, налогообложения, общественных благ, монетарной экономики, теории производственных организаций» [7]. 1.2. Классификация игр Все модели в GT принято называть играми. Математическое описание игры сводится к перечислению всех действующих в ней игроков, указанию для каждого игрока всех его стратегий, а также численного выигрыша, который он получит после того, как игроки выберут свои стратегии. В результате игра становится формальным объектом, который поддается математическому анализу. Игры можно классифицировать по различным признакам: · по числу «игроков» (сторон) N ³ 2 ; · по числу ходов в игре: ü многошаговые; ü бесконечные; · математической структуре модели игры: ü рекурсивные; ü дифференциальные; · по числу стратегий игры: ü конечные; ü бесконечные, если хотя бы у одного «игрока» число стратегий бесконечно; · по взаимоотношениям игроков: ü кооперативные (коалиционные), в которых принимающие решение игроки объединены в фиксированные коалиции; члены одной коалиции могут свободно обмениваться информацией и принимать полностью согласованные решения; игроки могут вступать в коалицию и договариваться о совместных действиях; 4
ü бескоалиционные, в которых каждая коалиция или множество игроков, действующих совместно, состоит лишь из одного игрока; теория бескоалиционных игр – это способ моделирования и анализа ситуаций, в которых оптимальные решения каждого игрока зависят от его представлений об игре оппонентов; важнейший момент теории – игроки не должны придерживаться произвольных представлений об игре своих оппонентов: и каждый игрок должен пытаться предсказать игру своих оппонентов, используя свои знания правил игры и исходя из предположений, что его оппоненты сами рациональны, а потому пытаются предсказать игру своих оппонентов и максимизировать свои собственные выигрыши, однако так называемая кооперативная теория бескоалиционных игр допускает временные объединения игроков в коалиции в процессе игры с последующим разделением полученного выигрыша или принятие совместных решений; · по степени информативности «игроков» в игре: ü детерминированные, когда условия, в которых принимаются решения, известны полностью; ü стохастические, когда известно множество возможных вариантов условий и их вероятностное распределение; ü неопределенные, когда известно множество возможных вариантов, но без какой-либо информации об их вероятностях; · по выигрышу игры: ü антагонистические; ü игры с ненулевой суммой; · по характеру получения информации: ü статические игры или игры в нормальной форме (игроки получают всю предназначенную им информацию до начала игры и ходят один раз, одновременно и независимо); ü динамические игры или игры в позиционной форме (информация поступает игрокам в процессе развития игры); · по полноте имеющейся у игроков информации: ü статические игры с полной информацией предполагают, что у игроков имеется вся «необходимая» информация друг о друге, включая выигрыши игроков; ü если игрок знает свою функцию выигрыша, но не знает функций выигрыша остальных игроков, то тогда участники долж5
ны иметь какие-то представления относительно предпочтений других участников, а также должны иметь представления об их представлениях о предпочтениях других и т. д.; здесь мы приходим к понятию Байесовых игр (статические игры с неполной информацией); ü динамические игры с полной информацией и неполной информацией. 1.3. Игра в нормальной форме Определение 1.1. Под игрой в нормальной (или стратегической) форме понимается объект G = { N , X 1 , K, X n , K1 , K, K n },
где N = {1, n } – множество игроков; X i – конечное множество о чистых стратегий xi i -го игрока, i Î N ; xi – чистая стратегия i -го игрока, а, i Î N , xi Î X i ; K i ( x1 , K , xn ) – вещественная функция выигрышей игрокаа
i, определенная на декартовом произведении X = X 1 ´ X 2 ´ K ´ X n .
Набор стратегий x = ( x1, K , xn ), x Î X называется ситуацией игры. Рассмотрим простейшую статическую модель – игру в нормальной форме æ (a11 , b11 ) K ç K K ç ç (a , b ) K è m1 m1
(a1n , b1n ) ö
÷ K ÷, (a mn , b mn )÷ø
в которой имеем: ü участие двух игроков N = {1,2}, ü конечное множество стратегий каждого из игроков: X 1 = {i i = 1, m} – стратегии первого игрока;
{
X2 = j
}
j = 1, n – стратегии второго игрока;
ü ситуация игры – пара стратегий (i, j ); ü K1 (i, j ) = a ij – выигрыш первого игрока и K 2 (i, j ) = bij – выигрыш второго игрока. 6
Такая игра называется биматричной, так как ее можно представить в виде двух матриц æ a11 K a1n ö æ b11 K b1n ö ç ÷ ç ÷ ç K K K ÷ и ç K K K ÷. ça ÷ çb ÷ è m1 K a mn ø è m1 K b mn ø Отметим, что формально постановка игры в нормальной форме имеет следующую интерпретацию: игроки одновременно и независимо друг от друга выбирают свои стратегии xi Î X i ; после этого возникает
ситуация ( x1 , K , xn ) ; на этом игра прекращается, и i -й игрок получает
свой выигрыш K i ( x1 , K , xn ) , где i Î N . Возникает следующая проблема: каждый игрок стремится максимизировать свой выигрыш. Такая постановка математически некорректна, так как игрок знает только свою стратегию xi и не знает других параметров. В связи с этим существуют различные подходы к понятию оптимального поведения. В 1950 г. Джон Нэш (лауреат Нобелевской премии по экономике 1994 г.) ввел понятие ситуации равновесия как метода решений бескоалиционных игр. Определение 1.2. Ситуация, образующаяся в результате выбора всеми игроками некоторых своих стратегий, называется равновесной, если ни одному из игроков невыгодно изменять свою стратегию при условии, что остальные игроки придерживаются равновесных стратегий. Именно равновесие по Нэшу и его модификации признаются наиболее подходящими концепциями решения таких игр. 1.4. Равновесие по Нэшу Введем обозначения. Пусть ситуация игры
x = ( x1 , K ,
ует xi -1 , xi , xi +1 , K , xn ) . Вместо стратегии xi игрок i использует
стратегию xi : ( x || xi ) = ( x1 , K , xi -1 , xi , xi +1 , K , xn ) . Определение 1.3. Будем говорить, что ситуация x (это набор стратегий) является равновесной по Нэшу (NE – Nash Equilibrium), если имеет место K i ( x ) ³ K i ( x || xi ) " i Î N , xi Î X i . 7
Если игроки договорились о выборе стратегии и возможна ситуация x , входящая в равновесие по Нэшу, то получается устойчивый договор, и в дальнейшем ни один из игроков в индивидуальном порядке не заинтересован в отклонении от равновесия по Нэшу, так как выигрыш может только уменьшиться. В то же время равновесие по Нэшу не является устойчивым против отклонения группы игроков. Если сразу отойдет некоторая коалиция игроков, то они могут выиграть. Пример 1.1. Семейный спор. N = { муж (М ), жена (Ж )} . Каждый имеет две альтернативы: пойти в театр (Т) или на футбол (Ф),
{
}
т. е. X М = X Ж = x Т , x Ф . Если они вместе пойдут на футбол, то Он получит больше удовольствия, чем Она; если они вместе пойдут в театр, то – наоборот. Наконец, если они окажутся в разных местах, то они не получат никакого удовольствия. Рассматриваемая ситуация моделируется следующей игрой:
( (
) (
)) (K1(xМТ , xЖФ ), K 2 (xМТ , xЖФ ))ö÷
( (
) (
)) ( (
Ф Ф Ф Ф æ K1 xМ , xЖ , K 2 xМ , xЖ ç ç ç Ф Т Ф Т è K1 xМ , xЖ , K 2 xМ , xЖ
Т K1 xМ ,
Т xЖ
) (
Т , K 2 xМ ,
Т xЖ
÷= ÷ ø
))
Ж Ф Ф æ (4,1) =М ç Т çè (0,0)
Т (0,0)ö ÷. (1,4) ÷ø
(
K1 (ФФ ) = 4; у жены – K 2 (ФФ ) = 1 . Какие у игроков альтернативы? У мужа – K1 (ТФ ) = 0 ; у жены – K 2 (ФТ ) = 0 . Так как K1 (ФФ ) > K1 (ТФ )
и K 2 (ФФ ) > K 2 (ФТ ) , то (Ф,Ф) – NE. Аналогично можно рассмотреть остальные комбинации, откуда получится, что здесь есть два равновесия по Нэшу в чистых стратегиях – (Ф,Ф) и (Т,Т). Пример 1.2. Дилемма заключенного. Двое подозреваемых в совершении тяжкого преступления арестованы и помещены в одиночные камеры, причем они не имеют возможности передавать друг другу какиелибо сообщения. Их допрашивают поодиночке. Если оба признаются в совершении преступления, то с учетом их признания им грозит тюремное заключение сроком по 8 лет каждому. Если оба будут молчать, то они будут наказаны за совершение какого-то незначительного преступления (скажем, незаконное хранение оружия или что-нибудь другое) и получат в этом случае по одному году тюремного заключения. Если же один из них сознается (С), а другой – нет (Н), то первый за содействие следствию будет вовсе освобожден от наказания, тогда как второй будет приговорен к максимально возможному за данное преступление наказанию – 10-летнему тюремному заключению. Описанная история может быть представлена следующей игрой: II С С æ (- 8,-8) I ç Н çè (- 10,0 )
Рассмотрим ситуацию (Ф,Ф). Запишем математически: x1 – единственная альтернатива x1 , аналогично, x 2 – единственная альтернатива x 2 :
)
Ф Ф – NE. В ситуации (Ф,Ф) у мужа – Следовательно, x = xМ , xЖ
Н (0,-10)ö ÷. (- 1,-1)÷ø
Рассмотрим каждую ситуацию в отдельности: x = ( x1 , x 2 ),
Ф x1 = x М ,
( x || x1 ) = (x МТ , ( x || x 2 ) = (x МФ ,
K1 ( x ) = 4;
Ф x2 = xЖ ;
) Т ); xЖ
Ф xЖ ;
K 2 ( x ) = 1;
K1 ( x || x1 ) = 0 ; 4 > 0; K 2 ( x || x2 ) = 0 ; 1 > 0. 8
(СС):
K1 (СС ) = -8; K1 (НС ) = -10 ; - 8 > -10;
(СН):
K 2 (СС ) = -8 ; K 2 (СН ) = -10 ; NE; - 8 > -10;
K1 (СН ) = 0; K1 (НН ) = -1; 0 > -1;
K 2 (СН ) = -10 ; K 2 (СС ) = -8 ; не NE; - 10 >/ -9;
9
(НС):
K1 (НС ) = -10; K1 (СС ) = -8 ;
K 2 (НС ) = 0 ; K 2 (НН ) = -1; не NE; 0 > -1;
- 10 >/ -8; K1 (НН ) = -1; K1 (СН ) = 0 ;
(НН):
K 2 (НН ) = -1; K 2 (НС ) = 0 ; не NE.
- 1 >/ 0;
- 1 >/ 0;
Следовательно, (СС) – NE.
(СС) : так как $ (НН ) :
(НС) : так как Ø $ x¢ : K 2 ( x¢) > K 2 (НС ) = 0 опт. по Парето; ì K1 ( x¢) > K1 (НН ) опт. по Парето. (НН) : так как Ø $ x¢ : í î K 2 ( x¢) > K 2 (НН )
2) хотя бы для одного i0 Î N K i ( x¢) > K i (x* ) . 0
2.1. Антагонистические игры. Седловая точка
0
Пример 1.3. Семейный спор K1 (ФФ ) = 4 ; K1 (ФТ ) = 0; K1 (ТФ ) = 0; K1 (ТТ ) = 1;
K 2 (ФФ ) = 1; K 2 (ФТ ) = 0; K 2 (ТФ ) = 0; K 2 (ТТ ) = 4; (ФФ) : так как Ø $ x¢ : K1 ( x¢) > K1 (ФФ ) = 4 опт. по Парето; K1 (ФФ ) > K1 (ФТ )
K 2 (ФФ ) > K 2 (ФТ ) K1 (ФФ ) > K1 (ТФ )
K 2 (ФФ ) > K 2 (ТФ )
не опт. по Парето;
не опт. по Парето;
Пример 1.4. Дилемма заключенного K1 (СН ) = 0;
K1 (НС ) = -10; K1 (НН ) = -1;
K 2 (СС ) = -8 ; K 2 (СН ) = -10; K 2 (НС ) = 0; 10
Определение 2.1. Игра в нормальной форме называется игрой с нулевой суммой, если для любого набора стратегий x = ( x1 ,K, xn ) выполняется условие n
å K ( x , K, x ) = 0 . i =1
(ТТ) : так как Ø $ x¢ : K 2 ( x¢) > K 2 (ТТ ) = 4 опт. по Парето.
K1 (СС ) = -8 ;
Исследовать все ситуации на равновесие по Нэшу и оптимальность по Парето. ЗАНЯТИЕ № 2
" iÎN;
(ТФ) : так как $ (ФФ ) :
не опт. по Парето;
Самостоятельная работа № 1
Определение 1.4. Ситуация x* = (x1* ,K, xn* ) называется оптимальной по Парето, если не существует никакой другой ситуации x¢ = ( x1¢,K, xn¢ ), такой что:
(ФТ) : так как $ (ФФ ) :
K 2 (НН ) > K 2 (СС )
(СН) : так как Ø $ x¢ : K1 ( x¢) > K1 (СН ) = 0 опт. по Парето;
1.5. Оптимальность по Парето
1) K i ( x¢) ³ K i (x* )
K1 (НН ) > K1 (СС )
K 2 (НН ) = -1;
i
1
n
Эта игра представляет собой замкнутую систему: все то, что ктонибудь выиграл, должно быть кем-то проиграно. Большинство салонных игр являются играми такого типа. Будем далее считать, что N = {1,2}. Определение 2.2. Игра двух лиц с нулевой суммой называется антагонистической. В такой игре интересы игроков диаметрально противоположны, поскольку выигрыш одного игрока равен проигрышу другого: K1 (i, j ) + K 2 (i, j ) = 0 или K1 (i, j ) = - K 2 (i, j ) " i Î X 1 , j Î X 2 . 11
Пример 2.1. Орел и решка. В этой игре каждый из двух игроков выбирает независимо друг от друга монетку, повернутую вверх либо «орлом», либо «решкой». Если выбор игроков различен, то игрок 2 платит игроку 1 один доллар. Если выбор совпадает, то – наоборот. Матрица выигрышей такой игры: о
о р
р
æ (- 1, 1) (1, - 1) ö ÷÷ . çç è (1, - 1) (- 1, 1)ø
Определение 2.3. Конечная антагонистическая игра G A называется матричной (МИ), поскольку выигрыши игроков полностью задаются матрицей A выигрышей первого игрока. Рассмотрим вопрос об оптимальном поведении игроков в антагонистической игре G A . Напомним, что естественно в этой игре считать оптимальной такую ситуацию ( x1 , x 2 ) Î X 1 ´ X 2 , отт которой ни одному
из игроков невыгодно отклоняться. Такая ситуация ( x1 , x 2 ) называется равновесной, а принцип оптимальности, основанный на построении равновесной ситуации, – принципом равновесия. Ниже будет показано, что для антагонистических игр принцип равновесия эквивалентен принципам минимакса и максмина. Разумеется, для этого необходимо существование равновесия, т. е. чтобы принцип оптимальности был реализуем. Перепишем определение равновесия по Нэшу для антагонистической игры: K1 ( x1 , x2 ) = a i , j ; K 2 ( x1 , x2 ) = bi , j = -a i , j ; K1 ( x1 , x2 ) = a i , j ; K 2 ( x1 , x2 ) = bi , j = -a i , j . Откуда следует, что K1 ( x1 , x2 ) = a i , j ³ K1 ( x1 , x2 ) = a i , j
" i Î X 1;
K 2 ( x1 , x2 ) = -a i , j ³ K 2 ( x1 , x2 ) = -a i , j ai, j £ ai , j £ ai , j
" j Î X 2;
" i, j Î X .
В седловой точке элемент матрицы a i , j является одновременно минимумом в своей строке и максимумом в своем столбце. Пример 2.2. В игре с матрицей 6
(3)
0 æ1 ç (3)ç 5 0 çè 6
0
(3) 0
8 4ö ÷ 8÷ 1 ÷ø
ситуация (2, 2) является равновесной. Определение 2.5. Стратегия i или j , входящая в ситуацию равновесия, называется оптимальной стратегией 1-го или 2-го игрока. Определение 2.6. Значение функции выигрыша в ситуации равновесия a i , j = v называется значением игры. 2.2. Принцип максмина и минимакса Установим связь между принципом равновесия и принципами минимакса и максмина в антагонистической игре. Пусть дана МИ с матрицей æ a11 K a1n ö ÷ ç A=ç K K K ÷ , ÷ ça è m1 K a mn ø которая полностью определяет выигрыши игроков. Первый выбирает строку i, второй – столбец j . Выигрыш первогоо игрока стоит на пересечении i-й строки и j -го столбца. Эта же величина есть проигрыш или выигрыш с обратным знаком второго игрока. Итак, первый игрок произвольно выбрал стратегию i. В каком выигрыше он может быть уверен? В минимальном, естественно, т. е. минимальное значение выигрыша min a ij при выбранной стратегии i j
Определение 2.4. В антагонистической игре G A ситуация (i , j ) называется ситуацией равновесия или седловой точкой, если ai, j £ ai , j £ ai , j " i, j Î X .
ему обеспечено. Естественно выбрать такую стратегию i, при которой этот минимум максимален, т. е. естественно выбрать i0 , при которой достигается
12
13
é ù max êmin a ij ú = min a i0 j = v , j i ë j û
min max a ij = v 64444j 44i74444448 max a i1 max a i 2 K max a in i
где v – нижнее значение игры (нижняя цена игры). Определение 2.7. Стратегия i0 называется максминной стратегией первого игрока. Пусть теперь второй игрок выбрал j -й столбец и уверен, что он проиграет не больше, чем max a ij . Естественно выбрать такую стратегию i
j , при которой этот максимальный проигрыш минимален, т. е. выбрать
такой столбец j 0 , который минимизирует его проигрыш: v = min émax a ij ù = max a ij0 , úû j ê ë i i
где v – верхнее значение игры (верхняя цена игры). Определение 2.8. Стратегия j 0 называется минимаксной стратегией второго игрока. Таким образом, минимакс и максмин для игры G A могут быть найдены по схеме, представленной на рис. 2.1. Пример 2.3. Так, в игре с матрицей из примера 2.2 нижнее значение (максмин) v и максминная стратегия i0 первого игрокаа v = 3 , i0 = 2 , а верхнее значение (минимакс) v и минимаксная стратегия j0 второго о игрока – v = 3 , j 0 = 2 . А в игре с матрицей 7/ - 1/ - 1/ (0)
(4)
6/
5/
æ 0 -1 5 5 ö ç ÷ ç 7 0 - 1 - 1÷ ç2 4 6 0 ÷ è ø
максминная стратегия первого игрока – i0 = 3 , нижнее значение игры –
é a 11 êa ê 21 êK ê ëa m1
i
i
a 12 a 22 K
K K K
a m2
K
a1 j ü a 1n ù min j ï a2 j ï a 2 n ú min ú j max min a ij = v j K ýï i K ú ú a mj ï a mn û min j þ
Рис. 2.1. Схема нахождения максмина и минимакса для игры GA
Лемма 2.1. В антагонистической игре G A v ³ v . Теорема 2.1. Для того чтобы в (m ´ n ) -МИ G A существовала ла ситуация равновесия, необходимо и достаточно, чтобы v = v , при этом м максминная и минимаксная стратегия (i0 , j0 ) образует ситуацию равновесия. Определение 2.9. Игры, в которых существуют ситуации равновесия, называются вполне определенными. Поэтому данная теорема устанавливает критерий вполне определенной игры и может быть переформулирована следующим образом. Теорема 2.2. Для того чтобы игра была вполне определена, необходимо и достаточно, чтобы существовали минимакс и максмин и выполнялось равенство v = v . Замечание 2.1. Заметим, что в (m ´ n ) -МИ G A экстремумы, т. е. минимакс и максмин достигаются всегда, а вот ситуация, в которой максимальный элемент по столбцу и минимальный элемент по строке равны, очень редка. См. пример 2.3, где есть максминная и минимаксная стратегии, а ситуации равновесия нет и, соответственно, значения игры тоже нет. Пример 2.4. Так, в игре с матрицей
(2)
4
7
v = 0 ; минимаксная стратегия второго игрока – j0 = 2 , верхнее значение игры v = 4 .
1 æ1 4 1ö ç ÷ (2) ç (2) 3 4 ÷ - 2 çè 0 - 2 7 ÷ø
14
15
ситуация
(2, 1)
является равновесной. При этом max min a ij = i
= min max a ij = 2. j
j
i
С другой стороны, игра с матрицей
1 0
min max a ij = 1 > max min a ij = 0. i
i
X 2* = { j j Î X 2 , $ i Î X 1 , (i , j ) Î Z (G A )}. Тогда множество Z (GA ) можно представить в виде Z (G A ) = X 1* ´ X 2*.
не имеет ситуации
0 1 равновесия в чистых стратегиях (седловых точек), так как j
X 1* = {i i Î X 1 , $ j Î X 2 , (i , j ) Î Z (G A )},
j
Множество ситуации равновесия в антагонистической игре G A обладает свойствами, которые позволяют говорить об оптимальности ситуации равновесия и входящих в нее стратегий. Обозначим множество всех ситуаций равновесия через Z (G A ) Ì X 1 ´ X 2 . Теорема 2.3. Пусть (i1 , j1 ) , (i2 , j2 ) – две произвольные ситуации
тся Определение 2.10. Множества X 1* и X 2* в игре Z (GA ) называются множествами оптимальных стратегий, а их элементы – оптимальными стратегиями первого и второго игрока соответственно. Самостоятельная работа № 2 Найти все максминные и минимаксные стратегии игроков, нижнее и верхнее значения игры; указать все ситуации равновесия и значение игры, если они есть.
равновесия в антагонистической игре G A . Тогда 1) a i1 , j1 = a i2 , j 2 ; a i1 , j 2 = a i2 , j1 ;
2) (i1 , j2 ) Î Z (G A ); (i2 , j1 ) Î Z (G A ). Из теоремы следует, что любая пара оптимальных стратегий образует ситуацию равновесия, а функция выигрыша в ней принимает одно и то же значение, равное значению игры. Пример 2.5. В игре с матрицей j1 j2 6 0 æ1 ç i1 (3) ç 5 i2 (3) çè 6
(3)
8
0 4 (3) 8 (3) 4
(3)
1ö ÷ (3)÷ (3)÷ø
ситуации (i1 , j1 ) = (2, 2 ); (i2 , j1 ) = (3, 2 ); (i2 , j2 ) = (3, 4 ); (i1 , j2 ) = (2, 4 ) являются равновесными. При этом v = K (i1 , j1 ) = K (i2 , j1 ) = K (i2 , j2 ) = K (i1, j2 ) = 3 . Из второй части теоремы следует: Утверждение 2.1. Пусть X 1* и X 2* – проекции множестваа Z (GA ) на X 1 и X 2 соответственно, т. е. 16
ЗАНЯТИЕ № 3 3.1. Смешанные стратегии матричных игр (МИ) В МИ с полной информацией игроки не делают тайны из своих равновесных стратегий, которые гарантируют всем игрокам одновременно оптимальный максминный «выигрыш» независимо от поведения противника. Однако в отсутствие седловой точки игроки не довольствуются своим максминным «выигрышем»: кто из нас ограничится малым, если есть надежда на большее? Рассмотрим МИ 1 2 é1 0 ù , v = 0, v = 1. 1 2 êë0 1úû
Будем рассуждать так. Если играть 5 млн раз, то возможный выигрыш первого игрока при выборе 1-й стратегии будет 1/2. Аналогично может действовать второй игрок, выбирая какой-либо столбец. Первый игрок гарантирует, что он выиграет 1/2, а второй гарантирует, что он проиграет не более 1/2, т. е. игроки выбирают своими стратегиями (1 2 ,1 2) . 17
Таким образом, каждый игрок, манипулируя непредсказуемо для противника (например, по правилам, известным только ему, или случайно) чистыми стратегиями, убеждается, что при многократном повторении игры может улучшить свой максминный «выигрыш».
{
}
Рассмотрим МИ с матрицей Am´ n , где i i = 1, m – стратегии
{
}
первого игрока; j j = 1, n – стратегии второго игрока. Ситуация игры – пара стратегий (i, j ). Определение 3.1. Стратегию, полученную в многократно повторяемой игре при случайном механизме реализации чистых стратегий игрока, называют рандомизированной (смешанной) стратегией игрока. Определение 3.2. Под смешанной стратегией первого игрока будем понимать m-мерный смешанный вектор x = (x1 ,..., xi ,..., x m ) Î R m , m
å xi = 1, i =1
xi ³ 0, i = 1, m ,
где m – число строк матрицы выигрышей Am´ n . Таких векторов x бесконечно много. Множество всех стратегий первого игрока x обозначим å I 0 . Определение 3.3. Аналогично смешанная стратегия второго игрока определяется как n-мерный вектор y = (h1 ,..., h j ,..., hn ), т. е. n
å h j = 1, j =1
h j ³ 0, j = 1, n ,
где n – число столбцов матрицы выигрышей Am´ n . При этом xi ³ 0 и h j ³ 0 – соответственно вероятности выбора
Определение 3.5. Случайная величина, значениями которой
являются стратегии игрока, называется его смешанной стратегией. Учитывая введенное определение смешанных стратегий, прежние стратегии будем называть «чистыми». Так как случайная величина характеризуется своим распределением, то будем отождествлять в дальнейшем смешанную стратегию с вероятностным распределением на множестве чистых стратегий. Таким образом, вектор x может быть интерпретирован следующим образом. Это набор вероятностей, с которыми первый игрок выбирает соответствующие строки матрицы. x1 – вероятность выбора первой стратегии, xi – вероятность выбора i -й стратегии, x m – m -й страте ратегии, сумма этих вероятностей равна 1. Аналогично, y – это набор вероятностей, в соответствии с которыми второй игрок выбирает столбцы матрицы: первый – выбор первого столбца, j – j -го столбца, n – n -го столбца, сумма их равна 1. Определение 3.6. Чистая стратегия является частным случаем смешанной стратегии. Она заключается в выборе i -й строки и имеет
вид xi = (0,...,1i ,...,0 ) , т. е. i -я строка выбирается с вероятностью 1. 14243 m
Соответственно,
(
)
чистая
стратегия
для
второго
игрока
y j = 0,...,0,1 j ,0,...,0 . Таким образом, чистые стратегии – выбор номеров 1442443 n
строк или столбцов. У первого игрока – m чистых стратегий, у второго – n чистых стратегий. Определение 3.7. Если игроки выбрали свои смешанные стратегии, то пара ( x, y ) смешанных стратегий игроков в матричной игре G A называется ситуацией в смешанных стратегиях. В ситуации ( x, y ) в смешанных стратегиях пара чистых стратегий
(i, j ) реализуется с вероятностью
xi h j . Если такая пара появляется, то о
чистых стратегий i Î X 1 и j Î X 2 при использовании игроками смешанных стратегий х и у. Множество всех стратегий второго игрока y обозначим å II . Определение 3.4. Напомним, что вещественная функция, значения которой имеют определенную вероятность, называется случайной величиной.
выигрыша aij является xi h j , следовательно, выигрыш aij является ся случайной величиной. Поэтому выигрыш первого игрока в ситуации (x, y ) в смешанных стратегиях для (m ´ n ) -МИ G A можно определить
18
19
выигрыш первого игрока есть aij , отсюда следует, что вероятность
как математическое ожидание его выигрыша, т. е. сумма этих всевозможных вероятностей a ij xi h j : m
n
E ( x, y ) = åå a ij xi h j = xA, y = x, Ay , i =1 j =1
где o, o – скалярное произведение. При этом функция E ( x, y ) является непрерывной по x Î å I и y Î å II . Если играть 10 млн раз при выборе первым игроком i -й стратегии, а вторым – j-й, то средний выигрыш за эти 10 млн раз повторений игры будет для первого игрока E ( x, y ) × 10 млн, выигрыш второго игрокаа составит - E ( x, y ) × 10 млн. Определим смешанное расширение МИ.
n
E ( xi , y ) = E (i, y ) = å a ij h j = a i y;
i = 1, m ;
j =1 m
E ( x, yi ) = E ( x, j ) = å a ij xi = xa j ,
j = 1, n ,
i =1
где a i , a j – i-я строка и j-й столбец соответственно (m ´ n ) -матрицы А. m
Определение 3.8. Антагонистическая игра G A называется смешанным расширением игры G A , если задается следующим образом: G = {å I ; å II ; E ( x, y )}. о Игроки 1 и 2 выбирают стратегии x Î å I , y Î å II , для первого
игрока реализуется выигрыш E ( x, y ), для второго – –E(x, y). Игра G A является подыгрой для G A , т. е. GA Ì G A . 3.2. Ситуация равновесия в смешанных стратегиях
Определение 3.9. Ситуация ( x, y ) в игре G A образует ситуацию равновесия, а число v = E ( x , y ) является значением игры G A , если E ( x, y ) £ E ( x , y ) £ E ( x , y ) " x Î å I , y Î å II .
Определение 3.10. Соответственно, смешанные стратегии, образующие ситуацию равновесия, называются оптимальными смешанными стратегиями. Заметим, что выигрыши E (i, y ) , E ( x, j ) при применении первым или вторым игроком чистой стратегии i или j соответственно, а другим – смешанной стратегии (у или х) имеют вид
(3.1)
n
Пусть E ( x, y ) = å å a ij xi h j . Тогда если вместо x использовать ть i =1 j =1
чистую стратегию, то m æ n ö m E ( x, y ) = å xi ç å a ij h j ÷ = å xi E (i, y ) . ç ÷ i =1 i =1 è j =1 ø Аналогично, если вместо y использовать чистую стратегию, тоо n æ m ö n E ( x, y ) = å h j ç å a ij xi ÷ = å h j E ( x, j ) . ç j =1 ÷ i =1 è ø j =1
Следовательно, m
n
i =1
j =1
m
n
E ( x, y ) = å xi E (i, y ) = å h j E ( x, j ) = åå a ij xi h j .
В ситуации за 10 млн раз игры, если отклонение от ситуации ( x, y ) будет происходить достаточно часто, то выигрыш для первого игрока может уменьшиться, а для второго потери увеличатся. Теорема 3.1. В любой МИ существует ситуация равновесия в смешанных стратегиях. Эквивалентная формулировка. В любом смешанном расширении МИ существует ситуация равновесия.
а лишь для i Î X 1 и j Î X 2 , поскольку справедливо следующее утверждение.
20
21
i =1 j =1
Пусть ( x, y ) Î å I ´ å II – ситуация в смешанных стратегиях в игре
G A . Оказывается, что для проверки ситуации ( x, y ) на равновесность неравенства (3.1) достаточно проверять не для всех x Î å I и y Î å II ,
Теорема 3.2. Необходимое и достаточное условие существования равновесия. Для того чтобы ситуация ( x, y ) и число v = E ( x , y ) были, соответственно, ситуацией равновесия в смешанных стратегиях и значением игры, необходимо и достаточно, чтобы имели место следующие неравенства: E (i, y ) £ v £ E ( x , j ) " i Î X 1, j Î X 2 .
(3.2)
Лемма 3.1. Если в игре существует ситуация равновесия в чистых стратегиях, то она является ситуацией равновесия в смешанных стратегиях, и значение игры в чистых стратегиях равно значению игры в смешанных стратегиях. Эквивалентная формулировка. Пусть ( x, y ) – ситуация равновесия в игре G A . Тогда ситуация ( x, y ) равновесна и в игре G A . Пример 3.1. «Орел или решка» моделируется игрой o p o æ (1,-1) (- 1,1)ö ÷. ç p çè (- 1,1) (1,-1) ÷ø Легко видеть, что в этой игре нет ситуации равновесия в чистых стратегиях, так как в любой ситуации одному из игроков выгодно отклониться от выбранной стратегии при условии, что другой игрок в этой ситуации придерживается своей стратегии. Однако, как мы увидим, пара смешанных стратегий ( x, y ) , где x = (1 2 ,1 2), y = (1 2 ,1 2) , в которых каждый из игроков играет свои чистые стратегии с равными вероятностями, образует ситуацию равновесия в смешанных стратегиях.
Рассмотрим свойства оптимальных стратегий, которые в ряде случаев помогают находить значение игры и ситуацию равновесия. Теорема 3.3. Пусть x = (x1 ,..., x m ) – оптимальная смешанная стратегия первого игрока, v – значение игры и y – оптимальная смешанная стратегия второго игрока. Тогда, если
22
Согласно теореме 3.2, условие равновесия E (i, y ) £ E ( x, y ) £ E да E ( x, y ) = v . Если для £ E ( x, j ) " i, j . Пусть x и y оптимальны. Тогда какого-либо i неравенство слева выполняется строго, то первый игрок, отклонившись на чистую стратегию i, свой выигрыш уменьшит, следовательно, вероятность выбора первым игроком в ситуации равновесия чистой стратегии i должна быть равной нулю. о Теорема 3.4. Пусть y = (h1,..., hn ) – оптимальная стратегия второго игрока, v – значение игры, x – оптимальная стратегия первого игрока. а. Тогда, если (3.5) E ( x, j ) > v , то вероятность выбора j -й стратегии обязательно должна быть hj = 0.
(3.6)
Теоремы 3.3 и 3.4 обосновывают процедуру выбора стратегии, которая обеспечивает успешный поиск. Теорема 3.5. Пусть x и y – оптимальные стратегии 1-го и 2-гоо игроков, v – значение игры. Тогда min E ( x, j ) = v (3.7) j =1, n
и max E (i, y ) = v .
i =1, m
(3.8)
Теорема 3.6. Пусть G A – (m ´ n ) -МИ. Для того чтобы ситуация
3.3. Свойства оптимальных смешанных стратегий
E (i, y ) < v ,
то вероятность выбора i -й стратегии первым игроком в ситуации равновесия обязательно должна быть (3.4) xi = 0 .
(3.3)
в смешаных стратегиях ( x, y ) была равновесной в игре G A , необходимо и достаточно выполнение равенства max E (i, y ) = min E ( x , j ) . 1£ j £ n
1£ i £ m
(3.9)
Теорема 3.7. Для МИ G A справедливы следующие соотношения: max min E ( x, j ) = v = min max E (i, y ), x
j
y
23
i
(3.10)
причем экстремумы по смешанным стратегиям x и y в (3.10) достигаются на оптимальных стратегиях игроков. Пример 3.2. Возьмем матрицу æ 3 - 2 4ö ç ÷ ç -1 4 2÷. ç2 2 6 ÷ø è Здесь v = 2 – по строкам, v = 3 – по столбцам. Следовательно, в чистых стратегиях ситуации равновесия не существует. Будем искать ситуацию равновесия в смешанных стратегиях. Составим систему из 14 неравенств: ì ï ï E (i, y ) £ v £ E ( x, j ) " i, j; ï n ï íh j ³ 0, å h j = 1; ï j =1 ï m ïx ³ 0, xi = 1. i å ï î i =1 Решение может не получиться, так как могут быть отрицательные числа. Нужно пользоваться многими комбинациями. Если всюду ставить равенства, то задача не решается. Можно поставить строгие неравенства. Не везде. Распишем эти неравенства. 3h1 - 2h2 + 4h3 £ v £ 3x1 - x 2 + 2x3 ; - h1 + 4h2 + 2h3 £ v £ -2x1 + 4x 2 + 2x3 ; 2h1 + 2h2 + 6h3 £ v £ 4x1 + 2x 2 + 6x3 . 3h1 - 2h2 + 4h3 < v;
3x1 - x 2 + 2x3 = v;
- h1 + 4h2 + 2h3 = v;
- 2x1 + 4x 2 + 2x3 = v;
2h1 + 2h2 + 6h3 = v;
4x1 + 2x 2 + 6x3 > v.
Составим квадратную матрицу, учитывая равенства. Следовательно, если E (i, y ) < v , то xi = 0 , если E ( x, j ) > v , то о h j = 0 . Примем x1 = 0; h3 = 0 . Тогда 24
3h1 - 2h2 < v;
(1)
- x 2 + 2x3 = v;
( 4)
- h1 + 4h2 = v; (2)
4x 2 + 2x3 = v;
(5)
2h1 + 2h2 = v;
2x 2 + 6x3 > v.
(6)
(3)
Вычтем (4) из (5). Þ x 2 = 0 , Þ x 3 = 1 Þ
v=2 Þ
h1 = 2 5 Þ
Þ h2 = v 2 - h1 = 3 5 . Следовательно, оптимальная стратегия x = (0, 0, 1) и y = (2 5 , 3 5 , 0).
3.4. Равновесие по Нэшу в смешанных стратегиях в биматричной игре Обобщим понятие ситуации равновесия на игру из N игроков. Введем обозначения, используемые в игре в смешанных стратегиях. ü N = {1, n } – множество игроков; ü
å=
Õ åi
i =1, n
– множество ситуаций в смешанных стратегиях;
ü å i = {si } – множество смешанных стратегий si i-го игрока, а, iÎN ; ü ki – число чистых стратегий i-го игрока;
{ }
ü si = sij
–
j -я смешанная стратегия i-го игрока, а,
i Î N , si Î å i , j = 1, ki ;
ü sij – вероятность выбора i-м игроком j -й чистой стратегии, т. е. элемент вектора si , i Î N , si Î å i , j = 1, ki ;
ü Ei (s ) = Ei (s1 , K , s n ) – функция выигрыша i-го игрока;
ü набор стратегий s = (s1 ,K , s n ), si Î å i " i Î N , называется ситуацией игры. Определение 3.11. Если X i – конечное множество чистых стратегий
игрока i, то смешанная стратегия si : X i ® [0,1] ставит в соответствие
каждой чистой стратегии xij Î X i вероятность sij ³ 0 того, что она будет 25
играться, причем
Введем следующие обозначения для чистых и смешанных страте-
å sij = 1.
гий:
j =1, ki
Определение 3.12. Выигрыш игрока i, соответствующий ситуации , есть s Ei (s ) =
æ
n
ö
å çç Õ s kj ÷÷ Ei (x ).
xÎ X
è k =1
x1
I æ (4, 3) ç II ç (2,1) III çè (3,0)
xn
Определение 3.14. Ситуация (набор смешанных стратегий) II
III
s = (s1 ,..., s n ) является равновесием по Нэшу в игре G = {N, {Σi }, {Ei }}, если для любого i Î N
(5,1) (6,2)ö ÷ (8,4) (3,6)÷ . (9,6) (2,8)÷ø
Ei (s ) ³ Ei (s || si ) "si Î S i .
Пусть s1 = (1 / 3, 1 / 3, 1 / 3) (это означает, что смешанная стратегия игрока 1 предписывает ему играть стратегии I, II и III с вероятностями 1 3 каждую), s 2 = (0, 1/2, 1/2) (эта смешанная стратегия игрока 2 предписывает играть стратегии II и III с равными вероятностями и не играть стратегию I вовсе). В данном случае мы получаем в ситуации s = (s1 , s2 ) : 1æ 1 1 ö E1 (s ) = å s1s 2 E1 ( x ) = ç 0 × 4 + × 5 + × 6 ÷ + 3è 2 2 ø x 1æ 1 1 ö 1æ 1 1 ö 11 + ç 0 × 2 + × 8 + × 3÷ + ç 0 × 3 + × 9 + × 2 ÷ = , 3è 2 2 ø 3è 2 2 ø 2 E2 (s ) = å s1s 2 E2 ( x ) = x
k = 1, ki , i = 1, n ;
(s || xi j ) = (s1,K, si -1, xi j , si +1,K, sn ); (x || si ) = (x1jk , K, xi -jk1, sijk , xi +jk1, K, xnjk ).
i = 1,2 .
Пример 3.4. Рассмотрим игру I
s = (s1, K , si -1, si , si +1 , K , sn );
(s || si ) = (s1,K, si -1, si , si +1,K, sn );
В случае биматричной игры формула (3.11) имеет вид x
)
(x || xi ) = (x1jk ,K, xi j-k1 , xijk , xi j+k1 ,K, xnjk );
(3.11)
ø
å s1s2 Ei (x ) = åKå s1s2 Ei (x ),
(
x = x1jk , K , xi j-k1 , xi jk , xi j+k1 , K , xnjk ;
27 . 6
Определение 3.13. Смешанным расширением G = {N , X , K ( x )} называется игра G = {N , S, E (s )}. 26
игры
Теорема 3.8. Пусть X i+ Ì X i – множество чистых стратегий, которые игрок i играет с положительной вероятностью в ситуации s = (s1 ,..., s n ) . Ситуация s является NE в смешанном расширении G игры G тогда и только тогда, когда для всех i Î N
(
) ( ) " xi j , xij Î X i+ ; Ei (s || xi j ) ³ Ei (s || xij ) " xi j Î X i+ , xij Ï X i+ . Ei s || xi j = Ei s || xij
(3.12)
Таким образом, необходимые и достаточные условия того, что ситуация s – NE, состоят в том, что: 1) каждый игрок при данном распределении стратегий, которые играют его противники, безразличен между чистыми стратегиями, которые он играет с положительной вероятностью; 2) эти чистые стратегии не хуже тех, которые он играет с нулевой вероятностью. Это свойство можно использовать для нахождения NE в смешанных стратегиях. Пример 3.5. Рассмотрим следующую игру: 27
A A æ (100,1000) ç B èç (0,0 )
B (0,0)
ö ÷. ÷ (1000,100)ø Очевидно, что ситуации (А, А) и (В, В) являются NE (в чистых стратегиях). Найдем равновесия по Нэшу в смешанных стратегиях. Предположим, что в таком равновесии игрок 1 играет смешанную стратегию ( p,1 - p ), а второй – (q,1 - q ), причем p, q Î (0,1) . Тогда получаем, что ожидаемый выигрыш игрока 2 от игры при использовании стратегии А есть 1000 p + 0(1 - p ) , а от игры при
использовании стратегии В есть 100 × (1 - p ) + 0 p , а значит
за A, то игрок 2 не изменит исход, как бы он ни голосовал, и игроку 3 безразлично, как он голосует. Таким образом, ( A, A, A) и ( A, B, A) – NE, но ( A, A, B ) – не NE, так как игроку 2 лучше голосовать за B.
ЗАНЯТИЕ № 4 Нахождение значения игры при помощи линейного программирования (ЛП) Напомним, что существует три формы задачи ЛП (ЗЛП)
1000 p + (1 - p ) × 0 = 100 × (1 - p ) + 0 × p.
Отсюда 1100 p = 100 и, следовательно, p = 1 11 . Аналогично q = 1 11 . Пример 3.6. «Семейный спор». Как в предыдущем примере, Она, выбирая Ф, получает 1 × p + 0(1 - p ) , а выбирая Т, получает 0 × p + 2(1 - p ) .
Следовательно, 2(1 - p ) = p . Отсюда 3 p = 2 , а следовательно, p = 2 3 . Аналогично получаем 2q + (1 - q ) × 0 = 0 × q + 1 × (1 - q ) , а значит, 3q = 1
m
åc x i =1
(4.1)
n
i =1
n
å aij xi ³ b j , j = p + 1, s ;
с вероятностью 2 3 , а Она играет Ф с вероятностью 1 3 . Пример 3.7. «Голосование». Рассмотрим следующую ситуацию – три игрока 1, 2, 3 и три альтернативы – A, B, C. Игроки голосуют одновременно за одну из альтернатив, воздержаться невозможно. Таким образом, пространство стратегий X i = {A, B, C}. Альтернатива, получившая большинство, побеждает. Если ни одна из альтернатив не получает большинства, то выбирается альтернатива A. Функции выигрышей таковы:
n
E1 (C ) = E 2 ( A) = E 3 (B ) = 0 .
® max :
å aij xi £ b j , j = 1, p ;
и q = 1 3 . Таким образом, в смешанном равновесии Он играет Ф
E1 (B ) = E2 (C ) = E3 ( A) = 1;
i
· общая задача (ограничения трех типов):
i =1
E1 ( A) = E2 (B ) = E3 (C ) = 2 ;
i
(4.2)
å aij xi = b j , j = s + 1, m ; i =1
xi ³ 0, i = 1, n ; · основная задача (все ограничения – уравнения): n
å aij xi = b j , j = 1, m ; i =1
(4.3)
xi ³ 0, i = 1, n ;
· каноническая задача: n
å aij xi £ b j , j = 1, m ; i =1
В этой игре три равновесных исхода (в чистых стратегиях): A, B и C. Посмотрим на равновесия (их больше 3): если игроки 1 и 3 голосуют
xi ³ 0, i = 1, n .
28
29
(4.4)
Задача нахождения min cx при ограничениях x
xA £ b, x ³ 0 , где А –
(m ´ n ) -матрица,
(4.5)
c, x Î R , b Î R , называется прямой m
n
стандартной ЗЛП, а задача, заключающаяся в определении max by при y
ограничениях Ay ³ c, y ³ 0 ,
(4.6)
где y Î R n называется двойственной ЗЛП. Прямая задача (ПЗ)
Двойственная задача (ДЗ) n
m
å b j y j ® min ;
å ci xi ® max ;
j =1
i =1
n
m
å aij y j ³ ci , i = 1, k ;
å aij xi £ b j , j = 1, s ;
j =1
i =1
m
n
i =1
j =1
å aij xi = b j , j = s + 1, n ; å aij y j = ci , i = k + 1, m ; y j ³ 0, j = 1, s .
xi ³ 0, i = 1, k ;
Вектор x Î R m , удовлетворяющий системе (4.5), называется допустимым решением задачи (4.5). Аналогично вводится понятие
Лемма 4.1 (о масштабе). Пусть GA и G A¢ – две антагонистические игры, причем (4.7) A¢ = aA + B, a > 0, a = const , а B = {bij = b = const " i, j}. Тогда Z (G A¢ ) = Z (G A ) , vG A¢ = avG A + b .
(4.8)
Иными словами, оптимальность поведения игроков не изменится, если в игре множества стратегий остаются прежними, а функция выигрыша умножается на положительную константу или (и) к ней прибавляется постоянное число. Содержательно данная лемма говорит о стратегической эквивалентности двух игр, отличающихся лишь началом отсчета выигрышей, а также масштабом их измерения. Замечание 4.1. Если две МИ GA и G A¢ находятся в условиях этой ой леммы, то смешанные расширения также стратегически эквивалентны. Лемма 4.2. Пусть G A и GA¢ – две матричные (m ´ n )-игры, причем A¢ = aA + B, a > 0, a = const , а B = {bij = b = const " i, j} . Тогда Z (G A¢ ) = Z (G A ) , v A¢ = av A + b , где G A¢ и G A – смешанные расширения игр G A¢ и G A соответственно, a v A¢ , v A – значения игр G A¢ и G A . Пример 4.1. Проверим, что стратегии
y = (1 2 ,1 4 ,1 4),
x = (1 2 ,1 4 ,1 4) оптимальны, а v A = 0 – значение игры G A с матрицей
допустимого решения y Î R задачи (4.6). Допустимое решение x ( y ) называется оптимальным решением задачи (4.5) ((4.6)), если на нем достигается минимум (максимум) функции cx(by ) на множестве всехх допустимых решений. Справедливо следующее утверждение. Теорема 4.1 (двойственности). Если задачи (4.5), (4.6) имеют допустимые решения, то они имеют оптимальные решения x и y соответственно, при этом cx = by . Напомним, что множество всех ситуаций равновесия в МИ мы обозначили как Z (G A ).
Упростим матрицу А (в целях получения максимального числа нулей). Прибавляя ко всем элементам матрицы А единицу, получим матрицу
30
31
n
æ 1 - 1 - 1ö ÷ ç A = ç -1 -1 3 ÷. ç - 1 3 - 1÷ ø è
æ 2 0 0ö ç ÷ A¢ = ç 0 0 4 ÷ . ç0 4 0÷ è ø
Каждый элемент матрицы А¢ разделим на 2. Новая матрица принимает вид æ1 0 0ö ç ÷ A¢¢ = ç 0 0 2 ÷ . ç0 2 0÷ è ø По лемме 4.2 значение игр связано равенством v A¢¢ = 1 / 2v A¢¢ =
= 1 / 2(v A + 1)
.
x*u = y*w = q > 0 .
Пусть теперь G A – произвольная (m ´ n )-МИ. Покажем, что в этом ом случае теорема справедлива. Рассмотрим векторы x = x* q и y = y* q и покажем, что они являются оптимальными стратегиями игроков 1 и 2 соответственно в игре G A , при этом значение игры равно 1 q . Действительно, из (4.11) имеем
( ) ( )
Таким образом, требуется проверить, что значение игры G A¢¢ равно
1 2 . Действительно, E ( x , y ) = x A¢¢, y = 1 2 . С другой стороны, для каждой стратегии y Î å II , y = (h1 , h2 , h3 ) имеем E ( x , y ) = 1 / 2h1 + 1 1 + 1 / 2h 2
+ 1 / 2h3 = 1 / 2 × 1 = 1 / 2 , а для всех x = (x1 , x 2 , x3 ) , x Î X ,
E ( x, y ) = 1 / 2x1 + 1 / 2x 2 + 1 / 2x3 = 1 / 2 . Следовательно, указанные страте-
гии ( x, y ) являются оптимальными, а v A = 0 . Докажем теорему 3.1. Теорема 3.1. Всякая МИ имеет ситуацию равновесия в смешанных стратегиях. Доказательство. ЗЛП в определенном смысле эквивалентна МИ G A . Рассмотрим ПЗ и ДЗ ЛП: xA ³ wT x ³ 0; где
Ay T £ u , y ³ 0,
(4.9)
u = (1, ...,1) Î R , w = (1, ...,1) Î R , а матрица T
m
T
}
n
(4.10)
{
A = a ij > 0
" i = 1, m, j = 1, n , т. е. строго положительная, откуда следует, чтоо существует такой вектор x > 0 , для которого xA ³ wT , т. е. задача (4.9) имеет допустимое решение. С другой стороны, вектор y = 0 является допустимым решением задачи (4.10), поэтому по теореме 4.1 двойственности ЛП обе задачи (4.9) и (4.10) имеют оптимальные решения м x* , y * соответственно, при этом 32
x u = x*u q = y*w q = yw = 1,
а из допустимости x* и y * для задач (4.9), (4.10) следует, чтоо x = x* q ³ 0 и y = y* q ³ 0 , т. е. x и y – смешанные стратегии игроков 1 и 2 в игре G A .
Вычислим выигрыш игрока 1 в ситуации ( x, y ) : E ( x , y ) = x A, y = x* A, y*
q2 .
(4.12)
С другой стороны, из допустимости векторов x * и y * для задач ч (4.9), (4.10) и равенства (4.11) имеем q = wy * £ x * A, y * = x * , Ay * £ x *u = q . Таким образом, x* A, y* = q ; из (4.12) получаем, чтоо
max yw ,
min xu ,
(4.11)
E (x , y ) = 1 q .
(4.13)
Пусть x, y Î å – произвольные смешанные стратегии игроков 1 и 2. Тогда выполняются неравенства E ( x , y ) = x A, y = x* A, y q ³ (wy ) q = 1 q ;
(4.14)
E ( x, y ) = x, Ay = x, Ay * q £ ( xu ) q = 1 q .
(4.15)
Сравнивая (4.14) и (4.15), получаем, что ( x, y ) – ситуация равновесия, а 1 q – значение игры G A со строго положительной матрицей А. 33
Теперь рассмотрим (m ´ n ) -МИ G A¢ с произвольной матрицей A¢ = {a¢ij } . Тогда существует такая константа b > 0 , что матрица A = A¢ + B – строго положительна, где B = {bij } - (m ´ n ) -матрица, bij = b, i = 1, m, j = 1, n . В игре G A существует ситуация равновесия ( x, y ) в смешанных стратегиях, а значение игры равно v A = 1 q , где q определяется как в (4.11). Из леммы 4.2 следует, что ( x , y ) Î Z (G A¢ ) – ситуация равновесия
в игре G A¢ в смешанных стратегиях, а значение игры равно v A¢ = v A - b = b = 1 q - b . Теорема доказана. Следует отметить, что не всегда в антагонистических играх существует решение в смешанных стратегиях. Доказательство теоремы сводит решение МИ к ЗЛП. Алгоритм решения игры G A¢ следующий. 1. По матрице А’ строится строго положительная матрица A = A¢ + B , где B = {bij } , bij = b > 0 . 2. Решаются ЗЛП (4.9), (4.10). Находятся векторы x* , y * и число q [см. (4.11)]. 3. Строятся оптимальные стратегии игроков 1 и 2:
Введем x3 ,x 4 – базисные переменные, x1 ,x 2 – свободные переменные. Заметим, что эти задачи в эквивалентной форме могут быть записаны для ограничений типа равенств: min x1 + x 2 ,
max h1 + h2 ,
4x1 + 2x 2 - x3 = 1,
4h1 + h3 = 1,
3x 2 - x 4 = 1,
2h1 + 3h2 + h4 = 1,
x1 ³ 0, x 2 ³ 0, x3 ³ 0, x 4 ³ 0;
h1 ³ 0, h2 ³ 0, h3 ³ 0, h4 ³ 0.
Таким образом, методы решения ЗЛП могут быть приспособлены для решения МИ. Перепишем задачу F = x1 + x 2 ® min; ì4x1 + 2x 2 - x3 = 1; ï í 3x 2 - x 4 = 1; ïî x1, K , x 4 ³ 0
в эквивалентном виде j = R1 + R2 = 1 - 4x1 - 2x 2 + x 3 + 1 - 3x 2 + x 4 = = 2 - 4x1 - 5x 2 + x 3 + x 4 ® min ; ì4x1 + 2x 2 - x 3 + R1 = 1; í î3x 2 - x 4 + R2 = 1.
x = x* q и y = y* q соответственно.
1. Вычисляется значение игры G A¢ v A¢ = 1 q - b . Пример 4.2. Рассмотрим МИ G A , определенную матрицей æ 4 0ö A = çç ÷÷ . Соответствующие ей ЗЛП имеют следующий вид: è 2 3ø min x1 + x 2 ,
max h1 + h2 ,
4x1 + 2x 2 ³ 1,
4h1 £ 1,
3x 2 ³ 1,
2h1 + 3h2 £ 1,
x1 ³ 0, x 2 ³ 0;
h1 ³ 0, h2 ³ 0. 34
Составим симплекс-таблицу:
R1 R2 j
x1 x2 4 2 0 3* 4 5
x3 –1 0 –1
x4 0 –1 –1
R1 R 2 1 0 1 0 1 1 0 0 2
и решим симплекс-методом (см. пример 1, стр. 59).
35
x1 R1 4* x2 0 j 4 x1 1 x2 0 j 0
x1 x2 F
x2 x 3 x 4 R1 0 –1 2/3 1 1 0 –1/3 0 0 –1 2/3 0 0 –1/4 1/6 1/4 1 0 –1/3 0 0 0 0 –1
R2 –2/3 1/3 1/3 1/3 –5/3 2–5/3 –1/6 1/12 1/3 1/3 –1 0
x1 x2 x 3 x4 1 0 –1/4 1/6 1/12 0 1 0 –1/3 1/3 –1/4 –1/6 5/12
x1 = 1 / 12; x 2 = 1 / 3; F = 5 / 12. Решим теперь задачу F = h1 + h2 ® max; 4h1 + h3 = 1; 2h1 + 3h2 + h4 = 1; Составим симплекс-таблицу: h2 h4 F
h2 0 3 1
h3 1 0 0
h4 0 1 1 1 0 0
и решим симплекс-методом. h1 h4 F
h1 1 0 0
h 2 h3 0 1/4 3* –1/2 1 –1/4
h4 0 1/4 1 1/2 0 –1/4
h1 h2 F 36
h1 1 0 0
æ 1 12 1 3 ö ÷ = (1 / 5,4 / 5); =ç , 5 12 çè 5 12 5 12 ÷ø ~ æ 14 16 ö ÷ = (3 / 5, 2 / 5). =ç , y= y 5 12 çè 5 12 5 12 ÷ø
~ Þx= x
Пусть X и Y – множества оптимальных решений задач (4.9) и (4.10) соответственно. Обозначим 1 ìx ü 1 ìy ü X = í x Î X ý, Y = í y Î Y ý, q > 0. q îq þ q îq þ Напомним, что множество оптимальных смешанных стратегий обозначается Z (GA ), а проекции множества оптимальных стратегий – Z (GA ) на S I и S II – S*I и Σ*II соответственно, т.. е.
( ) x* Î S I , (x* , y* )Î Z (G A )}.
S*I = { x* x* Î S I , $ y* Î S II , x* , y* Î Z (G A )}; S*II = { y* y* Î S II , $
Теорема 4.2. Пусть G A – (m ´ n )-игра с положительной матрицей А и даны две двойственные задачи ЛП (4.9) и (4.10). Тогда возможны следующие варианты:
h1 ,..., h4 ³ 0. h1 4* 2 1
Þ~ xu = ~ y u = q = 5 / 12;
h 2 h3 h4 0 1/4 0 1/4 1 –1/6 1/3 1/6 0 –1/12 –1/3 –5/12
ом 1. Обе ЗЛП имеют решение ( X ¹ 0/ и Y ¹ 0/ ), при этом q = min xu = max yw. x
y
2. Значение v A игры G A равно v A = 1 q , а стратегии x* =
x y , y* = q q
являются оптимальными, где x Î X – оптимальное решение прямой задачи (4.9), а y Î Y – двойственной задачи (4.10). 3. Любые оптимальные стратегии x* Î S*I и y* Î S*II игроков могут 1 1 быть построены указанным способом, т. е. S*I = X , S*II = Y . q q 37
Самостоятельная работа № 3 Найти ситуацию равновесия и значение игры в смешанных стратегиях при помощи ЛП. Сделать проверку. ЗАНЯТИЕ № 5 Графоаналитический метод решения (2 ´ n )- либо (m ´ 2) - матричных игр (МИ) Распространенный способ решения МИ путем сведения ее к ЗЛП обладает тем недостатком, что процесс решения ЗЛП существенно усложняется для матриц большой размерности. В таких случаях обычно используют методы декомпозиции ЗЛП, когда вместо решения задачи с исходной матрицей строится координирующая задача с матрицей, у которой мало строк, но много столбцов, или наоборот. Напомним некоторые сведения из теории выпуклых множеств и систем линейных неравенств. Определение 5.1. Множество M Ì R m называется выпуклым, если вместе с любыми двумя точками этого множества x1 , x2 Î M в нем
содержатся все точки отрезка lx1 + (1 - l )x2 , l Î [0,1]. Понятие выпуклого множества можно сформулировать в более общем, но эквивалентном виде. Определение 5.2. Множество M Ì R m называется выпуклым, если вместе с точками x1 , K , xk из M оно содержит все точки вида k
x = å l i xi , l i ³ 0, i =1
k
å li = 1. i =1
Пересечение выпуклых множеств всегда выпукло. Определение 5.3. Рассмотрим систему линейных неравенств xA £ b или
{ }
xa j £ b j , j Î N = 1, n ,
[
где A = a j , j Î N
]
–
(m ´ n ) -матрица, 38
(5.1)
x Î R m , b = (b1 , K , b n ) Î R n .
~ Обозначим X = {x xA £ b} множество решений системы (5.1). ~ Непосредственно из определения следует, что X – выпуклое множество. ~ Множество X называется выпуклым многогранным множеством м, заданным системой ограничений (5.1). Определение 5.4. Точка x Î M , где M – выпуклое множество, о, называется крайней точкой, если из условия x = lx1 + (1 - l )x2 ,
x1 , x2 Î M , l Î (0,1) следует, что x1 = x2 = x . Содержательно определение означает, что x Î M – крайняя точка, если не существует отрезка, содержащего две точки из M , для которого x является внутренней. Заметим, что крайняя точка выпуклого множества всегда является граничной; обратное неверно. Определение 5.5. Выпуклой оболочкой множества Р conv(P ) будем называть пересечение всех выпуклых множеств, содержащих Р. Данное определение эквивалентно следующему. Выпуклая оболочка множества Р состоит из всех выпуклых линейных комбинаций всевозможных точек из Р, т. е. n n ìï üï conv(P ) = í x x = å l i xi , å l i = 1, l i ³ 0, xi Î P ý . ïî ïþ i =1 i =1 Определение 5.6. Выпуклая оболочка конечного числа точек называется выпуклым многогранником, порожденным своими крайними точками.
Определение 5.7. Напомним, что функция j : M ® R1 , где M Ì R m – выпуклое множество, называется выпуклой, если j(lx1 + (1 - l ) x2 ) £ lj( x1 ) + (1 - l ) j ( x2 )
(5.2)
для любых x1 , x2 Î M и l Î [0,1]. Если же в (5.2) выполняется обратное неравенство, то функция j называется вогнутой. Лемма 5.1. Пусть ji ( x ) – выпуклые на М функции i = 1, n . Тогда да верхняя огибающая y( x ) этого семейства функций y( x ) = max ji ( x ) i =1, n
39
(5.3)
является выпуклой на М, а нижняя огибающая (в (5.3) берется минимум по i) является вогнутой. Теорема 5.1. В МИ G A множества оптимальных смешанных стратегий S*I и S*II игроков являются выпуклыми многогранниками. Вернемся к теореме 3.7. В качестве примера использования теоремы приведем геометрическое решение игр с двумя стратегиями у одного из игроков ( (2 ´ n )- и (m ´ 2) -игры). Такой подход называется графоанали-
Для каждого
j = 1,4 имеем: E ( x,1) = -x + 2, E ( x, 2) = 2x + 1 ,
E ( x, 3) = -3x + 4 , E ( x, 4 ) = 4x. Нижняя огибающая H (x ) семействаа прямых {E ( x, j )} и сами прямые E ( x, j ), j = 1,4 , изображены на рис. 5.1.
тическим методом решения (2 ´ n ) - либо (m ´ 2) -МИ. В основее графоаналитических методов лежит свойство оптимальных стратегий x * и y * доставлять экстремумы в критических точках ах v A = max min E ( x, j ) = min max E (i, y ). x
j
y
i
Пример 5.1. ( (2 ´ n )-игра). Рассмотрим игру, в которой игрок 1 имеет две стратегии, а игрок 2 – п стратегий. Матрица имеет вид æa A = çç 11 è a 21
a 12 a 22
... a 1n ö ÷. ... a 2 n ÷ø
Рис. 5.1. Геометрическая интерпретация выигрыша первого игрока
Пусть игрок 1 выбрал смешанную стратегию x = (x, 1 - x ), а игрок 2 чистую – j Î N . Тогда выигрыш игрока 1 в ситуации ( x, j ) равен ен E ( x, j ) = xa1 j + (1 - x )a 2 j .
(5.4)
Геометрически он представляет собой прямую в координатах (x, E ). Таким образом, каждой чистой стратегии j соответствует своя прямая. Графиком функции H (x ) = min E ( x, j ) является нижняя огибающая j
семейства прямых (5.4). Эта функция вогнута как нижняя огибающая семейства вогнутых (в данном случае линейных) функций (лемма 5.1). Точка x * , в которой достигается максимум функции H (x ) по x Î [0,1], дает требуемый оптимальный набор стратегий x* = (x* , 1 - x* ) и значение игры v A = H (x* ). Для определенности рассмотрим игру с матрицей æ1 3 1 4ö A = çç ÷÷ . è2 1 4 0ø 40
ой Максимум H (x* ) функции H (x ) находится на пересечении первой и четвертой прямых. Таким образом, x * – решение уравнения 4x * = - x * + 2 = v A .
Откуда получаем оптимальную стратегию x* = (2 5 , 3 5) игрока 1 и значение игры v A = 8 5 . Оптимальную стратегию игрока 2 найдем из следующих соображений. Заметим, что в рассматриваемом случае E (x* ,1) = E (x* , 4) = v A = 8 5.
Для оптимальной стратегии выполняться равенство
(
)
( )
y * = (h1* , h*2 , h*3 , h*4 ) должно
( )
( )
( )
v A = E x * , y * = h1* E x * , 1 + h*2 E x* , 2 + h*3 E x* , 3 + h*4 E x* , 4 .
При этом E (x* , 2 ) > 8 5 , E (x* , 3) > 8 5 , следовательно, h*2 = h*3 = 0 , а h1* , h*4 можно найти из условия (5.3): 41
h1* + 4h*4 = 8 5 , 2h 1*= 8 5 .
Таким образом, h1* = 4 5 и h*4 = 1 5 и оптимальная стратегия игрокаа 2 равна y * = (4 5 , 0, 0, 1 5) . Пример 5.2. ( (m ´ 2 ) -игра). В этом примере две стратегии имеет игрок 2, а игрок 1 – т стратегий. Тогда матрица А имеет вид æ a11 ç ça A = ç 21 K çç è a m1
a 12 ö ÷ a 22 ÷ . K÷ ÷ a m 2 ÷ø
Анализ этой игры проводится аналогично. Действительно, пусть y = (h, 1 - h) – произвольная смешанная стратегия игрока 2. Тогда выигрыш игрока 1 в ситуации (i, y ) равен
ЗАНЯТИЕ № 6 6.1. Доминирование стратегий в биматричной игре Покажем на примере, что существуют стратегии, которые заведомо выбирать не нужно, и вероятность выбора которых, согласно теоремам 3.3–3.4, должна быть нулевой. Эта идея позволяет осуществлять замену первоначальной матрицы на матрицу выигрышей меньшей размерности. Пример 6.1. Рассмотрим следующую игру: Iy II y III y I x æ (4,3) (5,1) (6,2 )ö ç ÷ II x ç (2,1) (8,4 ) (3,6 ) ÷ . III x çè (3,0 ) (9,6 ) (2,8) ÷ø
Независимо от того, как играет игрок 1, III y дает игроку 2 строго о
E (i, y ) = a i1h + a i 2 (1 - h) = (a i1 - a i 2 )h + a i 2 .
больший выигрыш, нежели II y . В этом смысле стратегия II y строго
График функции E (i, y ) – прямая. Рассмотрим верхнюю огибающую этих прямых, т. е. функцию
доминируема, поэтому рациональный игрок 2 не должен играть II y . Далее, если игрок 1 знает (так как он сам рационален и знает, что другой рационален), что игрок 2 не будет играть II y , то для него I x будет лучше,
H (h) = max[(a i1 - a i 2 )h + a i 2 ]. i
Функция H (h) выпуклая (как верхняя огибающая семействаа выпуклых функций). Точка минимума h* функции H (h) дает оптимальную стратегию * H (h). y * = (h* , 1 - h* ) и значение игры v A = H (h ) = hmin Î[0 ,1]
Самостоятельная работа № 4 Найти ситуацию равновесия и значение игры в смешанных стратегиях графоаналитическим методом.
42
чем II x или III x . Наконец, если игрок 2 знает, что игрок 1 знает, чтоо игрок 2 не будет играть II y , то игрок 2 знает, что игрок 1 будет играть I x , а тогда игрок 2 должен играть I y . Естественно, что строго доминируемые стратегии надо удалять и в результате последовательного удаления строго доминируемых стратегий остается пара стратегий I x , I y .
(
)
Пример 6.2. Посмотрим теперь на следующую игру: Iy I x æ (4,0 ) ç II x ç (0,0 ) III x çè (- 1,0 ) 43
II y (- 1,0)ö ÷ (0,0) ÷ . (2,0) ÷ø
Здесь II x не доминируется строго ни стратегией I x , ни стратегией III x . Однако, если игрок 1 играет I x с вероятностью 1 2 и III x – с вероятностью 1 2 , он обеспечивает себе выигрыш 1 2 независимо отт того, как играет игрок 2. Следовательно, чистая стратегия может строго доминироваться смешанной стратегией, даже если она не доминируется строго никакой чистой стратегией. Определение 6.1. Чистая стратегия xi игрока i в игре G строго о доминируема, если существует другая чистая стратегия xi , такая, что K i ( x || xi ) ³ K i ( x )
" x j Î X , j = 1, n,
j ¹ i.
(6.1)
В этом случае говорят, что стратегия xi доминирует стратегию xi .
Смешанная стратегия может быть строго доминируемой, если она использует с положительной вероятностью чистые стратегии, которые даже не слабо доминируемы. Пример 6.3. Действительно, рассмотрим следующую игру: Iy I x æ (1,3) ç II x ç (- 2,0 ) III x çè (0,1)
Стратегия игрока 1 (1 2 , 1 2 , 0) дает ожидаемый выигрыш - 1 2 вне зависимости от того, что играет игрок 2, а следовательно, строго доминируется стратегией III x . Пример 6.4. Рассмотрим игру, где выигрыши могут принимать значения
Определение 6.2. Стратегия xi слабо доминируется, если существует такая xi , что (6.1) выполняется как нестрогое неравенство,
{
}
но хотя бы для одного набора x j j = 1, n, j ¹ i – неравенство строгое. Аналогично определение и для смешанных стратегий: Определение 6.3. Смешанная стратегия si строго доминируется в игре G , если существует другая стратегия si : Ei (s || si ) ³ Ei (s )
" s j Î S, j = 1, n,
j ¹ i.
(6.2)
Стратегия s i называется строго доминирующей стратегией для игрока i в игре G , если она строго доминирует любую другую стратегию из åi . Заметим, что для проверки строгой доминируемости si стратегией si нам нужно знать «поведение» этих двух стратегий против чистых стратегий оппонентов игрока i, т. е. Ei (s || si ) ³ Ei (s )
" s j Î S, j = 1, n,
j¹i
тогда и только тогда, когда Ei ( x || si ) > Ei ( x || si )
" x j Î X , j = 1, n, 44
j ¹ i.
II y (- 2,0)ö ÷ (1,3) ÷ . (0,1) ÷ø
Iy
II y
I x æ (20,10) (15,20) ö ÷. ç I x çè (–100,20) (40,30) ÷ø Очевидно, что здесь стратегия I y доминируется стратегией II y , но
(
)
проигрыш игрока 1 в ситуации II x , I y слишком велик, поэтому вполне можно допустить, что игрок 1 может не рискнуть сыграть стратегию II x , допуская возможность случайной ошибки игрока 2. 6.2. Доминирование стратегий в антагонистической игре Определение 6.4. Говорят, что стратегия x ¢ игрока 1 доминирует т стратегию x ¢¢ в (m ´ n )-игре G A , если для всех чистых стратегий j = 1, n игрока 2 выполняются неравенства x¢a j ³ x¢¢a j .
(6.3)
æ2 5ö ç ÷ Например, в матрице ç 3 4 ÷ 3-я строка доминируется 2-й, т. е. ç 3 2÷ è ø 45
о: существуют x¢ = (0, 1, 0), x¢¢ = (0, 0, 1) такие, что:
Теорема 6.1. Если в игре G A стратегия x ¢ одного из игроков доми-
0 × 2 + 1 × 3 + 0 × 3 ³ 0 × 2 + 0 × 3 + 1 × 3; 0 × 5 + 1 × 4 + 0 × 2 ³ 0 × 5 + 0 × 4 + 1 × 2. Аналогично, стратегия y ¢ игрока 2 доминирует т его стратегию y ¢¢ , если для всех чистых стратегий i = 1, m игрока 1 ai y¢ £ ai y¢¢ .
(6.4)
Если неравенства (6.3), (6.4) выполняются как строгие, то говорят о строгом доминировании. Частным случаем доминирования стратегий является их эквивалентность. Определение 6.5. Будем называть стратегии x ¢ и x ¢¢ игрока 1 эквивалентными в игре G A , если для всех j = 1, n x¢a j = x¢¢a j
(6.3¢)
и обозначать x ¢ ~ x ¢¢ . Для двух эквивалентных стратегий x ¢ и x ¢¢ о выполняется (для каждого y Î S II ) равенство
E ( x¢, y ) = E ( x¢¢, y ). Аналогично, стратегии y ¢ и y ¢¢ игрока 2 эквивалентны ( y ¢~ y ¢¢ )
в игре G A , если для всех i = 1, m y ¢ai = y ¢¢ai .
(6.4¢)
Отсюда имеем, что для любой смешанной стратегии x Î S I игрокаа 1 выполняется равенство E ( x, y ¢) = E ( x, y ¢¢). Для чистых стратегий введенные определения трансформируются следующим образом. Если чистая стратегия i ¢ игрока 1 доминирует т чистую стратегию i ¢¢ , а чистая стратегия j ¢ игрока 2 – чистую ую
нирует оптимальную стратегию x * этого игрока, то стратегия x ¢ такжее оптимальна. Отсюда вывод, что оптимальная стратегия может быть доминируема лишь оптимальной стратегией. С другой стороны, никакая оптимальная стратегия не является строго доминируемой, поэтому строго доминируемые стратегии не могут быть оптимальными. Теорема 6.2. Если в игре G A стратегия x * одного из игроков ов * оптимальна, то x – недоминируема строго. Обратное утверждение неверно. æ1 0ö ÷÷ 1-я и 2-я чистые Пример 6.5. Так, в игре с матрицей çç è0 2ø стратегии игрока 1 недоминируемы строго, но они неоптимальны. С другой стороны, если i-я строка (j-й столбец) матрицы А доминируемы, то нет необходимости приписывать ей (ему) положительную вероятность в ситуации равновесия. Таким образом, для нахождения оптимальных стратегий вместо игры G A достаточно решить подыгру G A¢ , где A¢ – матрица, получаемая из матрицы A вычеркиванием доминируемых строк и столбцов. Определение 6.6. Если x = (x1 ,..., x m ) Î S I и 1 £ i £ m + 1 , тоо расширением стратегии x на i-м месте будем называть вектор xi = (x1 ,..., xi -1 , 0, xi ,..., x m ) Î R m +1 .
Пример 6.6. Так, расширением вектора (1 3 , 2 3 , 1 3) на 2-м месте
является вектор (1 3 , 0, 2 3 , 1 3); расширением на 4-м месте – вектор
(1 3 , 2 3 , 1 3 , 0); расширением на 1-м месте – вектор (0, 1 3, 2 3 , 1 3). Теорема 6.3. Пусть дана G A – (m ´ n )-МИ. Предположим, чтоо i-я
стратегию j ¢¢ того же игрока, то для всех i = 1, m, j = 1, n выполняются ся неравенства a i¢j ³ a i¢¢j , a ij¢ £ a ij ¢¢ . Покажем, что игроки могут не использовать доминируемые стратегии. Этот факт устанавливает следующую теорему.
строка матрицы А доминируема (т. е. доминируема чистая стратегия i первого игрока) и пусть дана G A¢ – игра с матрицей A¢ , получаемой из матрицы А вычеркиванием i-й строки. Тогда справедливы следующие утверждения: 1. v A = v A¢ . 2. Всякая оптимальная стратегия y * игрока 2 в игре G A¢ является ся оптимальной и в игре G A .
46
47
3. Если x * – произвольная оптимальная стратегия игрока 1 в игре
G A¢ и x i* – расширение стратегии x * на i-м месте, тоо x i* – оптимальная стратегия этого игрока в игре G A . 4. Если i-я строка матрицы А строго доминируема, то оптимальная стратегия x * игрока 1 в игре G A может быть получена из оптимальной стратегии x * в игре G A¢ расширением на i-м месте. Сформулируем теорему о доминировании для второго игрока. Теорема 6.4. Пусть дана G A – (m ´ n )-МИ. Предположим, чтоо j-й столбец матрицы А доминируем и пусть дана G A ¢ – игра с матрицей A¢ , получаемой из матрицы А вычеркиванием j-го столбца. Тогда справедливы следующие утверждения: 1. v A = v A¢ . ся 2. Всякая оптимальная стратегия x * игрока 1 в игре G A¢ является оптимальной и в игре G A .
Пример 6.7. Рассматривается игра с матрицей æ2 ç ç2 A=ç 3 çç è0
1 3 1 3
1 1 2 0
0ö ÷ 3÷ . 0÷ ÷÷ 6ø
Так как каждое значение 3-й строки a 3 превосходит соот-
ветствующее значение первой (a3 получаем æ2 ç A1 = ç 3 ç0 è
³ a1 ) , то, вычеркивая первую строку,,
3 1 3ö ÷ 1 2 0÷. 3 0 6 ÷ø В этой матрице каждое значение 3-го столбца a 3 не превосходит соответствующее значение 1-го столбца a 1 . Поэтому получаем
стратегия этого игрока в игре G A . 4. Далее, если j-й столбец матрицы А строго доминируем, то
æ3 1 3ö ç ÷ A2 = ç 1 2 0 ÷ . ç3 0 6÷ è ø В последней матрице никакая строка (столбец) не доминируется
оптимальная стратегия y * игрока 2 в игре G A может быть получена из
другой строкой (столбцом). Вместе с тем 1-й столбец a 1 превосходит
3. Если y * – произвольная оптимальная стратегия игрока 2 в игре
G A¢ и y *j – расширение стратегии y * на j-м месте, тоо y *j – оптимальная
оптимальной стратегии y * в игре G A¢ расширением на j-м месте. Обобщим полученные результаты. Теоремы 5.3–5.4 дают алгоритм понижения размерности матрицы игры. Так, если строка (столбец) матрицы не больше (не меньше) некоторой выпуклой линейной комбинации остальных строк (столбцов) этой матрицы, то для нахождения решения игры можно эту строку (столбец) вычеркнуть. При этом соответствующее расширение оптимальных стратегий в игре с усеченной матрицей даст оптимальное решение исходной игры. Если неравенства выполнялись как строгие, то множество оптимальных стратегий в первоначальной игре можно получить расширением множества оптимальных стратегий усеченной игры, в противном случае при такой процедуре оптимальные стратегии можно потерять.
выпуклую линейную комбинацию столбцов a 2 и a 3 , так как ак 1 2 3 a ³ 1 2 a + 1 2 a , поскольку 3 > 1 2 + 1 2 × 3, 1 = 1 2 × 2 + 1 2 × 0, 3 = 0 × 1 2 + 1 2 × 6 . Исключая 1-й столбец, получаем æ 1 3ö ç ÷ ç 2 0÷ . ç 0 6÷ è ø В этой матрице 1-я строка эквивалентна смешанной стратегии x = (0,1 2 , 1 2) , поскольку 1 = 1 2 × 2 + 0 × 1 2 , 3 = 0 × 1 2 + 6 × 1 2 . Таким образом, исключая 1-ю строку, получаем матрицу
48
49
æ 2 0ö çç ÷÷ . è 0 6ø
Оптимальные стратегии x * и y * игроков в игре с этой матрицей равны x* = y* = (3 4 , 1 4 ), при этом значение v игры равно 3 2 . Последняя матрица получена вычеркиванием первых двух строк и столбцов, поэтому оптимальными стратегиями игроков в исходной игре являются расширения указанных стратегий на 1-м и 2-м местах, т. е. x12* = y12* = (0, 0, 3 4 , 1 4) . Заметим, что поскольку в решении использовалось нестрогое доминирование, то могут быть потеряны другие оптимальные стратегии. Самостоятельная работа № 5 Рассмотреть игру на доминирование и найти ситуацию равновесия.
v k = max å a ij hkj = å a ik +1 j hkj и v k = min å a ij xik = å a ij xik . k +1 i
j
j
j
i
i
Пусть v – значение МИ G A . Рассмотрим отношения v k k = max å a ij hkj k = å a ik +1 j hkj k ,
(7.1)
v k k = min å a ij xik k = å a ijk +1 xik k .
(7.2)
i
j
(
j
i
j
i
)
(
)
Векторы x k = x1k k ,..., x km k и y k = h1k k , ..., hkn k являются ся смешанными стратегиями игроков 1 и 2 соответственно, поэтому по определению значения игры имеем max v k k £ v £ min v k k . k
k
ЗАНЯТИЕ № 7 Итеративные методы решения матричных игр 7.1. Итеративный метод Брауна – Робинсона (метод фиктивного разыгрывания) Идея метода – многократное фиктивное разыгрывание игры с заданной матрицей выигрыша. Одно повторение игры будем называть партией. Пусть разыгрывается игра с (m ´ n )-матрицей A = {a ij } . В 1-й партии оба игрока выбирают совершенно произвольные чистые стратегии. В k-й партии каждый игрок выбирает ту чистую стратегию, которая максимизирует его ожидаемый выигрыш против наблюдаемого эмпирического вероятностного распределения противника за (k - 1) партий. Итак, предположим, что за первые k разыгрываний игрок 1
(
)
использовал i-ю стратегию xik раз i = 1, m , а игрок 2 – j-ю стратегию hkj раз
ать ( j = 1, n). Тогда в (k + 1) -й партии игрок 1 будет использовать
де ik +1 -ю стратегию, а игрок 2 – свою jk +1 -ю стратегию, где 50
Таким образом, получен некоторый итеративный процесс, позволяющий находить приближенное решение МИ, при этом степень близости приближения к истинному значению игры определяется длиной интервала [max v k k , min v k k ] . Сходимость алгоритма гарантируется k
k
следующей теоремой. Теорема 7.1. lim æç min v k k ö÷ = lim æç max v k k ö÷ = v . ø k ® ¥è k ø Пример 7.1. Найти приближенное решение игры с матрицей k ® ¥è k
a aæ2 ç A = b ç3 g çè 1
b 1 0 2
c 3ö ÷ 1÷. 1 ÷ø
Обозначим a, b, g – стратегии игрока 1 и a, b, c – стратегии игрока 2. Пусть сначала игроки выбрали стратегии a и a соответственно. Если игрок 1 выбрал стратегию a , то игрок 2 может потерять один из выигрышей (- 2, - 1, - 3) . Если игрок 2 выбрал стратегию a , то игрок 1 может получить один из выигрышей (2, 3, 1) . Во 2-й и 3-й партиях игрок 51
1 выбирает стратегию b, а игрок 2 – b , поскольку эти стратегии обеспечивают наилучший результат и т. д. Вычислим средний выигрыш за первые три шага:
( )
v 1 1 = max å a ij h1j 1 = i
j
= max{(2 × 1 + 1 × 0 + 3 × 0); (3 × 1 + 0 × 0 + 1 × 0); (1 × 1 + 2 × 0 + 1 × 0)} = i
= max{2; 3; 1} = 3; i
( )
v1 1 = min å a ij x1i 1 = j
i
= min{(2 × 1 + 3 × 0 + 1 × 0 ); (1 × 1 + 0 × 0 + 2 × 0); (3 × 1 + 1 × 0 + 1 × 0 )} = j
= max{2; 1; 3} = 1; i
v 2 = max å a ij (h 2) = 2
2 j
i
j
= max{(2 × 1 2 + 1 × 1 2 + 3 × 0 ); (3 × 1 2 + 0 × 1 2 + 1 × 0 ); (1 × 1 2 + 2 × 1 2 + 1 × 0 )} = i
= max{3 2 ; 3 2 ; 3 2} = 3 2 ;
(
i
)
v 2 2 = min å a ij xi2 2 = j
i
= min{(2 × 1 2 + 3 × 1 2 + 1 × 0 ); (1 × 1 2 + 0 × 1 2 + 2 × 0 ); (3 × 1 2 + 1 × 1 2 + 1 × 0 )} = j
= max{5 2 ; 1 2 ; 4 2} = 1 2 ;
(
i
)
v 3 3 = max å a ij h3j 3 = i
j
= max{(2 × 1 3 + 1 × 2 3); (3 × 1 3); (1 × 1 3 + 2 × 2 3)} = max{4 3 ; 1; 5 3} = 5 3 ; i
i
v 3 = min å a ij (x 3) = min{(2 × 1 3 + 3 × 2 3); (1 × 1 3); (3 × 1 3 + 1 × 2 3)} = 3
j
3 i
i
j
= max{8 3 ; 1 3 ; 5 3} = 1 3 .
В таблице приведены результаты разыгрываний, указаны стратегия игрока, накопленный и средний выигрыши. Таким образом, за 12 партий мы получили приближение решения x12 = (1 4 ,1 6 , 7 12 ), y12 = (1 12 ,1 2 , 5 12) , а точность может быть оценена
числом 1 2 . Основным недостатком рассмотренного метода является егоо малая скорость сходимости, которая уменьшается с ростом размерности матрицы. Это является также следствием немонотонности последовательностей v k k и v k k . Рассмотрим другой итеративный алгоритм, который избавлен от указанного недостатка. 7.2. Монотонный итеративный алгоритм решения МИ Рассмотрим смешанное расширение GA = ( X , Y , K ) МИ с (m ´ n ) матрицей А.
(
)
N Обозначим x N = x1N ,..., x m Î S I приближение оптимальной
стратегии игрока 1 на N-й итерации и c N Î R n , c N = (g1N ,..., g nN ) – вспомогательный вектор. Алгоритм позволяет находить (точно и приближенно) оптимальную стратегию игрока 1 и значение игры v . Итеративный процесс строится следующим образом. В начале процесса игрок 1 выбирает произвольную чистую стратегию i0 , т. е.
(
)
x 0 = 0,...,1i0 ,...,0 , и вспомогательный вектор вида c 0 = ai0 , где ai0 – строка матрицы А, имеющая номер i0 . Пусть выполнена N - 1 итерация и получены векторы x N -1 , c N -1 . N Тогда x N и c вычисляются по следующим итеративным формулам: (7.3) x N = (1 - a N )x N -1 + a N ~ xN ,
c N = (1 - a N ) c N -1 + a N c~ N ,
x N и c~ N будут получены ниже. где параметр 0 £ a N £ 1. Векторы ~ е.
i
52
53
(7.4)
(
)
Рассмотрим вектор c N -1 = g1N -1 ,..., g nN -1 и выберем такие индексы м j k , на которых достигается минимум min g Nj -1 = g Nj1-1 = g Nj2-1 = ... = g Nj k-1 . j =1, n
Обозначим v N -1 = min g Nj -1 ,
(7.5)
j =1, n
Итеративный метод Брауна – Робинсона
а J N -1 = { j1 ,..., jk } – множество индексов, на которых достигается min g Nj -1 . j =1, n
G N Ì GA
Пусть
{
}
–
подыгра
игры
GA
с
матрицей
A N = a ijN -1 , i = 1, m , а индекс j Î J N -1 . Решаем подыгру и находим ~ ~ стратегию ~ x N = x1N ,..., xmN . x N Î X игрока 1. Пусть ~
(
)
m
~ Вычислим вектор c~ N = å xiN ai . Пусть вектор c~ N имеет
~N
компоненты c
=
(
i =1
~g N ,..., ~g N 1 n
). Рассмотрим (2 ´ n) - игру с матрицей
æ g1N -1 , ..., g nN -1 ö ç ÷ ç ~g N , ..., ~g N ÷ . è 1 n ø Найдем оптимальную стратегию (a N , 1 - a N ), 0 £ a N £ 1, игрока 1 в этой подыгре. Подставляя найденные значения ~ x N , c~ N , a N в (7.3), (7.4), находим о x N и c N . Процесс продолжаем до тех пор, пока не выполнится равенство a N = 0 или не будет достигнута требуемая точность вычислений. Сходимость алгоритма гарантируется следующей теоремой. 54
55
Теорема 7.2. Пусть {v N }, {x N } – итеративные последовательности, определяемые (7.3), (7.5). Тогда справедливы следующие утверждения: 1) v N > v N -1 , т. е. последовательность {v N -1} строго монотонно возрастает; 2) lim v N ®¥
N
= v = v;
(7.6)
x N = x * , где x* Î S* – оптимальная стратегия игрока 1. 3) Nlim I ®¥ Пример 7.2. Решим, используя монотонный алгоритм, игру с матрицей
x1 = 1 2 x 0 + 1 2 ~ x 1 = (1 2 , 0,1 2); c1 = 1 2 c 0 + 1 2 c~1 = (3 2 , 3 2 , 2); v1 = min g1j = g11 = g12 = 3 2 > v 0 = 1. j
Множество индексов имеет вид J 1 = {1, 2}. æ2 1ö ç ÷ Итерация 2. Рассмотрим подыгру G Ì GA с матрицей A = ç 3 0 ÷ . ç1 2÷ è ø 2
Первая строка в этой матрице доминируема, поэтому достаточно
æ 2 1 3ö ç ÷ A = ç 3 0 1÷. ç 1 2 1÷ è ø Итерация 0. Пусть игрок 1 выбрал 1-ю строку матрицы А, т. е. 0 0 0 0 x 0 = (1, 0, 0 ) и c 0 = a1 = (2, 1, 3). Вычислим v = min g j = g 2 = 1, J = {2}. j
æ1ö ç ÷ 1 1 Итерация 1. Рассмотрим подыгру G Ì G A с матрицей A = ç 0 ÷ . ç 2÷ è ø Оптимальной стратегией ~ да x 1 = (0, 0,1). Тогда x 1 игрока 1 является вектор ~ c~1 = a = (1, 2,1) . 3
æ 2 1 3ö Решаем (2 ´ 3) -игру с матрицей çç ец ÷÷ . Заметим, что 3-й столбец è 1 2 1ø
æ2 1ö матрицы доминируем, поэтому смотрим матрицу çç ÷÷ . В силу è1 2ø симметрии оптимальной стратегией игрока 1 в этой игре является вектор
æ3 0ö ÷÷ . рассмотреть подматрицу çç è1 2ø Оптимальной стратегией игрока 1 в этой игре является вектор (1 4 , 3 4) , поэтому ~x 2 = (0,1 4 , 3 4) . Вычислим c~ 2 = 1 4 a + 3 4 a = 2
3
æ3 2 3 2 2ö ÷÷ . = (3 2 , 3 2 ,1) и рассмотрим (2 ´ 3) -игру с матрицей çç è3 2 3 2 1ø
Первая стратегия игрока 1 доминирует вторую, поэтому a1 = 0 . Таким * 1 образом, вычисления закончены: x = x = (1 2 , 0, 1 2 ); значение v игры
равно v = v1 = 3 2 . Оптимальная стратегия игрока 2 имеет вид y* = (1 2 ,1 2 , 0 ) (см. пример 7.1, вторая строка в таблице).
Самостоятельная работа № 6 Найти значение игры в смешанных стратегиях с помощью итеративных методов
(a N ,1 - a N ) = (1 2 , 1 2 ).
Вычисляем x1 и c1 по формулам (7.3), (7.4). Имеем 56
2
57
1 æ (1,2) çç è (0,3)
Самостоятельная работа № 1 Исследовать все ситуации на равновесие по Нэшу и оптимальность по Парето
æ1 0 -1 2 1ö ç ÷ ç 4 7 3 1 2÷ ç2 1 - 6 3 1÷ è ø
3
4
5
(2,1) ö æ (3,2) (2,1) ö æ (5,2) (2,0)ö æ (3,2) (2,0)ö æ (3,4) (2,1) ö ÷ ç ÷ ç ÷ ç ÷ ç ÷ (4,6)÷ø çè (0,3) (4,4)÷ø èç (1,1) (5,6) ÷ø çè (1,3) (5,5) ÷ø çè (2,1) (5,4)÷ø 7
8
9
10
(2,0)ö æ (5,2) (2,3) ö æ (5,6) (3,2)ö æ (5,4) (3,2) ö æ (7,5) (3,2) ö ÷ ç ÷ ç ÷ ç ÷ ç ÷ (5,3) ÷ø çè (2,1) (4,6)÷ø çè (2,1) (5,3) ÷ø çè (2,3) (4,6)÷ø çè (2,1) (7,4)÷ø 11
æ (6,5) çç è (2,3)
7
2
6 æ (1,4) çç è (2,1)
ПРИЛОЖЕНИЕ
12
13
14
Самостоятельная работа № 2 Найти все максминные и минимаксные стратегии игроков, нижнее и верхнее значения игры; указать все ситуации равновесия и значение игры 1 2 3 æ 2 - 3 1 -1ö ÷ 2 - 4 3 - 3 5ö æ 2 3 4 5 3ö ç 4 2 ÷ æç ÷ ç ÷ ç- 3 1 5 3÷ ç 1 1 4 3 3÷ ç 1 - 2 3 -1÷ ç 1 - 2 1 çç ÷÷ ç 1 - 2 4 - 34 0 ÷ ç 4 5 12 11 9 ÷ è ø è ø 1 4 7 5 è ø 4 5 6 3 ö æ2 -1 3 ç ÷ ç3 1 - 5 0 ÷ ç4 -1 1 5 ÷ çç ÷÷ è 1 3 - 13 - 6 ø
58
æ 2 1 -1 1ö ç ÷ ç 1 3 - 4 2÷ ç11 12 11 3 ÷ è ø 13
15
(3,2)ö æ (6,7 ) (3,3) ö æ (7,4) (3,2)ö æ (8,7 ) (4,2)ö æ (9,6) (4,3)ö ÷ ç ÷ ç ÷ ç ÷ ç ÷ (5,8) ÷ø èç (2,4) (7,5)÷ø èç (2,1) (6,5)÷ø çè (2,1) (9,8) ÷ø çè (5,1) (8,5) ÷ø
æ2 -1 -1 2 ö ç ÷ 1 5 ÷ ç1 3 ç1 1 5 - 7÷ çç ÷÷ è 2 3 - 3 14 ø
10
æ 0 4 10 1 ö ç ÷ ç 4 8 18 7 ÷ ç10 18 40 17 ÷ çç ÷÷ è 1 7 17 3 ø
æ2 ç ç0 ç2 çç è3
8 æ1 ç ç2 ç-1 çç è1
9
2 2 3 4 ö ÷ 1 -1 2 0 ÷ 2 1 1 3 ÷ ÷ 5 - 8 - 5 - 12 ÷ø
æ1 ç ç2 ç3 çç è14
0 1 -1 ö ÷ 1 1 -5 ÷ 3 3 -8 ÷ ÷ 7 12 - 35 ø÷
11 1 æ1 1 ç 1 ç2 1 ç1 -1 2 çç è3 - 6 - 5
12 3ö ÷ 3÷ 5÷ ÷ 6 ÷ø
14
æ1 2 5 4 ö ç ÷ ç2 1 3 1 ÷ ç 8 2 19 11÷ è ø 15
2 1 4 ö æ 1 - 2 -1 2 ö ÷ ç ÷ 2 -1 3 ÷ ç 3 0 2 5 ÷ 5 1 11÷ ç 4 - 2 5 7 ÷ ÷÷ çç ÷ 8 1 18 ø è - 2 0 - 4 - 7 ÷ø
7 ö æ1 4 2 ÷ ç 3 10 ÷ ç3 7 ç1 -1 -1 - 4÷ ÷ çç 3 ÷ø è2 3 1
Пример 1. Решим каноническую задачу симплекс-методом. z = 3 x1 + 2 x2 ® max ì- x1 + x2 £ 1 ïx £ 2 ïï 2 í x1 + 2 x2 £ 6 ï2 x + x £ 8 ï 1 2 ïî x1 , x2 ³ 0
Введем базисные переменные si , i = 1,4 ; x1 , x2 – свободные переменные
F = -3 x1 - 2 x2 ® min
ì- x1 + x2 - 1 + s1 = 0 ïx - 2 + s = 0 2 ïï 2 í x1 + 2 x2 - 6 + s3 = 0 ï2 x + x - 8 + s = 0 4 ï 1 2 ïî x1 , x2 ³ 0
Определение 1. Решение системы, соответствующее нулевым значениям свободных переменных, называется базисным. Очевидно, что базисное решение будет допустимым, если все si ³ 0, i = 1,4 . Составим симплекс-таблицу. 59
x 2 x1 s1 1* –1 s2 1 0 s3 2 1 s4 1 2 F 2 3
s1 s 2 s 3 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0
s4 0 0 0 1 0
1 2 6 8 0
x2 x1 s1 s2 F
Если все элементы последнего столбца меньше нуля (кроме последнего элемента последней строки F ), то решение неограниченноее и оптимального решения не существует. Условия оптимальности: если все элементы последней строки F £ 0 , то полученное решение оптимально. Выбор генерального столбца (кроме последнего): в последней строке выбираем положительный элемент. Выбор генеральной строки: за генеральную строку берется та строка (кроме последней), в которой отношение свободного члена к положительному элементу генерального столбца было бы минимальным. x2 s2 s3 s4 F
x2 x1 s1 s 2 1 –1 1 0 0 1* –1 1 0 3 –2 0 0 3 –1 0 0 5 –2 0
x2 x1 s3 s4 F
s2 1 1 –3 –3 –5
s1 0 0 1 0 0
s 2 s3 s4 0 2/3 –1/3 4/3 0 –1/3 2/3 10/3 0 –1 1 3 1 –2/3 1/3 2/3 0 –1/3 –4/3 - 38 3
Fmin = -12 2 3 Þ z max = 12 2 3 ; x1 = 10 3 ; x2 = 4 3 . Пример 2. Метод искусственного базиса для основной задачи.
z = 2 x1 - 3x2 + 4 x3 ® max ì2 x1 - 2 x2 - x3 = -2 ï í- x1 + 3x2 - 2 x3 = 11 ï î x j ³ 0, j = 1,3
Умножив обе части первого уравнения на (–1) и прибавив к левым частям обоих уравнений искусственные неизвестные w1 и w2, получим
ì- 2 x1 + 2 x2 + x3 + w1 = 2 ï í- x1 + 3x2 - 2 x3 + w2 = 11 ï î x j ³ 0, j = 1,3
s3 s 4 0 0 1 0 0 1 1 0 4 0 1 7 0 0 –2
расширенную систему
Составим на множестве планов j( x ) = w1 + w2 ® min
расширенной системы вспомогательную функцию
Повторяем итерации. x2 x1 s1 1 0 0 0 1 –1 0 0 1* 0 0 2 0 0 3
x2 x1 1 0 0 1 0 0 0 0 0 0
s3 s 4 0 0 2 0 0 1 1 0 1 0 1 4 0 0 –7
x2 x1 s1 s4 F
60
x2 x1 1 0 0 1 0 0 0 0 0 0
s1 0 0 1 0 0
s2 1 –2 –3 3* 4
s3 0 1 1 –2 –3
s4 0 2 0 2 0 1 1 2 0 –10
j( x ) = w1 + w2 = 13 + 3 x1 - 5 x 2 + x3 ; j( x ) - 3 x1 + 5 x 2 - x3 = 13 .
61
z = 4 x1 + x2 ® min
x1 x2
x3
w1
w2 Свободный член
w1 –2 2* w2 –1 3 j –3 5
1 –2
1 0
0 1
2 11
I2 II - 3 × I 2
–1
0
0
13
III - 5 × I 2
x2 –1 1
1/2
1/2
0
1
I + II 2
w2 2* 0 –7/2 –3/2 j 2 0 –7/2 –5/2
1
8
II 2
0
8
III - II
j = R1 + R2 ® min
так как «=»; ì3x1 + x2 + R1 = 3 ï4 x + 3 x - s + R = 6 так как s1 x = 0 = -6 < 0 ; ï 1 2 1 2 x =0 í x + 2 x + s = 4 2 2 так как «все нормально»; ï 1 ïî x1, x2 ³ 0 => s2 – базисный
ì3x1 + x2 = 3 ï4 x + 3 x ³ 6 ï 1 2 í ï x1 + 2 x2 £ 4 ïî x1, x2 ³ 0
1
2
j = R1 + R2 = 3 - 3 x1 - x 2 + 6 - 4 x1 - 3 x 2 + s1 = 9 - 7 x1 - 4 x 2 + s1 .
x1
x2
s1
R1
R2
s2
R1 3*
1
0
1
0
0
3
R2
4
3
–1
0
1
0
6
s2
1
2
0
0
0
1
4
j
7
4
–1
0
0
0
9
x1
1
1/3
0
1/3
0
0
1
ì x2 - 5 4 x3 = 5, í î x1 - 7 4 x3 = 4;
R2
0 5/3*
–1
–4/3
1
0
2
s2
0
5/3
0
–1/3
0
1
3
z = 2(4 + 7 4 x3 ) - 3(5 + 5 4 x3 ) + 4 x3 = -7 + 15 4 x3 ;
j
0
5/3
–1
–7/3
0
0
2
F = -2 x1 + 3x2 - 4 x3 = 7 - 15 x3 . 4
x1
1
0
1/5
3/5 –1/5 0 3/5
x2
0
1
–3/5 –4/5 3/5
s2
0
0
1
1
–1
1
1
j
0
0
0
–1
–1
0
0
x2
0
1 –5/4 –1/4 1/2
5
x1 j
1
0 –7/4 –3/4 1/2
4
0
0
0
0
–1
–1
Так как jmin = 0 , то решим задачу z = 2 x1 - 3x2 + 4 x3 ® max;
x1 x2
x3
x2
0
1
–5/4 5
x1
1
0
–7/4 4 II - 3I 2
F
0
0 –15/4 7 III - 5I 2
I2
Следовательно, оптимального плана не существует. Пример 3. Рассмотрим общую задачу. Двухфазный симплексметод. 62
0 6/5
Так как jmin = 0 , решим задачу:: z = 4(3 5 - 1 5 s1 ) + (6 5 + 3 5 s1 ) = 18 5 - 1 5 s1; ì x1 = 3 5 - 1 5 s1, í î x2 = 6 5 + 3 5 s1. 63
x1 x 2 s1
Þ x1 = 2
x1 1
0
1/5
3/5
x2 0
1
–3/5 6/5
s2 0
0
1*
1
z
0
0
1/5
18/5
x1
1
0
0
2/5
x2 0
1
0
9/5
s1 0
0
1
1
z 0
0
0
17/5
5
x2 = 9 zmin
5 = 17
5
Упражнения: решить П3 и Д3 симплекс-методом: z = 21x1 + 4 x2 + 5 x3 - 13x4 + 7 x5 ® max ì2 x1 + 3x2 - x4 + 4 x5 £ 12 ïx - x + 2x + x - 2x £ 8 3 4 5 ï 1 2 í3x - x + x - 2 x - x = 1 4 5 ï 1 2 3 ï x j ³ 0, j = 1,5 î f = 12 y1 + 8 y2 + y3 ® min ì2 y1 + y2 + 3 y3 ³ 21 ï3 y - y - y = 4 2 3 ï 1 ïï2 y2 + y3 = 5 í ï- y1 + y2 - 2 y3 = -13 ï4 y1 - 2 y2 - y3 ³ 7 ï ïî y1, y2 ³ 0 64
Самостоятельная работа № 3 Найти ситуацию равновесия и значение игры в смешанных стратегиях при помощи ЛП. Сделать проверку
æ2 ç ç0 ç1 è æ1 ç ç4 ç2 è æ1 ç ç2 ç8 è
1 - 3 1ö æ2 ÷ ç 5 4÷ ç1 - 2 3 ÷ø çè 4 6 0 -1ö æ 2 ÷ ç 7 3 ÷ ç-1 1 - 6 ÷ø çè 1 11 2 5 ö æ2 ÷ ç 1 3 ÷ ç0 - 2 19 ÷ø çè 3
2 3 1 5 7 1 2 5 12 2 2 8
3 4 5 4 ö æ 2 - 1 - 1ö æ 2 - 1 3 ö æ 4 2 3 ö ÷ ç ÷ ç ÷ ç ÷ 4 ÷ ç 1 3 1 ÷ ç 3 1 - 5 ÷ ç 2 1 - 1÷ 1 ÷ø çè 1 1 5 ÷ø çè 4 - 1 1 ÷ø çè 1 3 4 ÷ø 8 9 10 1 ö - 1ö æ 1 0 1ö æ 2 1 - 1 ö æ 2 3 ÷ ç ÷ç ÷ ç ÷ 1 ÷ ç 2 1 1÷ ç 1 3 - 4÷ ç 1 - 1 2 ÷ - 8 ÷ø çè - 3 3 3 ÷ø çè 1 12 11 ÷ø çè 3 - 6 - 5 ÷ø 13 14 15 3 ö æ -1 4 2 ö æ 3 2 - 1ö æ 4 2 3 ö ÷ ç ÷ ç ÷ ç ÷ - 1÷ ç - 3 7 - 3 ÷ ç 2 1 3 ÷ ç 2 1 - 1÷ - 1÷ø çè 1 - 1 - 1 ÷ø çè 1 1 - 3 ÷ø çè 1 3 4 ÷ø
Самостоятельная работа № 4 Найти ситуацию равновесия и значение игры в смешанных стратегиях графоаналитическим методом 1
2
æ2 æ 2 - 3 1ö ç -1 ÷÷ ç çç è 0 5 4ø ç 1 è 6 æ 1 0ö ç ÷ æ- 2 ç 2 1 ÷ çç ç - 3 5÷ è 1 è ø 11 æ 12 4 10 ö çç ÷÷ è - 4 8 18 ø
3
4
5
æ- 2 1 ö æ - 2 3 4ö ç 1 -1÷ æ 2 ÷ çç çç ÷÷ ç è 1 1 4ø ç 3 - 6÷ è 4 ø è 8 9 æ1 3ö æ2 4 3 ö ç 2 5 ÷ æ 2 1 - 1ö ç 1 ÷ ç ÷ ç ÷ ç - 2 1 ÷ø ç 4 2 ÷ çè 1 3 4 ÷ø ç 1 è ø è 1ö ÷ 2÷ 5 ÷ø 7
12 æ1 2ö ç ÷ ç2 1÷ ç 0 2÷ è ø
13 æ -1 - 2 2 ö çç ÷÷ è - 3 7 - 3ø 65
14 æ 1 - 2ö ç ÷ ç0 6 ÷ ç 4 -1÷ è ø
4 3ö ÷ - 2 1 ÷ø
10 1ö ÷ 3÷ 12 ÷ø 15
æ4 - 2 3 ö çç ÷÷ è 2 1 - 1ø
Самостоятельная работа № 5 Рассмотреть игру на доминирование и найти ситуацию равновесия 1 æ 2 - 3 1 -1ö ç ÷ 4 2 ÷ ç- 3 1 ç 1 - 2 3 -1÷ çç ÷÷ è 1 - 4 - 7 - 5ø
2
æ 2 - 4 3 - 3 5ö æ 1 2 3 5 2ö ç ÷ ç ÷ 5 3÷ ç 2 - 1 - 1 1 7 ÷ ç1 2 1 ç 1 - 2 4 - 34 0 ÷ ç 1 3 4 6 1 ÷ è ø è ø 5
13 æ2 ç ç0 ç2 çç è3
2 1 4ö ÷ 2 -1 3 ÷ 5 1 11÷ ÷ 8 1 18 ø÷
4 æ0 ç 8 ç4 ç10 - 18 çç 7 è1
10 1 ö ÷ 18 7 ÷ 40 17 ÷ ÷ 17 3 ÷ø
8
æ1 2 2 öç æ2 - 3 1 ç ÷ç 2 1 5 4 5 3 ç ÷ ç-1 ç 4 1 - 3 - 4 - 2÷ ç è øç 1 è
æ2 1 -1 1ö ç ÷ ç1 3 - 4 2÷ ç 1 12 11 3 ÷ è ø
6
3 ö æ2 -1 3 ÷ ç ç3 1 - 5 0 ÷ ç4 -1 1 5 ÷ ÷÷ çç è 1 3 - 13 - 6 ø
7
10
3 1
4 æ2 -1 -1 2 ö ÷ ç 1 5 ÷ ç1 3 ç1 1 5 - 7÷ ÷÷ çç è 2 3 - 3 14 ø
Самостоятельная работа № 6 Найти значение игры в смешанных стратегиях с помощью итеративного метода
9
2 2 3 4 öæ1 ÷ç 1 -1 2 0 ÷ç2 2 1 1 3 ÷ç3 ÷ç 5 - 8 - 5 - 12 ÷ø èç14 11
1 æ1 9 ç 1 ç2 1 ç1 -1 2 çç è3 - 6 - 5
3
4
3ö ÷ 3÷ 5÷ ÷ 6 ø÷
æ 1 - 2 -1 2 ö ç ÷ 0 2 5 ÷ ç 3 ç 4 -2 5 7 ÷ çç ÷÷ è- 2 0 - 4 - 7ø
5
æ 2 - 3 1 ö æ 2 3 4 ö æ 2 - 1 - 1ö æ 2 - 1 3 ö æ 4 2 3 ö ç ÷ ç ÷ ç ÷ ç ÷ ç ÷ ç 0 5 4 ÷ ç 1 1 4 ÷ ç 1 3 1 ÷ ç 3 1 - 5 ÷ ç 2 1 - 1÷ ç1 - 2 3÷ ç 4 5 1÷ ç1 1 5 ÷ø çè 4 - 1 1 ÷ø çè 1 3 4 ÷ø è ø è ø è 6 7 8 9 10 æ1 0 -1ö ç ÷ ç4 7 3 ÷ ç 2 1 - 6÷ è ø 11 æ1 2 5 ö ç ÷ 3÷ ç2 1 ç 8 - 2 19 ÷ è ø
æ 2 1 - 1ö ç ÷ ç-1 2 1 ÷ ç 1 5 - 8÷ è ø 12
æ 1 0 1ö æ 2 1 - 1 ö ÷ ç ÷ ç ç 2 1 1÷ ç 1 3 - 4÷ ç - 3 3 3 ÷ ç 1 12 11 ÷ ø è ø è 13 14
1 ö æ2 3 ç ÷ ç1 -1 2 ÷ ç 3 - 6 - 5÷ è ø
2 ö æ 3 2 - 1ö æ 2 2 3 ö æ -1 4 ÷ ç ç ÷ ç ÷ ç 0 2 - 1÷ ç - 3 7 - 3 ÷ ç 2 1 3 ÷ ç 3 8 - 1÷ ç 1 - 1 - 1 ÷ ç 1 1 - 3 ÷ ø è è ø è ø
12
14
66
0 1 -1 ö ÷ 1 1 5 ÷ 3 3 -8 ÷ ÷ 7 12 - 35 ÷ø
2
æ1 2 5 4 ö ÷ ç ç2 1 3 1 ÷ ç 8 2 19 11÷ ø è 15 7 ö æ1 4 2 ç ÷ 3 10 ÷ ç3 7 ç1 -1 -1 - 4÷ çç ÷ 3 ø÷ è2 3 1 67
15 æ4 2 3 ö ç ÷ ç 2 1 - 1÷ ç1 3 4 ÷ è ø
ОГЛАВЛЕНИЕ
Рекомендуемая литература 1. Воробьев Н. Н. Философская энциклопедия. – М., 1970. – Т. 5. – С. 208– 210. 2. Воробьев Н. Н. Основы теории игр: бескоалиционные игры. – М., 1984. 3. Дж. Ролз. Теория справедливости. – Новосибирск: Изд-во НГУ, 1995. 4. Дюбин Г. Н., Суздаль В. Г. Введение в прикладную теорию игр. – М.: Наука, 1981. 5. Петросян Л. А., Зенкевич Н. А., Семина Е. А. Теория игр. – М.: Высшая школа, 1998. 6. Печерский С. Л., Беляева А. А. Теория игр для экономистов. – СПб.: Издво Европейского университета, 2001. 7. Полтерович В. М. Кризис экономической теории // Труды семинара «Неизвестная экономика». – М.: ЦЭМИ РАН, 1997. 8. Aumann R. J. Lectures on Game Theory. – San Francisco: Westview Press, 1989. 9. Dixit A., Nalebuff B. Thinking Strategically: The Competitive Edge in Business, Politics and Everyday Life. – N.Y.: Norton, 1991. 10. Kreps D. M. A Couse in Microeconomic Theory. – Princeton University Press, 1990. 11. Maynard Smith J. The Theory of Game and Evolution in Animal Conflicts // Journal of Theoretical Biology. – 1974, 47. – 209–221. 12. Moulin H. The Strategy of Social Choice. Advanced Textbooks in Economics. N 18. – Amsterdam: North-Holland, 1983. 13. Moulin H. Game Theory for Social Sciences. – N.Y.: University Press, 1986. 14. Ordeshook P. Game Theory and Political Theory. – N.Y.: University Press, 1978. 15. Ordeshook P. Game Theory and Political Theory: An Introduction. – Cambrige University Press, 1986. 16. Ordeshook P. A Political Theory Primer. – N.Y.; London: Routledge, 1992. 17. Riker W. The Theory of Political Coalitions. – New Haven, 1962. 18. Riker W., Ordeshook P. Introduction to Positive Political Theory. – New Jersey: Prentice-Hall, 1973. 19. Shubik M. Game Theory in the Social Sciences. – Princeton University Press, 1984. 20. Swan A. de. Coalition Theories and Cabinet Formations. – Amsterdam: NewHolland, 1973. 21. Van Deemen Ad. M. A. Coalition Formation and Social Choice. – Dordrecht: Kluwer Academic Publishers, 1997.
68
Занятие № 1 ................................................................................................................. 3 1.1. Содержание теории игр .................................................................................... 3 1.2. Классификация игр ........................................................................................... 4 1.3. Игра в нормальной форме ................................................................................ 6 1.4. Равновесие по Нэшу ......................................................................................... 7 1.5. Оптимальность по Парето. ............................................................................ 10 Занятие № 2 ................................................................................................................ 11 2.1. Антагонистические игры. Седловая точка .................................................... 11 2.2. Принцип максмина и минимакса .................................................................. 13 Занятие № 3 ............................................................................................................... 17 3.1. Смешанные стратегии матричных игр ......................................................... 17 3.2. Ситуация равновесия в смешанных стратегиях .......................................... 20 3.3. Свойства оптимальных смешанных стратегий ............................................ 22 3.4. Равновесие по Нэшу в смешанных стратегиях в биматричной игре ......... 25 Занятие № 4. Нахождение значения игры при помощи линейного программирования (ЛП) .......................................................................................... 29 Занятие № 5. Графоаналитический метод решения (2 ´ n )- либо
(m ´ 2) - матричных игр ........................................................................................... 38 Занятие № 6 ............................................................................................................... 43 6.1. Доминирование стратегий в биматричной игре .......................................... 43 6.2. Доминирование стратегий в антагонистической игре ................................ 45 Занятие № 7. Итеративные методы решения матричных игр .............................. 50 7.1. Итеративный метод Брауна – Робинсона (метод фиктивного разыгрывания) ........................................................................................................... 50 7.2. Монотонный итеративный алгоритм решения матричных игр ................. 53 Приложение ............................................................................................................... 59 Рекомендуемая литература....................................................................................... 68
69
ДЛЯ ЗАПИСЕЙ
Учебное издание Ксения Владимировна Григорьева БЕСКОАЛИЦИОННЫЕ ИГРЫ В НОРМАЛЬНОЙ ФОРМЕ Часть 1 Редактор О. Д. Камнева Корректор К. И. Бойкова Компьютерная верстка И. А. Яблоковой
Подписано к печати 19.11.2007. Формат 60 ´ 84 1/16. Бум. офсетная. Усл. печ. л. 4,5. Уч.-изд. л. 4,62. Тираж 200 экз. Заказ 209. «С» 95. Санкт-Петербургский государственный архитектурно-строительный университет. 190005, Санкт-Петербург, 2-я Красноармейская, 4. Отпечатано на ризографе. 190005, Санкт-Петербург, 2-я Красноармейская, 5.
70
71
ДЛЯ ЗАПИСЕЙ
72