Статьи Соросовского Образовательного журнала в текстовом формате
Описывается применение методов теории многозначных отображений к доказательству существования оптимальных стратегий в теории игр и равновесных цен в математической экономике.
ОБ ОПТИМУМАХ И РАВНОВЕСИЯХВ ТЕОРИИ ИГР И ЭКОНОМИКЕ
В. В. ОБУХОВСКИЙ
Воронежский государственный университет
МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
И ИХ НЕПОДВИЖНЫЕ ТОЧКИ
Пусть заданы два множества X и Y произвольной природы. В математике одним из основных является понятие отображения f : X Y, то есть соответствия, сопоставляющего каждой точке x k X точку f (x) k Y. Мы можем расширить это понятие, определив понятие многозначного отображения F : X Y как соответствия, сопоставляющего x k X некоторое подмножество F (x) # Y.
Есть ли в этом какая-нибудь особая необходимость?
Рассмотрим некоторые примеры.
1. Если f : X Y - некоторое отображение на все множество Y, то обратное отображение f -1 : Y X ', f -1 (y) = {x k X, f (x) = y} является в общем случае многозначным.
2. Пусть X, Y, Z - произвольные множества, а отображения f : X i Y Z, g: X Z таковы, что для любого x k X найдется y k Y такое, что f (x, y) = g(x). Неявная функция, задаваемая f и g, в общем случае есть многозначное отображение F : X Y, F (x) = {y k Y : f (x, y) = g(x)}.
3. Обычна ситуация, при которой некоторая абстрактная система, находясь в начальный момент в состоянии x k X, может двигаться в дальнейшем по различным траекториям. Например, такое положение имеет место, если поведение системы описывается дифференциальным уравнением, не удовлетворяющим условию единственности решения или содержащим управляющий параметр.
Возможности поведения такой системы становятся ясны, если задать ее множество достижимости Q(t, x), то есть множество всех состояний, в которые она может перейти за время t $ 0 из состояния x. Получающееся таким образом многозначное отображение Q называется оператором сдвига.
4. Следующий пример относится к сфере экономической динамики. Пусть в экономической системе вектор xt k R n характеризует произведенный в течение года набор продуктов. Часть из этого набора, yt , идет на потребление, а оставшаяся часть, zt = xt - yt , - на накопление, то есть служит ресурсом для получения нового вектора выпуска xt + 1 . Пара (yt , zt) называется состоянием экономики в момент t. Вложив в накопление ресурс zt , можно к моменту t + 1 произвести один из наборов продуктов в пределах некоторого множества Bt(zt) ? R n. Многозначное отображение Bt : R n R n, называемое производственным, играет важную роль при изучении моделей экономической динамики.
Вернемся к общей ситуации. Пусть X K Y и F : X Y - некоторое многозначное отображение. Точка x k X такая, что x k F (x) называется неподвижной точкой многозначного отображения F. Для того чтобы сформулировать классическую теорему о неподвижной точке многозначного отображения, доказанную японским математиком С. Какутани в 1941 году, выделим специальный тип непрерывности многозначного отображения. Прежде всего для множества A ? R n назовем его e-окрестностью совокупность всех таких точек R n, которые отстоят от него на расстояние меньше e > 0. Скажем, что многозначное отображение F в R n полунепрерывно сверху в некоторой точке x, если по каждому e > 0 можно указать такое d > 0, что образы всех точек, d-близких к точке x, не выйдут из e-окрестности множества F (x). Легко видеть, что, когда отображение F обычное однозначное, мы получаем классическое определение непрерывности "на языке e-d". Многозначное отображение, полунепрерывное сверху в каждой точке, называется полунепрерывным сверху.
Напомним также, что множество M ? R n называется замкнутым, если оно содержит все свои предельные точки.
Теорема Какутани. Если M ? R n - выпуклое замкнутое ограниченное подмножество, то каждое полунепрерывное сверху многозначное отображение F : M M такое, что образ F (m) каждой точки m k M является выпуклым замкнутым множеством, имеет хотя бы одну неподвижную точку.
Эта теорема играет ключевую роль в доказательстве существования оптимумов и равновесий в теории игр и математической экономике, к рассмотрению которых мы и переходим.
ЧТО ЗНАЧИТ ИГРАТЬ ОПТИМАЛЬНО
Математическая теория игр имеет дело с ситуациями, когда интересы двух или нескольких участников (будем называть их игроками) не совпадают или даже прямо противоположны. Такие ситуации называют конфликтными. Кроме игр в обычном смысле, таких, как шахматы или карты, конфликтные ситуации возникают во многих областях экономики, политики и военного дела. Основы теории игр как математической теории были заложены выдающимся математиком XX века Джоном фон Нейманом в 30-х годах и подытожены в фундаментальной монографии "Теория игр и экономическое поведение", которую он опубликовал в 1944 году совместно с экономистом О. Моргенштерном.
Простейшая схема ситуаций, рассматриваемых в теории игр, обманчиво проста. Представим себе, что на каждом поле шахматной доски написано число. Один игрок может выбрать строку, другой - столбец. Результат этих двух выборов определяется числом, находящимся в месте пересечения выбранных строки и столбца. Предполагается, что каждый игрок производит свой выбор, не зная решения противника. Задачей первого игрока является получение максимального числа, а задачей его противника - получение минимального числа. Можно ли указать для каждого из игроков те руководящие принципы, которые должны управлять решениями?
Основным понятием в теории игр является понятие стратегии. Стратегия первого игрока представляет собой полное перечисление всех действий, которые этот игрок предпримет в каждом из возможных в процессе игры положений. Может показаться, что стоило первому игроку выбрать стратегию, как каждый его ход на любой стадии определен независимо от того, как играет противник. Нет, стратегия есть лишь четкое правило, по которому игрок знает, как он будет действовать в любой сложившейся в игре ситуации.
Рассмотрим, например, простейшую игру в "крестики-нолики". Одна из возможных стратегий для игрока, ставящего крестики, может быть описана следующим образом. Первый крестик он ставит в правую верхнюю клетку. Если противник ставит свой нолик в ту же строку, то следующий крестик должен быть поставлен под первым, а если нолик поставлен куда-либо еще, то второй крестик ставится слева от первого. После этого первый игрок должен перечислить всевозможные игровые ситуации, которые могут быть после второго ответа нолика, и дать четкие указания, как поступать в каждой из них. Подобным образом описание стратегии может быть продолжено и далее.
Ясно, что даже в такой простой игре имеется громадное число возможных стратегий и их анализ является непростым делом. Каковы могут быть основные принципы такого анализа?
Представим себе всевозможные стратегии первого игрока как некоторое множество X, а совокупность всех стратегий второго игрока - как множество Y. Игровым правилом для первого игрока может быть названо сопоставление каждой стратегии y k Y второго игрока множества стратегий A(y) ? X, из которых в этом случае будет выбирать свою стратегию первый. Аналогично игровое правило для второго игрока представляет собой множество наилучших ответов B(x) ? Y на применяемую первым стратегию x. Следовательно, игровое правило для первого игрока может быть интерпретировано как некоторое многозначное отображение A : Y X, а для второго - как B: X Y.
Простым примером построения игровых правил может служить ситуация так называемой парной антагонистической игры, когда на произведении пространств стратегий X i Y задана функция игры f (x, y) так, что при выборе первым игроком стратегии x, а вторым - y выигрыш первого равен f (x, y), а выигрыш второго прямо противоположен и равен - f (x, y). Таким образом, первый игрок стремится максимизировать функцию f, а второй - минимизировать ее. В этом случае игровые правила могут быть заданы явным образом:
при условии, конечно, что указанные максимумы и минимумы существуют.
Итак, предположим, что игровые правила обоих игроков заданы. Есть ли для каждого из игроков какие-то стратегии, которые можно было бы назвать оптимальными?
Пару стратегий x0 k X, y0 k Y назовем равновесными, если они удовлетворяют включениям
x0 k A(y0),
y0 k B(x0).
Ситуация действительно, как мы видим, равновесна: стратегия x0 является одним из сильнейших ответов на применяемую вторым игроком стратегию y0 , в то время как y0 - одно из сильнейших возражений на стратегию x0 .
Когда можно гарантировать существование равновесных стратегий? Чтобы ответить на этот вопрос, обратим внимание на то обстоятельство, что пара стратегий x0 , y0 равновесна тогда и только тогда, когда точка (x0 , y0) является неподвижной для многозначного отображения A i B : X i Y X i Y, определенного как
(A i B )(x, y) = A(y) i B(x).
Это дает возможность прямо применить для доказательства существования равновесных стратегий теорему Какутани. В самом деле, справедливо следующее утверждение.
Теорема о равновесных стратегиях. Пусть пространства стратегий X, Y являются выпуклыми замкнутыми ограниченными подмножествами в конечномерных пространствах R n и R m соответственно. Если игровые правила A(y) и B(x) являются полунепрерывными сверху многозначными отображениями с выпуклыми замкнутыми значениями, то в игре существуют равновесные стратегии.
Действительно, можно показать, что в этом случае для многозначного отображения A i B : X i Y X i Y выполнены все условия теоремы Какутани.
Частным случаем теоремы о равновесных стратегиях является теорема о минимаксе для парных антагонистических игр.
Теорема о минимаксе. Пусть в парной антагонистической игре пространства стратегий X, Y являются выпуклыми замкнутыми ограниченными подмножествами конечномерных пространств R n и R m соответственно, а функция игры f (x, y), заданная на X i Y, непрерывна, выпукла относительно y для каждого x, то есть
f (x, ly1 + (1 - l)y2) # l f (x, y1) + (1 - l) f (x, y2)
для любых x k X ; y1 , y2 k Y и произвольного числа l, 0 # # l # 1, и вогнута относительно x для каждого y, то есть
f (lx1 + (1 - l)x2 , y) $ l f (x1 , y) + (1 - l) f (x2 , y)
для любых x1 , x2 k X ; y k Y и произвольного числа l, 0 # # l # 1.
Тогда в игре существует хотя бы одна пара равновесных стратегий x0 k X ; y0 k Y, которые к тому же удовлетворяют соотношению минимакса
Идея доказательства этого утверждения состоит в том, что при наложенных требованиях игровые правила A и B, определенные соотношениями (1), удовлетворяют условиям теоремы о равновесных стратегиях.
На первый взгляд сфера практических применений приведенных выше теорем представляется чрезвычайно узкой прежде всего из-за ограничительного условия выпуклости пространств стратегий. Ведь в самом деле в реальных ситуациях число стратегий у каждого игрока хотя и может быть чрезвычайно велико, но все же оно конечно. Ведь даже в шахматах количество всех мыслимых позиций небезгранично!
Джон фон Нейман предложил следующую интерпретацию, которая снимает эту трудность. Пусть игрок имеет конечное множество стратегий x1 , x2 , _, xk , которые рассматриваются как векторы некоторого конечномерного пространства R n. Рассмотрим множество X всевозможных линейных комбинаций векторов x1 , x2 , _, xk вида
коэффициенты которых удовлетворяют соотношениям li $ 0 для всех i = 1, 2, _, k и таковы, что Нетрудно проверить, что множество X выпукло, замкнуто и ограничено, то есть удовлетворяет условиям указанных выше теорем. Оно называется выпуклой замкнутой оболочкой элементов x1 , x2 , _, xk .
Будем рассматривать элементы множества X как смешанные стратегии, то есть будем считать, что игрок не выбирает единичную стратегию, как ранее, а применяет все стратегии и выбирает лишь вероятности, с которыми он будет использовать их. В этом случае получаемый выигрыш также рассматривается в усредненной, статистической форме. Одним из удобств применения смешанных стратегий является то, что применение смешанных стратегий позволяет игроку наилучшим образом скрыть свои намерения от партнеров. В самом деле, выбирая различные стратегии случайным образом так, что известны лишь их вероятности, игрок не может предполагать, что противник узнает применяемую им стратегию, поскольку она и ему самому точно неизвестна.
"НЕВИДИМАЯ РУКА" АДАМА СМИТА
Мы будем рассматривать децентрализованные экономические системы. Это понятие означает, что каждый из участников такой системы действует исключительно в своих собственных интересах, не обладая какими-либо знаниями о глобальном состоянии экономики или сведениями о поведении других участников. Как же может функционировать такая экономика? Это парадоксальное свойство впервые описал знаменитый английский экономист Адам Смит, который указывал в своей книге "Богатство народов" (1778) :
"Каждый индивидуум стремится использовать свой капитал так, чтобы достичь наибольшей выгоды. Он обычно не заботится о благе общества и даже не представляет себе, насколько его действия этому способствуют. Он стремится только к своей собственной безопасности, только к своей собственной выгоде. И он руководится при этом невидимой рукой с тем, чтобы содействовать реализации цели, достижение которой не входило в его намерения. Действуя в своих личных интересах, он часто гораздо лучше способствует реализации целей общества, чем он в действительности намеревался это сделать".
Но Смит не объяснил, каким образом эта знаменитая невидимая рука управляет, и тем более не дал строгой аргументации в пользу ее существования. Сделать это попытался спустя сто лет французский экономист Леон Вальрас, который предположил, что на самом деле "невидимой рукой" является система цен. Основная идея Вальраса заключалась в том, что при некоторой системе цен индивидуальные планы становятся совместимыми друг с другом. Такая равновесная ситуация называется конкурентным равновесием.
Однако идея Вальраса оставалась в течение многих лет лишь блестящей догадкой и была строго обоснована лишь в 50-е годы нашего века, когда для этого был готов соответствующий математический аппарат. Существенное место в этом аппарате занимает теория неподвижных точек многозначных отображений.
Рассмотрим поближе математический аспект проблемы.
Пусть множество M представляет собой множество всех мыслимых наборов (x1 , x2 , _, xl) потребительских благ (продуктов), которые доступны потребителю; здесь xh символизирует количество h-го продукта в наборе. Пусть в экономической системе присутствует n потребителей, для каждого из которых задано доступное ему множество продуктов Li ? R l, i = 1, 2, _, n.
Пусть набор p = (p1 , p2 , _, pl) характеризует цены на имеющиеся в системе продукты. Поскольку нас интересуют лишь соотношения между этими ценами, а не их абсолютный масштаб, будем считать, что множество всех цен заполняет собой ценовой симплекс
Если задан набор продуктов x = (x1 , x2 , _, xl), то при имеющихся ценах p = (p1 , p2 , _, pl) стоимость этого набора характеризуется, как нетрудно видеть, скалярным произведением
В соответствии с идеей Адама Смита мы полагаем, что каждый участник экономической системы действует независимо от других, и можем представлять его себе просто как автомат, который сопоставляет некоторое подмножество предпочтений Di(p, r) ? Li каждому вектору цен p и имеющемуся доходу r. Иначе говоря, каждый потребитель описывается многозначным отображением Di : M l i R Li . Мы будем полагать это отображение полунепрерывным сверху и имеющим выпуклые замкнутые ограниченные значения.
Доход i-го потребителя при ценах p будем считать равным ri(p). Функции дохода ri : M l R полагаем непрерывными и удовлетворяющими соотношению баланса
означающему, что доход в системе образуется от максимально выгодной продажи доступных потребительских благ и полностью делится между участниками рынка.
Таким образом, совокупный общественный спрос в данной экономической системе при данных ценах может быть выражен многозначным отображением суммарного спроса
Может ли этот спрос быть удовлетворен, то есть может ли данная экономическая система функционировать эффективно? С математической точки зрения это вопрос о существовании таких цен при которых значение многозначного отображения суммарного спроса содержит доступные наборы потребительских благ, то есть пересечение
непусто. Цены называются равновесными. Они и есть та невидимая рука, которая наводит порядок на рынке.
Когда можно обеспечить существование равновесных цен? Основным требованием здесь является закон Вальраса, экономический смысл которого заключается в требовании к участникам рынка жить по средствам, то есть не тратить на приобретение новых товаров больше совокупного дохода. Математически этот закон может быть задан в следующей форме:
Доказательство существования равновесных цен при указанном условии достаточно сложно и опирается в значительной части на теорему Какутани о неподвижной точке.
ЛИТЕРАТУРА
1. Борисович Ю.Г., Гельман Б.Д., Мышкис А.Д., Обуховский В.В. Введение в теорию многозначных отображений. Воронеж: Изд-во Воронеж. ун-та, 1986. 104 с.
2. Карлин C. Математические методы в теории игр, программировании и экономике. М.: Мир, 1964. 838 с.
3. Никайдо Х. Выпуклые структуры и математическая экономика. М.: Мир, 1972. 517 с.
4. Aubin J.-P. Optima and Equilibria. B.: Springer, 1993. 417 p.
Рецензент статьи А.П. Маркеев
* * *
Валерий Владимирович Обуховский, доктор физико-математических наук, профессор кафедры алгебры и топологических методов анализа Воронежского государственного университета. Область научных интересов - нелинейный функциональный анализ и теория оптимизации. Соавтор одной монографии, автор и соавтор 83 научных статей в отечественных и зарубежных журналах.