Книга "Теория игр"
Читая эту книгу, создается впечатление, что теорией игр можно объяснить все, использовать везде, в любых сферах и спорах. Но в жизни почему-то мало кто вообще об этом думает. Видимо, не все так просто.
Большинство при упоминании теории игр вспомнит только заезженную везде дилемму заключенных и на этом наши полномочия все. Я обладал таким же багажом знаний до прочтения, хотя в институте у меня была и статистика, и теория вероятности, а там похожие темы рассматривались.
В этой книге авторы охватывают очень много интересных примеров из жизни, которые решают этой теорией. Я вынес несколько правил и принципов для себя, которые можно использовать в повседневных задачах, а также приметил самые актуальные примеры. Книга сама по себе не маленькая, в основном за счет того, что в ней очень много описаний разных ситуаций. Почти все темы подробно раскладываются по полочкам, то есть точно нельзя сказать, что это какая-то специализированная литература. Как раз для таких тупых обывателей как я.
Тут и про то, почему бюрократические системы бывают такие долгие, максимально неудобные и отнимающие кучу времени; про то почему мы печатаем именно на QWERTY клавиатурах; почему необязательно следить за всеми соблюдениями правил ПДД; про различные виды аукционов (некоторые вообще кажутся безумными идеями); про проблемы привычного голосования с ограниченным выбором кандидатов; про линейные и нелинейные системы поощрений и так далее. Все это достаточно интересно.
Статистические данные говорят об отсутствии у игроков способности делать длинные серии удачных бросков, однако они и не опровергают возможность того, что игры со “счастливой рукой” действительно могут так или иначе “подогреть” игру. Различие между серией удачных бросков и “счастливой рукой” возникает в силу взаимодействия между стратегией нападения и стратегией защиты. Предположим у Эндрю Тоуни действительно “счастливая рука”. Разумеется в таком случае игроки команды соперника начнут оттеснять его от мяча, что может снизить процент попаданий мяча в корзину.
Парусная регата дает возможность проанализировать интересный обратный вариант стратегии следования за лидером. Как правило, лидирующий парусник копирует стратегию корабля, идущего вслед за ним. Лидер копирует действия отстающего, даже если его стратегия явно неэффективна. Потому что если вы уже занимаете первое место, самый верный способ оставаться первым - имитировать действия тех, кто идет следом за вами. (Эта стратегия не работает, если в соревновании более двух участников)
Объем торгов фьючерсными контрактами на бирже говорит о том, что большинство людей, которые покупают и продают их, - это трейдеры, а не фермеры и производители. Для них эта сделка представляет собой игру с нулевой суммой. Когда участники сделки соглашаются заключить ее, каждый из них считает, что заработает деньги. Следовательно, один из участников сделки ошибается. Таков характер игры с нулевой суммой: выигрывает только одна сторона.
Стратегическое мышление подразумевает, что вы должны приложить максимум усилий к тому, чтобы понять позицию и взаимодействие между другими участниками игры, в том числе позицию тех игроков, которые предпочитают молчать.
Общий принцип всех игр с последовательными ходами гласит, что каждый игрок должен проанализировать будущие ответные действия других игроков и эту информацию использовать для поиска своего оптимального хода в настоящем. Смотрите вперед и рассуждайте в обратном порядке.
В ситуации, когда решение принимает один человек, наличие большей свободы действий не принесет никакого вреда. Но в играх дополнительная свобода действий может навредить, поскольку способна повлиять на поведение других участников игры. Более того, связывание ваших же рук иногда идет на пользу.
Если вам приходится рисковать, в большинстве случаев лучше сделать это как можно скорее. Это очевидно для тех, кто играет в теннис: всем известно, что нужно рисковать на первой подаче, а вторую следует делать более осторожно. В таком случае, если первая попытка закончится неудачей, это не значит, что все потеряно.
У стратегии сотрудничества есть обратная сторона: стремление избежать предательства. Игрока можно заинтересовать в том, чтобы он выбрал стратегию сотрудничества вместо доминирующей стратегии предательства, пообещав ему достаточное вознаграждение. Кроме того, его можно удержать от применения стратегии предательства с помощью адекватного наказания.
Игра со взносами в общий фонд - это не только объект лабораторных экспериментов и теоретических взысканий; она разыгрывается в реальном мире в тех случаях социального взаимодействия, когда некое общее благо можно создать только благодаря добровольному вкладу членов группы, но доступ к нему нельзя запретить тем членам группы, которые не внесли свой вклад в общее дело. Такая ситуация складывается, например, в случаях борьбы с наводнениями или рационального использования природных ресурсов: дамбы или плотины невозможно построить так, чтобы паводковые воды затопляли поля только тех обитателей деревни, которые не принимали участия в строительстве сооружений. Что касается рационального использования газа и рыбных ресурсов, на практике просто невозможно в будущем не допускать к этим ресурсам тех, кто сверх меры потреблял их в прошлом. Именно это и создает дилемму в игре с участием нескольких игроков: каждый игрок испытывает соблазн уклониться от работы или не делать взнос в общий фонд, рассчитывая на получение выгоды от вклада других участников группы. Когда так рассуждают все игроки, результат совместных действий оказывается совсем небольшим или вообще отсутствует, что негативно сказывается на всей группе.
Люди действительно получают психологическую выгоду или удовольствие, наказывая нарушителей коллективных договоренностей.
Нельзя наказывать кого-то за обман, не установив сам факт обмана. Если обман обнаруживается быстро и безошибочно, наказание может быть незамедлительным и адекватным. Это позволяет снизить выигрыш от обмана и увеличить связанные с ним издержки, а значит, повышает вероятность успешного сотрудничества. Следует отметить, что, когда в одном сегменте рынка работают две-три компании одновременно, они должны установить не только сам факт обмана, но и кем совершен этот обман. В противном случае наказание носит не адресный, а расплывчатый характер и может развязать ценовую войну, которая повредит всем без исключения.
Равновесие Нэша. Результат игры, при котором каждый игрок предпринимает действия, оптимальные с точки зрения его субъективной оценки действия другого игрока, а действия всех игроков соответствуют такой субъективной оценке, можно смело назвать точкой покоя в размышлениях игроков или равновесием данной игры.
Если равновесие подразумевает выбор, очевидный до бесконечности в данном смысле, иными словами, если на нем сходятся ожидания игроков, мы называем это фокальной точкой.
Как найти равновесие Нэша?
Одну за другой исключите из рассмотрения все доминирующие стратегии и стратегии, которые ни при каких условиях не могут быть оптимальными ответными ходами. Исчерпав все простые способы поиска доминирующих или исключения доминируемых стратегий, приступайте к поиску той ячейки таблицы игры, в которой присутствует пара взаимно оптимальных ответных ходов, - это и есть равновесие Нэша для данной игры.
Для начала определите, есть ли у кого-либо из игроков доминирующая стратегия - иными словами, та, которая обеспечивает более выгодный исход игры по сравнению с другими стратегиями этого же игрока независимо от того, какой выбор он сделает. Затем, если у вас есть доминирующая стратегия, примените ее. Если нет, а у вашего соперника есть, исходите из предположения о том, что он ее использует, и выберите оптимальный ответ ход на эту стратегию.
Многие люди, опираясь на свой опыт, интуитивно считают, что в любой игре должен быть победитель и проигравший. Однако в огромном мире стратегических игр сравнительно редко встречаются игры, в которых наблюдается чистый конфликт. В мире экономики, где игроки сознательно идут на компромисс ради взаимной выгоды, возможен такой исход игры, когда выигрывают все. Пример ситуации, в которой все могут проиграть - дилемма заключенных.
Принципы выборочного тестирования на предмет употребления наркотиков аналогичны системе контроля за соблюдением правил парковки. Ежедневная проверка всех сотрудников на наркотики потребована бы слишком больших трат времени и денег. Выборочное тестирование позволяет обнаружить тех сотрудников, которые не способны работать без приема наркотиков, и отбивает у остальных желание употреблять наркотики в свободное от работы время. В этом случае вероятность обнаружения тоже достаточно низкое, но наказание очень строгое. Когда контроль за соблюдением правил носит выборочный характер, наказание должно быть тяжелое преступления. Ожидаемое (в статистическом смысле) наказание должно соответствовать преступлению с учетом вероятности быть пойманным.
Люди, которые стремятся обойти систему контроля за соблюдением правил, используют стратегию выборочного контроля с выгодой для себя. Например, система противовоздушной обороны должны быть способна уничтожить все без исключения атакующие ракеты. Для атакующей стороны самый эффективный с точки зрения затрат способ преодолеть систему противовоздушной обороны сводится к тому, чтобы окружить настоящую ракету группой фальшивых. До тех пор пока обороняющаяся сторона не распознает их совершенно точно, ей придется останавливать все атакующие ракеты - как реальные, так и фальшивые.
Борьба с лишним весом - это игра сегодняшнего “я” человека (которое мыслит в долгосрочной перспективе) против будущего “я”, которое мыслит в краткосрочной перспективе. Обещание сегодняшнего “я” представляет собой обязательство вести себя правильно. Но это обязательство должно быть непреложным: будущее “я” необходимо лишить возможности отказаться от него.
“Если существует система, которая дает деньги всем, кто об этом попросит, найдется много людей, которые будут просить денег.”
Частично эту проблему можно решить введением системы надзора. Для этого необходимо установить негласное наблюдение за работниками, которые подали заявление на выплату пособий без надлежащих на то оснований. Например, если замечено, что работник, который подал заявление о выплатите компенсации в связи с травмой спины, поднимает тяжести, его требования отклоняются.
Такая система надзора обходится слишком дорого, однако анализ стратегий обнаружения информации позволяет предложить методы, которые отличают тех, кто действительно получил травму на рабочем месте, от тех, кто претендует на компенсацию без должных оснований. Например, можно сделать так, чтобы работники, претендующие на выплаты пособий, вынуждены были потратить достаточно много времени на заполнение документов, просидеть целый день в приемной чиновника только для того, чтобы пять минут поговорить с ним, и так далее. Здоровым людям, которые могли бы работать все это время, пришлось бы отказаться от своего заработка, поэтому для них такой способ получения пособий оказался бы слишком затратным. С другой стороны, работники, которые действительно получили травм и утратили способность работать, могли бы потратить какое-то время на все эти формальности. Бюрократические проволочки и неудобства принято считать свидетельством неэффективности работы правительственных органов, но в некоторых случаях это можно использовать в качестве эффективной стратегии решения проблемы связанных с асимметричностью информации.
Принятие QWERTY, бензинового двигателя и легководного ядерного реактора - всего лишь три примера, которые иллюстрируют, как произошедшие в прошлом события влияют на выбор технологий в наши дни, хотя сами исторические причины к этому времени уже потерять свою значимость. Сцепление клавиш, эпидемия ящура и ограниченность пространства на подводных лодках - все это не имеет никакого отношения к выбору между конкурирующими технологиями. Теория игр позволяет сделать важный вывод о необходимости с самого начала осознавать возможность закрепления сложившейся ситуации: если одному из вариантов будет предоставлено достаточно большое исходное преимущество, даже самые лучшие альтернативы могут так и не получить возможности для дальнейшего развития.
Устанавливать допустимую скорость на таком высоком уровне, чтобы все с радостью соблюдали ее нет необходимости. Главное - создать критическую массу водителей, соблюдающих правила ограничения скорости. Следовательно, крайне строгое отслеживание соблюдение правил и взимание жестких штрафов за это на протяжении короткого периода может изменить поведение достаточного числа водителей, для того чтобы создать импульс для соблюдения правил всеми без исключения участниками дорожного движения. В более общем смысле все это позволяет предположить, что короткий, но интенсивный период принуждения к соблюдению правил может оказаться гораздо более эффективным, чем такие же действия, предпринятые с более умеренной интенсивностью на протяжении более длительного периода.
В аукционе Вики все заявки с предложением цены подаются в запечатанных конвертах. Для того чтобы определить победителя, эти конверты открывают, и побеждает тот участник аукциона, предложивший самую высокую цену. но вот в чем хитрость: победитель платит не ту максимальную цену, которую предложил он сам, а вторую цену.
Голландские аукционы отличаются от других тем, что торги на них проходят в обратном порядке. Вместо того чтобы начинать с низкой цены и постепенно ее повышать, в ходе голландского аукциона сначала объявляется самая высокая цена, а затем ставки снижаются. Представьте себе таймер, который начинает обратной отсчет с сотни, а затем отсчитывает 99,98 и так далее. Первый участник аукциона, который остановит таймер, выигрывает аукциона и платит ту сумму, на которой остановился таймер.
В целом вы должны исходить из предположения что ценность предмета торгов для других аукционеров распределена равномерно между его ценностью для и вас и 0. Так, если в торгах кроме вас принимает участие только один покупатель, ценность предмета торгов для него равно половине вашей ценности, если два покупателя - 20 и 40, если три - 15,30,45. Вам необходимо предлагать цену, эквивалентную максимальной ожидаемой ценности предмета торгов для ваших соперников.
Как оказалось более пятидесяти лет назад родилась весьма удачная идея фактически предотвратить любые потери из-за забастовок и локаутов, не меняя при этом относительную силу профсоюзов и работодателей на переговорах. Эта идея заключается в том, что вместо обычной забастовки проводится условная забастовка, во время которой работники продолжают выполнять свои обязанности в обычном режиме, а компания продолжает выпускать продукцию в обычном режиме. Вся хитрость в том, что во время условной забастовки ни одна из сторон не получается никаких денег.
Процедура, которую разработал Кондорсе, позволяет решить проблему голосования во время первичных или даже всеобщих выборов с участием трех или более кандидатов. Кондорсе предлагал определять победителя выборов посредством попарного сравнения кандидатов. При такой системе голосования президентские выборы 2000 года проходили бы так: Буш против Гора, Буш против Нейдера, Гор против Нейдера. Победителем выборов стал бы кандидат с наименьшим максимум голосов против него.
Представьте себе, что Гор победил бы Буша с соотношением голосов 51 против 49; Гор победил бы Вейдера с соотношением 80 против 20, а Буш победил бы Вейдера с соотношением 70 против 30 голосов. В таком случае максимальное число голосов против Гора было бы 49, а это меньше максимального числа голосов против Буша (51) или Вейдера (80). Гор стал бы победителем выборов по этой системе, поскольку он превзошел остальных кандидатов в противостоянии один на один.
Кто-то подумает, что все это очень интересно теоретически, но совершенное неприемлемо на практике. Разве можно предлагать людям голосовать в трех отдельных выбора? А если в первичных выборах принимают участие шесть кандидатов, людям придется голосовать 15 раз, чтобы сделать свой выбор во всех попарных выборах! К счастью, существует простой подход, позволяющий реализовать такую систему голосования на практике. Все, что нужно сделать избирателям, - ранжировать кандидатов в избирательном бюллетене по степени их предпочтительности для избирателя. На основании такого рейтинга компьютер определит итоги голосования по каждой паре кандидатов.
Некоторые журналисты, которые пишут о спорте, вправе считать того или иного кандидата вполне заслуживающим членства в Зале славы, но они не хотят напрасно тратить сивой голос, если он вряд ли наберет нужное число голосов. Такая же проблема возникает во время первичных выборов президента, а также любых выборов, где каждый голосующий имеет право отдать свой голос за ограниченное число кандидатов.
В рыночной экономике действует более естественный механизм стимулирования - стремление к получению прибыли. Однако и эта система работает недельно. Далеко не каждый рядовой сотрудник или менеджер компании в полной мере испытывает на себе влияние конкуренции, бушующей на рынке, поэтому топ-менеджерам приходится изобретать свою систему кнута и пряника, для того чтобы добиться от подчиненных необходимой эффективности труда.
Фиксированная оплата труда не решает вопрос стимулирования, а сдельная вопрос участия. Следовательно, система оплаты труда должна представить собой компромисс между этими двумя крайностями; в примере с вычиткой текста книги студентом это была бы фиксированная сумма плюс бонус за каждую ошибку, которую найдет студент. Такая схема бы обеспечила бы студенту гарантию общей суммы вознаграждения, достаточно привлекательной для того, чтобы он взялся за выполнение работы, а также серьезный стимул для того чтобы вычитывать текст очень внимательно.
Возможно, линейные системы и не обеспечивают дополнительных стимулов в нужные моменты, зато они гораздо более устойчивы к изменению обстоятельств и злоупотреблениям.