Большинство игроков очень быстро понимают правила игры – в конце концов, они ведь руководители, – но это редко им помогает. Они не видят подвоха, производят те же расчеты, как и те, кто играет однократно, и приходят к выводу о том, что, независимо от действий другого игрока, их лучший выбор – карта «П». Они играют, теряют $18, потом еще $18, потом еще $18 и так далее – и понимают, что эта стратегия в корне неправильна! Ведь если они 50 раз потеряют по $18, они не только лишатся всех своих карманных денег (исходных $500), но и останутся должны $400 устроителю эксперимента! Именно на этой стадии, чаще всего после третьего раунда, мы впервые замечаем попытки сотрудничества. Игроки стратегически выбирают карту «М» и надеются на то, что их партнер поймет намек и поступит так же, что позволит им сохранить большую часть из их $500.
Видимо, Абба Эвен, государственный деятель Израиля, ныне покойный, был прав, когда сказал: «История учит нас тому, что и люди, и народы поступают разумно, лишь когда исчерпают все остальные альтернативы».
В итеративной версии «Дилеммы заключенного» есть подвох, когда мы близимся к последнему, 50-му, раунду. На этом этапе я мог бы сказать себе так: зачем сигналить о том, будто мне нужно содействие? Уже нет никаких причин! Что бы ни выбрал другой, если я предам, то потеряю меньше. Но, как только вы начнете так думать, вы рискуете попасть в «бесконечную петлю»: я уверен, что итог 50-го раунда неизбежен, значит, незачем сотрудничать и в 49-м, и, видимо, в нем мы и предадим друг друга, а потому предам-ка я первым! По такой логике то же соображение теперь применимо и к 48-му раунду! И у нас новый парадокс: если оба игрока столь рациональны, возможно, им следует предать друг друга с самого начала!
Видите? Обратный расчет может не принести должной выгоды. Он только все осложняет. Это «парадокс неожиданного экзамена» или «парадокс висельника», и вот в чем его суть. В пятницу, на последнем уроке, учитель объявляет, что на следующей неделе состоится неожиданный экзамен. Все ученики бледнеют от страха, но Джо просит слова. «Сэр! – говорит он. – Так не получится! У нас не может быть неожиданного экзамена на следующей неделе!» «Почему?» – спрашивает учитель. «Так ясно же, – отвечает Джо. – В пятницу его быть не может. Ведь если его не будет в четверг, тогда мы будем знать, что он пройдет в пятницу, и это уже не будет сюрприз. То же самое и в четверг – ведь если его не будет в понедельник, во вторник и в среду, а пятницу мы уже вычеркнули, то он должен пройти в четверг – и теперь мы о нем знаем, так что вы нас не удивите, сэр!»
Хотя не очень понятно, что такое «неожиданный экзамен», да и Джо был весьма убедителен, учитель все же удивил учеников, слишком поверивших в логику Джо, и устроил экзамен во вторник.
Та же логика применима к «Дилемме заключенного» с определенным числом раундов (на мастер-классах я обычно не разглашаю заранее их число), поскольку игроки начинают думать так же, как Джо о своем экзамене. Но этот перебор с возвратами только заводит в тупик.
Вышеупомянутый Роберт Аксельрод – профессор государственной политики в Мичиганском университете. Но он изучал и математику и прославился тем, что принял участие в разработке компьютеризованных вариантов «Дилеммы заключенного»; о них можно прочесть в его книге «Эволюция сотрудничества», вышедшей в 1984 г.[15]
. Он просил многих людей, умных и мудрых, выслать ему искусные стратегии для итеративной версии «Дилеммы заключенного», определив правила игры так: если оба игрока хранят молчание, каждый получает 3 очка; если оба выбирают роль предателей, каждый получает 1 очко; если они совершают разный выбор, предатель получает 5 очков, а стойкий и молчаливый – 0. Аксельрод объявил, что для каждой игры отведено 200 раундов, и попросил предложить стратегию. Но что он имел в виду, говоря о «стратегии»?В итеративной версии игр, основанных на «Дилемме заключенного», есть множество стратегических возможностей. «Всегда молчать» – одна из простейших стратегий, но она, несомненно, неразумна: предательство остается безнаказанным и второй игрок может легко сколотить капитал. «Всегда предавать» – гораздо более крутая стратегия. Можно выбирать всевозможные, даже самые странные стратегии: чередовать предательство с молчанием, подбрасывать монетку, выбирать случайным образом…
Вам, мой искушенный читатель, уже, наверное, ясно, что лучшая стратегия – отвечать на действия противника. И правда, на первых олимпиадах, где играли в компьютерные версии игр, основанных на «Дилемме заключенного», стратегия, приводящая к победе, была описана как «око за око». Кроме того, она была самой короткой: четыре строки на бейсике.