Самая знаменитая и популярная игра в теории игр – это «Дилемма заключенного». Она развилась из эксперимента, который Мелвин Дрешер и Меррил Флад проводили в 1950-х гг. для корпорации RAND. А название ей дала одна история, которую в 1950 г., на лекции, посвященной данному эксперименту на факультете психологии в Стэнфорде, рассказал Альберт Такер. На эту тему написаны бесчисленные статьи, книги и докторские диссертации, и, верю, даже вне университетских стен о ней много кто хоть краем уха да слышал.
Рассмотрим популярную версию игры. В ней участвуют двое с выразительными именами
В таблице, приведенной ниже, кратко представлены правила игры (числа обозначают годы тюремного заключения):
Математики называют такой вид диаграмм «платежной матрицей»: они не любят терминов вроде «таблица» или «схема» – а то еще, не дай бог, обычные люди поймут.
Если честно, пока что история довольно скучна и трудно понять, почему столь многие о ней писали. Она становится интересной, когда мы начинаем раздумывать над тем, как нам играть. На первый взгляд ответ ясен: обоим нужно молчать, провести год в тюрьме за счет налогоплательщиков и выйти на свободу даже раньше, чем в том случае, если бы оба стали примерными заключенными. Конец истории. И все же, будь все так просто, никто бы и не тревожился ни о какой «дилемме заключенного». А правда такова: произойти здесь может что угодно.
Чтобы на самом деле понять дилемму, встанем на минутку на место
«Не знаю, что может сказать
С другой стороны, если он меня выдаст, а я буду молчать, я сгнию в тюрьме. Двадцать лет в аду – это долго. И если он начнет болтать, так надо бы и мне заговорить. Тогда я буду сидеть только 18 лет. Лучше, чем 20, правда?
Есть! Я понял! Лучше всего предать! Ведь тогда я либо не пойду в тюрьму, либо просижу на два года меньше, а два года – это 730 дней на свободе! Какой я умный!»
Как сказано выше, это симметричная игра: иными словами, оба игрока в равных условиях. Конечно же это означает, что
В чем ошиблись
Должно быть, мои умные читатели уже поняли, что этот итог – случай, когда игроки следуют стратегии «предательства» и платят ее цену (18, 18), – тоже является равновесием Нэша.
Равновесие Нэша – это набор стратегий, в соответствии с которыми ни один игрок не сожалеет о выбранной стратегии и ее результатах – постфактум. (Не забывайте, что игроки контролируют только свои собственные решения.)