Мы снова пришли к компромиссу между точностью и скоростью. Вы можете представлять теннисный сет как алгоритм, цель которого – выяснить, кто лучше играет в теннис, равно как Мировая серия – это алгоритм, позволяющий узнать, кто лучше играет в бейсбол. (Спортивное мероприятие – это не только данный алгоритм; оно предназначено для развлечения, получения налоговых поступлений, ослабления недовольства населения и т. д.; но такой алгоритм – один из его аспектов.) Сет в теннисе требует больше времени для вычислений и более точно выявляет мелкие различия между уровнем мастерства игроков; Мировая серия грубее, и здесь работа выполняется быстрее. Разница проистекает из геометрии границы: она квадратная и прямолинейная, как в Мировой серии, или длинная и вытянутая, как в случае теннисного сета? И эти варианты не единственные. Вы можете использовать другие схемы при поиске компромисса между точностью и скоростью с помощью выбора формы. Мне всегда нравилась такая:
В этой системе действует «правило милосердия»: вам засчитывается поражение в серии, если после трех игр вы проигрываете 3:0 (название означает, что аутсайдеру не приходится лишний раз унижаться). С другой стороны, если обе команды выиграли по три игры (что свидетельствует о равенстве сил), то для чемпионства требуется одержать пятую победу. Да, вы потеряете те редкие захватывающие моменты, когда команда отыгрывается после 0:3, как бейсболисты «Бостон Ред Сокс» против «Нью-Йорк Янкиз» в 2004 году, однако такие события случаются редко. И разве это будет слишком высокой ценой за возможность сыграть восьмые матчи и девятый матч «победитель получает все», когда команды одинаково сильны?
Вернемся к го. Мы видели, что исход случайного блуждания может подсказать, где находилась ваша исходная точка. Разумно предположить, что позиция, в которой Акбар с большой вероятностью выиграет при случайных ходах, сохранит это свойство, если он будет по-настоящему настроен на победу. Вы можете это проверить, играя в го с помощью описанной стратегии: на каждом этапе переходите в позицию, у которой самая высокая оценка в пьяном го. Если будете пользоваться этим правилом, то хоть и не обыграете опытного противника, но точно будете играть лучше любого новичка.
Еще выгоднее совместить пьяные спотыкания с анализом дерева вроде того, что мы использовали для игры «Ним». Это выглядит примерно так:
Думаю, пришло время рассказать кое-что о себе. Я не умею играть в го. Партия, в которой кузен Закари сокрушил меня, была последней в моей жизни. Я даже не помню правил. Однако это не имеет значения; я в любом случае могу написать этот раздел о го, потому что дерево сообщает вам, что делать, независимо от того, знаете вы правила или нет. Дерево может быть шашечным, шахматным, деревом «Ним» или го – вы анализируете его совершенно одинаково. Все, что имеет отношение к стратегии, заключено в структуре ветвей и числах на листьях. Важна только геометрия дерева.
Числа на листьях указывают пьяную оценку для соответствующей последовательности ходов. Если Акбар делает ход А, а Джефф отвечает ходом 1, после чего они ходят наугад, то в итоге Акбар выиграет 60 % партий. Таким образом, позиция А1 получает пьяную оценку 0,4.
Однако пьяная оценка самого хода А не настолько проста. Если мы предположим, что пьяный Джефф делает после него случайный ход из трех возможных, то с вероятностью 1
/3 партия перейдет в положение А1, с вероятностью 1/3 – в положение А2 и с вероятностью 1/3 – в положение А3. Из 300 пьяных попыток 100[288] закончатся в А1, и пусть Акбар выиграет из них 60, в А2 – 50 игр из 100, а в А3 – 40 из 100. В общей сложности он выиграет 150 партий из 300, то есть ровно половину. Поэтому позиция А получает пьяную оценку 0,5. Аналогичным образом мы можем найти оценки для позиции B – это 0,4, и позиции C – 0,9. (Помните, что пьяная оценка для позиции, где ход Джеффа – это вероятность того, что пьяный Джефф победит пьяного Акбара, а не наоборот.)То, как Акбар играет в эту игру, зависит от того, когда начинается пьянка (то есть случайная игра). Если он просматривает только одну ветвь ниже по дереву, считая ее далее случайной, он выберет ход В с наименьшей пьяной оценкой. Но если он продвинется по дереву дальше, то сможет рассуждать следующим образом. Что на самом деле произойдет, если он выберет ход В? Джефф, еще трезвый как стеклышко, выберет какой-нибудь ход В2, дающий Акбару 20-процентный шанс на победу. Это лучше, чем паршивый ход С, где шансы Акбара всего 10 %, что бы Джефф ни делал дальше. Однако ход А дает Джеффу меньше: его лучший ответ – перейти в А1, где у Акбара шанс 60 %. Поэтому Акбар, думающий на два хода вниз по дереву, а не на один, сможет увидеть, что ход А лучше, чем В.