Естественно, более глубокий анализ может улучшить результат. Позиция В2 заканчивается для Акбара очень плохо, если разыгрывается наугад. Возможно, это просто объективно неблагоприятный сценарий для Акбара. Однако может оказаться, что в этой позиции у Акбара есть один потрясающий ход и много дрянных. Для Акбара, играющего наугад, такая позиция – плохая, поскольку шансы выбрать этот хороший ход невелики, а вот для Акбара, умеющего смотреть на шаг вперед, она прекрасна.
Подобная смешанная стратегия по-прежнему в значительной степени полагается на полусмехотворный метод пьяного го. Поэтому может показаться удивительным, что всего несколько лет назад компьютерные программы для го[289]
, основанные на подобных методах, были вполне конкурентоспособны на продвинутом любительском уровне.Однако не эта стратегия приводит в действие машины нового поколения, из-за которых игру покинул Ли Седоль. Новые программы все еще применяют функцию, которая оценивает позицию как «хорошая или плохая для Акбара» по какой-то числовой шкале, и ориентируются на эту оценку при выборе следующего хода. Однако механизм вычисления оценки, используемый программой типа AlphaGo, много-много лучше, чем любой, добытый из случайного блуждания. Как построить такой механизм? Ответ (который, я бы сказал, вы уже точно знаете): геометрия. Но геометрия более высокого порядка.
В любой игре – крестики-нолики, шашки, шахматы или го – вы начинаете с геометрии доски. Исходя из нее и правил игры, вы поднимаетесь на один уровень вверх и разрабатываете геометрию дерева, которая в принципе содержит все, что касается идеальной стратегии игры. Однако в тех случаях, когда найти идеальную стратегию слишком сложно по причине вычислений, вы соглашаетесь на стратегию, достаточно близкую к идеальной, чтобы обеспечить высокое качество игры.
Чтобы обнаружить такую стратегию, вам нужно ориентироваться в новой геометрии – геометрии пространства стратегий, – а это место рисовать куда сложнее, чем дерево. И мы пытаемся найти в этом бесконечномерном[290]
абстрактном стоге сена процедуру принятия решений, которая будет лучше, чем все, что могла придумать отточенная практикой интуиция Мариона Тинсли или Ли Седоля.Звучит сложно. Куда нам двигаться дальше? Все сводится к самому грубому и самому мощному методу – проб и ошибок. Посмотрим, как это работает.
Глава 7. Искусственный интеллект как альпинизм
Моя знакомая Мередит Бруссард[291]
, профессор из Нью-Йоркского университета и эксперт в сфере машинного обучения и его влияния на общество, не так давно выступала на телевидении, где ее попросили вкратце объяснить общенациональной аудитории, что такое искусственный интеллект и как он работает.Это не роботы-убийцы, объяснила она ведущим, и не бесстрастные андроиды, чьи умственные способности превосходят наши. «Самое важное, что нужно помнить – сказала она, – что это просто математика и не надо ее бояться».
Удивленное выражение лиц ведущих наводило на мысль, что они предпочли бы роботов-убийц.
Однако ответ Мередит был хорош. И я готов более детально поговорить на эту тему. Так что я принимаю эстафету и попробую объяснить, что такое математика машинного обучения, потому что эта масштабная идея проще, чем вы думаете.
Для начала предположим, что вы альпинист и пытаетесь покорить вершину. Но у вас нет карты. Вас окружают деревья и кусты и нигде нет никакой точки обзора, с которой можно было бы охватить взглядом весь ландшафт. Как добраться до вершины?
Вот одна из стратегий. Посмотрите на уклон у ваших ног. Возможно, поверхность чуть повышается при шаге на север и чуть понижается при шаге на юг. Повернитесь на северо-восток и обнаружите еще более крутой подъем. Поворачиваясь вокруг своей оси, вы проверите все возможные направления движения; среди них точно есть одно с наибольшим уклоном вверх[292]
. Сделайте несколько шагов в этом направлении. Снова повернитесь, выберите самый крутой подъем и продолжите движение.Теперь вы знаете, как работает машинное обучение!
Ладно, возможно, в нем есть нечто большее. Но в основе всего лежит идея под названием