Короче говоря, нам необходимо расширить знаменитый научный девиз Королевского общества: nullius in verba. Мы не только не должны «верить на слово», мы также должны распространить этот здоровый скептицизм на науку in silico: не верить на слово машинам. Однако когда компьютерным прогнозам удается пройти проверку с точки зрения VVUQ, они становятся «действительными» – эти симуляции заслуживают доверия в понятных пределах. Чтобы решить проблему, Питер возглавил европейский консорциум VECMA, который разработал инструменты для повышения доверия к моделированию[183][184].
В качестве примера работы, проведенной в рамках инициативы Королевского общества, Питер и его коллеги представили обнаруженную неопределенность в прогнозах, вытекающих из моделей, разработанных в Имперском колледже Лондона Центром глобального анализа инфекционных заболеваний Совета медицинских исследований. Эти модели имели огромное влияние, поскольку использовались для оценки эффективности запретов и других строгих мер, принятых в Великобритании для борьбы с пандемией COVID-19.
Чтобы изучить виртуальную пандемию, симуляция CovidSim покрывает страну сетью ячеек. Они содержат всевозможные данные – о плотности населения, возрасте, структуре и размере домохозяйств, а также информацию о школах, университетах и рабочих местах. Генераторы случайных чисел используются, чтобы уловить превратности реальной жизни, например, как приближение к другому человеку меньше чем на 2 м увеличивает вероятность заболеть.
Всего модель CovidSim имеет 940 параметров, хотя подавляющее большинство – до 800 – описывают численность населения и демографию, распределение размеров домохозяйств, спрос на больницы и т. д. В основе модели лежат всего 6 или 7 параметров[185]. Подключив новейшую информацию, команда Имперского колледжа могла предсказать будущий ход пандемии на основе текущего понимания и, что немаловажно, протестировать различные меры по сдерживанию распространения вируса, от закрытия школ до использования масок. Модель оказалась чрезвычайно влиятельной.
Изучая CovidSim, Питер работал с коллегами из Университетского колледжа Лондона, Центра математики и информатики в Нидерландах, Лондонского университета Брунеля, Познаньского центра суперкомпьютеров и сетевых технологий в Польше и Амстердамского университета[186]. Они исследовали, как количественная оценка неопределенности в параметрах влияет на прогнозы, тысячи раз запуская модель CovidSim в ансамблевом режиме на суперкомпьютере Eagle в Познани. Имея 940 параметров, команда VECMA столкнулась с так называемым «проклятием размерности» – существует так много вариантов, что даже у суперкомпьютера нет ни времени, ни возможностей изучить их все. Для количественной оценки неопределенности команда Питера сосредоточилась на 60 наиболее важных параметрах и скорректировала их, показав, что 19 прогнозов доминировали, и, более того, неопределенности в модели были увеличены на 300 %. Распределение смертности, предсказанное моделью, было не «нормальным» (так называемая кривая Гаусса или колоколообразная кривая), а однобоким с «тяжелым хвостом», поэтому ожидаемые результаты были далеки от прогнозов, основанных на средних значениях входных параметров.
Их окончательный вердикт заключался в том, что, хотя CovidSim – сложный инструмент, его можно улучшить, добавив реалистичную случайность и используя ансамбли, где модель запускается много раз – с разными параметрами, – а затем взвешивается вероятность возникновения определенных сценариев, как это делается в прогнозировании погоды. Они пришли к выводу, что моделирование дает несовершенную картину пандемии. Опять же, чтобы доверять своим предсказаниям, их нужно формулировать с учетом вероятностей[187].
Бывают такие проблемы, что даже при наличии мощной экзафлопсной машины, надежного программного обеспечения и безупречных людей для достижения успеха просто не хватает времени. Например, алгоритм поиска наибольшего числа в списке из N чисел имеет время работы, пропорциональное N. Алгоритм, который, скажем, вычисляет расстояния полета между N аэропортами на карте, имеет время работы, пропорциональное N в степени 2, или N в квадрате, поскольку для каждого аэропорта он должен определить расстояние до каждого из остальных.
Ученые-теоретики-компьютерщики классифицируют алгоритмы в зависимости от времени их выполнения, которое измеряется по количеству данных N, которыми алгоритмы манипулируют. Алгоритмы, время работы которых пропорционально N, возведенному в степень, называются «полиномиальными», или P. Если алгоритму, время выполнения которого пропорционально N, требуется секунда для выполнения вычислений, включающих 100 элементов, то есть N = 100, то алгоритм, время выполнения которого пропорционально N в кубе, занимает почти 3 ч.