Существует постоянная проблема различения корреляции и причинно-следственной связи. Пример: вы можете думать, что нет никакой корреляции между нападениями акул и продажами мороженого, пока не поймете, что есть еще один фактор, обеспечивающий связь, – высокие температуры побуждают больше людей покупать мороженое, а также в поисках прохлады окунаться в море. Таким образом, эта «скрытая переменная» – температура – на самом деле является причиной очевидной корреляции между мороженым и травмами. Кроме того, избыток информации имеет тенденцию вести себя как недостаток. На самом деле иметь слишком много данных может быть хуже, чем не иметь данных вообще[239]. Используя результаты из различных областей математики – эргодической теории, теории Рамсея и алгоритмической теории информации, – можно точно показать, что большие базы данных содержат произвольное количество корреляций, которые быстро растут с увеличением количества, а не характера данных. Эти корреляции возникают даже в больших и случайно сгенерированных базах данных, а значит – большинство корреляций являются ложными[240].
Почему, учитывая все эти недостатки, использование ИИ для анализа больших данных так соблазнительно? Одна из причин заключается в том, что, как мы обсуждали ранее, биологические теории редко достигают уровня общности и силы, наблюдаемого в физике. Большая часть биологии и медицины опирается на объяснения post hoc – сделанные после того, как мы узнали ответ. И снова причина сводится к одному фактору: сложности. Биологические системы, особенно человеческое тело, вполне могут быть более сложными, чем огромные структуры света и тьмы, которые мы называем космосом[241].
Искусственный интеллект будет играть важную роль в проектах цифровых двойников человеческого тела для создания нового поколения по-настоящему персонализированной и прогностической медицины. Искусственный интеллект, особенно машинное обучение, уже с некоторым успехом используется в медицине в различных контекстах, хотя возможности машинного обучения явно ограничены. Суррогаты ИИ также будут иметь решающее значение для виртуального человека. И, как мы отмечали ранее, сочетание ИИ и механистического понимания – большой ИИ – окажется гораздо более мощным, когда итерационный цикл позволит проверять гипотезы ИИ в симуляциях, основанных на физике, и использовать результаты физических методов для обучения ИИ[242]. Таким образом, влияние ИИ может быть трансформировано, не в последнюю очередь в проекте виртуального человека.
Большой ИИ, или машинное обучение на основе физики, уже представляет собой важное расширение обычного ИИ и широко используется от материаловедения до физики плазмы и цифровых двойников[243]. Например, в гидродинамике так называемое гибридное моделирование, сочетающее моделирование на основе физики и моделирование на основе данных, показало преимущества перед использованием моделей, основанных на чистой физике или машинном обучении[244]. В области разработки лекарств этот подход использовался, например, для прогнозирования устойчивости к противомикробным препаратам[245], классификации формы ферментов[246] и прогнозирования способа связывания белков с лекарствами-кандидатами с химической точностью[247].
В США платформа для разработки лекарств на основе искусственного интеллекта под названием ATOM является одной из целевых групп Cancer Moonshot. При поддержке фармацевтической компании GSK, лабораторий Министерства энергетики, Калифорнийского университета в Сан-Франциско и Национальной лаборатории исследования рака им. Фредерика, ATOM стремится интегрировать высокопроизводительные вычисления в передовые алгоритмы машинного обучения, чтобы быстро прогнозировать предположительно миллиарды вариантов лекарств. По словам Эрика Штальберга, директора отдела биомедицинской информатики и обработки данных лаборатории Фредерика, это может существенно сократить время и расходы на их изготовление и тестирование в лаборатории.
Штальберг стал пропагандистом использования высокопроизводительных вычислений после того, как у члена его семьи был диагностирован рак. Его поразил устойчивый разрыв между обещаниями передовых исследований и реальностью больничной помощи[248]. По его мнению, искусственный интеллект может помочь преодолеть этот разрыв. Например, чтобы спрогнозировать и оптимизировать эффективность потенциальных лекарств для конкретного пациента, ученые из Аргоннской национальной лаборатории будут обучать различные алгоритмы на данных об экспрессии генов и моделировать взаимодействие препарата с раковыми клетками на молекулярном уровне. Рик Стивенс из этой лаборатории, с которым мы встречались ранее, надеется, что ATOM «значительно изменит открытие лекарств».