Когда цифровые двойники будут созданы, каждый из них станет символом симбиотических отношений между человеком и его виртуальным собой, питающих друг друга данными и идеями. Возникнут практические вопросы, многие из которых уже нам знакомы. Некоторые ученые приходятся данным ненадежными хранителями, хотя все больше им поклоняются. Исследования, появляющиеся в журналах, ограничиваются выводами или резюме ключевых результатов, или же в них преобладают экперименты, которые дали обнадеживающие результаты, а остальные спокойно игнорируются и остаются неопубликованными. Необработанные данные, включая отрицательные данные неудачных экспериментов, часто опускаются и теряются для научного сообщества, а также для будущих исследователей. К счастью, сейчас ситуация начинает меняться.
Некоторые опасаются, что данные будут потеряны для будущих поколений из-за использования эфемерных носителей записи, устройств хранения данных, которые скоро устареют, и программного обеспечения, разработанного компаниями, чьи бизнес-модели зависят от запланированного устаревания и обязательных обновлений. Рассматривается множество решений: от публичных архивов до использования носителя информации, существующего уже миллиарды лет: один грамм ДНК способен хранить 215 петабайт (215 миллионов гигабайт), поэтому контейнер весом и размером примерно с пару пикапов в теории мог бы хранить все данные, когда-либо записанные человечеством[69]
.Действовать нужно последовательно, создавая уверенность, что разные ученые и инженеры в разных лабораториях смогут измерять одни и те же вещи, использовать один и тот же жаргон и сообщать о своих открытиях таким образом, чтобы их могли интерпретировать все, гарантируя воспроизводимость науки. Стоит попросить у исследователя материалы, и нередко с другой стороны ждут всевозможные проволочки, молчание или даже отказ. Иногда у них просто нет времени, денег, возможностей или желания (например, если необходимо менять форматы программного обеспечения). В каких-то случаях мешают эго, соперничество и эмоции – да, даже в научных дисциплинах, якобы основанных на объективности и разуме[70]
.Есть противоречия, которые необходимо понимать. Всегда существует компромисс между поощрением широкого использования данных и методов, с одной стороны, и коммерциализацией – с другой, и не в последнюю очередь это использование патентов для защиты идей и получения дохода. Более того, исследователи неохотно делятся своими новаторскими данными, если они рискуют стать не первыми, кто опубликует важные результаты и идеи, содержащиеся в этих данных. Не получив признания за понимание данных, которые они с таким трудом собирали, исследователи могут потерять деньги и признание, загнать в тупик свою карьеру и даже лишить себя Нобелевской премии.
Нам нужна открытость, чтобы данные свободно распространялись в хранилищах и банках данных, как государственных, так и коммерческих[71]
. К счастью, существует множество ярких примеров обмена данными для публичного использования и общественного блага, например, US NCI Cancer Research Data Commons, Британский биобанк и инициатива GISAID по обмену данными обо всех вирусах гриппа и коронавирусе, вызывающем COVID-19. Хорошей новостью является то, что многие сейчас принимают так называемые принципы FAIR: данные должны быть находимыми (findable), доступными (accessible), совместимыми (interoperable) и воспроизводимыми (reproducible)[72].Существует множество острых вопросов, связанных с данными. Как люди могут получить доступ к своим медицинским данным? Владеют ли они ими сами или же это собственность больниц, в которых они хранятся? Хотят ли люди получить к ним доступ и управлять ими? Будут ли службы здравоохранения готовы их предоставлять? А как насчет объединения этих данных с данными других людей для проведения клинических и других исследований? А что с кибербезопасностью? Нам нужны принципы высокого уровня, а также руководящий орган, чтобы формировать все способы управления данными и обеспечивать надежность и доверие к управлению и использованию наших данных[73]
.Первый шаг к созданию виртуального человека зависит от данных, но их одних недостаточно, чтобы понять связь между генетическим составом, окружающей средой и фенотипом человеческого тела. Нам необходимо понять сети, которые связывают все эти данные, прежде чем мы сможем начать замыкать цикл и превращать данные в прогностическую, количественную биологию. Прежде всего нам нужна теория.
Теории обладают объяснительной силой. Они придают смысл экспериментальным наблюдениям с точки зрения глубокого понимания того, как устроен мир. Они представляют работу природы экономичным образом, без объемных хранилищ необработанных и неинтерпретированных данных, и помогают нам раскрыть принципы и законы, которые объясняют, как и почему все обстоит именно так. Они также раскрывают эмерджентные свойства.