Они добились значительного прогресса и опубликовали свою модель в 1999 г. Однако существовало еще много генов, функции которых не были известны. Также было сложно построить последовательную модель из обыкновенных дифференциальных уравнений. Еще одной проблемой был поиск всех параметров, которые можно включить в эти уравнения. Под руководством Коичи Такахаси из Лаборатории биологических вычислений в Осаке команда перешла к моделированию других клеток, таких как эритроциты и кардиомиоциты. Чтобы избежать рутины по сбору данных из тысяч статей для моделирования более сложных клеток, команда использует ИИ для извлечения геномных последовательностей из баз данных, прогнозирования, какие части последовательности транслируются в белки, и использования существующих знаний для определения того, что они делают и как взаимодействуют.
Совсем недавно еще одна виртуальная Mycoplasma genitalium появилась на компьютере благодаря системному биологу из Стэнфордского университета Маркусу Коверту, который сам был вдохновлен идеями Бреннера, Крика и Моровица, а также данными Вентера. Будучи аспирантом, в 1995 г. Коверт увлекся первым исследованием сравнительной геномики, когда команда Вентера сопоставила генетический код бактерий Mycoplasma pneumoniae и Haemophilus influenzae, чтобы начать разработку основного набора генов, необходимых для жизни[351]. Коверт до сих пор помнит охватившее его волнение, когда в газете он прочитал слова Клайда Хатчисона, члена команды Вентера: работающая компьютерная модель клетки станет окончательным испытанием биологического понимания.
Эти слова навсегда останутся с Ковертом, который шел за мечтой. Его команда использовала код ДНК микоплазмы Вентера вместе с данными, полученными из более чем 900 научных работ, включая почти 2000 экспериментально наблюдаемых параметров, которые отражают геном организма, транскриптом, протеом, метаболом и т. д. Они разделили M.genitalium на 28 функциональных процессов, моделируя каждый независимо в течение 1 с. Целая клетка была смоделирована с использованием алгоритма, сравнимого с теми, которые используются для численного интегрирования обыкновенных дифференциальных уравнений.
Изменение состояния виртуальной клетки рассчитывалось секунда за секундой путем многократного распределения переменных состояния между процессами, выполнения каждой из подмоделей клеточных процессов и обновления значений переменных состояния до тех пор, пока не было достигнуто заданное время или клетка не делилась. В целом модель сочетала в себе смесь булевой алгебры (сочетание логики и математики, сыгравшей ключевую роль в создании компьютеров), линейной оптимизации и обыкновенных дифференциальных уравнений, чтобы «оживить» организм.
Сложнее всего было объединить 28 функциональных процессов в единую клеточную модель. Исследователи начали с предположения, что эти процессы независимы на коротких временных интервалах – в данном случае менее 1 с. Моделирование проводилось в цикле, в котором модели подпроцессов запускались независимо на каждом временном шаге, но зависели от значений переменных, определенных другими подмоделями на предыдущем временном шаге. Таким образом, им удалось смоделировать M.genitalium до каждого из 525 генов, что стало первым моделированием всех генов организма и каждой известной функции генов.
К 2012 г. команда из Стэнфорда сообщила о первой модели бактерии, учитывавшей все известные функции генов, и заявила, что проблема понимания того, как сложные фенотипы возникают из отдельных молекул и их взаимодействий, теперь может быть решена с помощью виртуальных клеток[352]. Когда они представили свою виртуальную бактерию, моделирование деления одной клетки заняло около 10 ч и сгенерировало полгигабайта данных. «Хотите верьте, хотите нет, но для деления настоящей клетки M.genitalium также требуется около 10 часов», – сказал нам Коверт[353].
Команда из Стэнфорда использовала этот виртуальный организм, чтобы выяснить детали клеточного цикла, который состоит из трех стадий – инициации, репликации и цитокинеза (деление клеток). Отсылая к реальному миру, продолжительность отдельных стадий виртуальных клеточных циклов варьировалась, в то время как продолжительность цикла в целом была относительно постоянной. Они обнаружили, что клетки, которым требовалось больше времени, чтобы начать репликацию ДНК, успели накопить пул свободных нуклеотидов – строительных блоков ДНК. В результате репликация цепей ДНК из этих нуклеотидов затем проходила относительно быстро. И напротив, клетки, которые прошли начальный этап быстрее, не имели избытка нуклеотидов, что задерживало репликацию.