Расчеты настораживали. Мы знали, что загрязнения могут замешаться и в набор данных, опубликованный в
Также мы знали, что уровень загрязнений наверняка больше в данных по
Пытаясь прояснить ситуацию, мы попросили
Мы обсуждали, стоило ли публиковать ту статью в
Не увлеклись ли соревнованием с Эдди? Может, стоило подождать? Некоторые говорили, что стоило, другие – что нет. Даже теперь, оглядываясь назад, я уверен, что тот прямой тест загрязнения по мтДНК не соврал, оно было очень низким. У анализа по мтДНК имеются свои ограничения, но, по-моему, прямые доказательства всегда перевешивают косвенные рассуждения. В той заметке, которую
Глава 14
Карта генома
Ну вот, необходимые библиотеки ДНК составлять мы научились, скоро команда из
Суть задачи по сортировке фрагментов состояла в том, что нужно было одновременно держать в голове две противоположных возможности. С одной стороны, если требовать абсолютно точного соответствия неандертальских и человеческих отрезков ДНК, то можно упустить или отбросить те, в которых имеются значимые отличия (или ошибки). И в результате неандертальский геном предстанет более похожим на человеческий, чем на самом деле. Но с другой стороны, если позволить слишком приблизительное соответствие, то в неандертальский геном попадут фрагменты бактериальных ДНК, которые иногда похожи на те или иные участки человеческой последовательности. В этом случае неандертальский геном будет слишком сильно отличаться от человеческого – больше, чем в реальности. Собственно, на том этапе можно было забыть обо всех остальных частностях и сосредоточиться на балансировании между этими двумя крайностями; от выбранного баланса зависел весь дальнейший анализ и подсчет различий между человеческим и неандертальским геномами.
Кроме того, была еще и практическая сторона дела. Компьютерные алгоритмы для картирования не могли учитывать слишком много параметров: мы ведь хотели сравнивать массивы в 3 миллиарда человеческих нуклеотидов с миллиардом неандертальских фрагментов по 30–70 нуклеотидов каждый (именно такое количество ДНК мы планировали секвенировать из костей). Программам с такими объемами быстро не справиться.
Несколько человек взялись за монументальную задачу по составлению алгоритма картирования: Эд Грин, Дженет Келсо и Удо Штенцель. Дженет приехала к нам в лабораторию в 2004 году из Университета Западно-Капской провинции в своей родной ЮАР и возглавила у нас группу биоинформатики. Как-то незаметно, но очень эффективно из самых разных и необычных личностей она создала целостную сплоченную команду.