Когда на нас с наступлением геномной революции обрушилась лавина новых данных, стало понятно, насколько несостоятельна “древесная” метафора, когда дело касается связей между популяциями современных людей. Ник Паттерсон, мой ближайший научный соратник и специалист по прикладной математике, решил проверить, насколько точно модель дерева отражает реальные связи между популяциями, и для этого предложил несколько контрольных тестов. Главный из них – тест четырех популяций. Как я описывал в первой части, он ориентируется на те позиции в геноме, в которых у индивидов имеются различия; таких позиций сотни тысяч. Например, там, где у одних стоит аденин (напомню, что это одна из четырех нуклеиновых кислот, или “букв”, ДНК), у других может быть гуанин, и это мутация, которая имела место когда-то в прошлом. Если четыре популяции выстраиваются в дерево, то частоты мутаций у них должны быть связаны простыми соотношениями2
.Проще всего проверить модель дерева с помощью оценки частот мутаций в геномах двух популяций, которые предположительно отделились от единой ветви. Если верна модель дерева, то от момента разветвления частоты мутаций в этих двух популяциях будут дрейфовать случайным образом, и при этом независимо от другой пары популяций, отделившихся от общего ствола раньше. Если же модель дерева не соответствует реальности, то между частотами мутаций обнаружится корреляция, указывающая на вероятное сращивание между ветвями. Тест четырех популяций стал ключевым в доказательстве более тесной связи неандертальцев с неафриканцами, чем с африканцами, а отсюда вытекает и скрещивание неандертальцев с неафриканцами3
. Однако это лишь одно из многих открытий, сделанных с помощью теста четырех популяций.Первое значительное открытие с использованием теста четырех популяций – а в моей лаборатории с ним работали очень интенсивно – касалось происхождения индейцев: принятая тогда гипотеза рассматривала индейцев и восточноазиатов как “сестринские” группы, берущие начало от общей линии, отделившейся ранее от популяции, куда помимо них входили предки и европейцев, и центрально- и южноафриканцев. Взяв набор мутаций, отсутствующий у африканской группы, мы с удивлением увидели, что по ним европейцы ближе к индейцам, чем к восточноазиатам. Тут естественно было бы предположить самую тривиальную вещь: европейская часть у индейцев объясняется смешением с европейскими мигрантами последних пяти столетий. Но ту же картину мы выявили во всех популяциях индейцев, откуда у нас были образцы ДНК, и даже у тех, кто наверняка не имел контактов с европейцами. Также не подтверждается данными гипотеза, что индейцы и европейцы выросли из общей предковой популяции, отделившейся от восточноазиатского ствола. Что-то не согласовывалось с самым существом модели дерева.
Свой вариант объяснения мы описали в статье: где-то в древней истории индейцев имел место, по-видимому, эпизод смешения с линиями с европейским и с восточноазиатским родством, и происходило данное гипотетическое событие до того, как популяция с примесным наследием пересекла Берингийский мост из Азии в Америку. Рукопись той статьи
Уже когда мы вычищали рукопись для подачи финальной версии, Паттерсон вдруг наткнулся на нечто еще более чудесное, и сразу стало понятно, что мы ухватили лишь часть всей истории4
. Чтобы рассказать об этом, мне нужно описать еще один статистический тест, бывший у нас в ходу, – тест трех популяций. Он оценивает гибридность какой-то одной выбранной – тестируемой – популяции. Если тестируемая популяция является смесью двух других, взятых из возможного набора кандидатов (например, афроамериканцы будут смесью европейцев и западных африканцев), то частоты мутаций в этой популяции будут промежуточными между этими двумя. А если смешения не было, то частоты мутаций промежуточными не будут, для этого нет никаких причин. Таким образом, в сценарии смешения и в сценарии без смешения количественное распределение мутаций будет различаться.