Чтобы идентифицировать разнообразные организмы на основе «извлеченной» из их клеток ДНК, нам нужно прочитать эту ДНК. Ученые называют этот процесс секвенированием. Вот это уже довольно сложная штука. Микроскоп увеличивает размеры наблюдаемого объекта, чтобы сделать его доступным для изучения, а вот при секвенировании нужно сначала максимально увеличить количество ДНК, чтобы понять невидимую информацию, которую она содержит. Только в этом случае можно считать «буквы» генетического алфавита — нуклеотиды, из которых ДНК и состоит. У всех организмов, кроме некоторых вирусов, ДНК представлена двумя взаимодополняющими цепочками, соединенными друг с другом чем-то вроде молекулярной застежки-молнии. Довольно давно ученые догадались, что если бережно расстегнуть эту «молнию», то каждая из получившихся цепочек может быть скопирована, и это можно повторять раз за разом, пока у нас не окажется достаточно ДНК, чтобы приняться за ее расшифровку. Расстегнуть застежку можно путем нагрева, и это не очень сложно. А вот для копирования отдельных цепочек необходимо участие белка, называемого полимеразой, который используется для копирования ДНК всеми клетками, включая человеческие. Итак, требовалось разъединить двойную цепь ДНК, добавить немного полимеразы, а также праймер (небольшой участок ДНК, который указывает полимеразе, какой именно отрезок ДНК, или ген, нужно копировать) и некоторые нуклеотиды. Проблема состояла в том, что при таких высоких температурах, при которых происходит расщепление двухцепочечной ДНК, полимераза разрушается. Один из громоздких, дорогостоящих и трудоемких способов решения проблемы состоял в том, чтобы добавлять свежую полимеразу и праймеры после каждого цикла нагревания. Этот способ работал, но мучительно медленно, так медленно, что большинство микробиологов предпочитали сосредоточиться на изучении тех видов, которые удается культивировать, и попросту игнорировали все неизвестные и некультивируемые в то время формы.
Но однажды решение было найдено. И этим решением был
А вот какие именно гены копируют с помощью ПЦР ученые, лаборанты или врачи и как они потом расшифровывают полученные копии ДНК, зависит уже от цели конкретного исследования и от используемой технологии. В случае если нам нужно идентифицировать все виды бактерий, представленные в отдельно взятой пробе, обычно используют ген 16S рРНК. Он так важен для жизнедеятельности бактерий и архей, что за 4 млрд лет эволюции остался почти неизменным. Именно поэтому ученые так полагаются на этот ген, который есть у всех без исключения известных видов архей и бактерий. От вида к виду ген отличается достаточно для того, чтобы идентифицировать отдельные виды, но не настолько, чтобы его не распознать. А что касается методов, используемых для декодирования множества копий этого гена, то они весьма разнообразны. Некоторые основаны на добавлении маркированных нуклеотидов (тех самых букв генетического алфавита) в пробы, ДНК которых планируется скопировать. Маркируются они особыми веществами, которые может считать машина для секвенирования, или секвенаторы. Это устройство начинает работу со считывания праймера, которым открывается нуклеотидная цепочка, а потом считывает одну за другой все последующие «буквы». Это повторяется с каждой копией ДНК в пробе, хотя там их могут быть миллиарды, и в результате формируются огромные файлы с данными, в которых записаны расшифровки всех копий ДНК. Затем эти расшифровки объединяются в группы на основе их сходства и уже тогда считанные последовательности нуклеотидов каждой группы сравниваются с последовательностями уже известных видов, полученными ранее другими исследователями[32]
. Конкретные детали этого процесса постоянно меняются, но одно остается неизменным: с каждым годом секвенирование становится все дешевле и проще. Не за горами времена, когда появятся портативные секвенаторы. (На самом деле такие уже существуют, но делают много ошибок при чтении ДНК. Со временем они станут лучше.)