С применением метода дробовика секвенирование пошло быстро. Клоны в виде космид ДНК длиной около 35 тысяч пар оснований были упакованы в фаги и внедрены в
Но и тут нас ждали трудности. Программное обеспечение тогда не предназначалось для обработки более нескольких сотен последовательностей, поэтому было невозможно справиться с тысячами, и нам пришлось прибегнуть к утомительному ручному методу. Для сколько-нибудь существенного прогресса требовались гораздо более мощные компьютеры, чем наши, и программное обеспечение значительно более высокого качества (несмотря на противоположное мнение наших коллег). И я стал нанимать на работу специалистов по информационным технологиям.
Одним из них был Марк Адамс из Мичиганского университета, вылитый Маколей Калкин (из кинофильма «Один дома»), имевший вид «нет-ничего-невозможного», исполнительный и энергичный парень в больших очках, с которым я провел собеседование в конце 1989 года. Меня поразило тогда, что этот худой молодой человек создал компанию по разработке программного обеспечения, еще учась в аспирантуре. Марк увлекался геномикой и был готов приступить к работе. Мы приобрели мощные компьютеры компании
Но что бы мы ни делали, правильная интерпретация генетического кода оказалась практически невозможной даже после составления длинных отрезков хромосом. Программное обеспечение, с помощью которого можно идентифицировать последовательности бактерий, не работает в случае более сложного человеческого генома. В нем гены разбиты на небольшие сегменты (экзоны) бессмысленными участками ДНК (интронами), подобно тому, как бессмысленная реклама прерывает телефильм. Поэтому ген часто состоит из частичек и кусочков огромного генетического кода, от сотен тысяч до миллионов пар оснований. Мы использовали самые совершенные программы, чтобы найти эти участки, но компьютер не мог отличить реальные гены от шума, генерируемого случайным сочетанием четырех букв замучившего нас генетического кода.
И тогда я придумал новый способ определить прогнозируемый ген, отыскав его аналог в матричной РНК. Всякий раз, когда в геноме человека обнаруживается реально действующий ген, мы находим и соответствующую молекулу матричной РНК, сокращенный вариант гена, который содержит только пары оснований генетического кода для создания белка. Превращая эту «летучую» РНК в кДНК для последующего секвенирования, мы обрели способ подтвердить наличие прогнозируемых генов.
Мы начали тестирование библиотек кДНК разных тканей человека, главным образом мозга и плаценты. Наши зонды состояли из последовательностей генов, прогнозируемых на основе компьютерного анализа ДНК из хромосом 4 и 19. Если бы удалось доказать, что клон кДНК является прогнозируемым геном в генетическом коде, его существование стало бы доказательством подлинности гена, а не артефактом. Несмотря на бесспорную логичность этого метода, потребовались месяцы напряженной работы, чтобы подтвердить наличие всего лишь нескольких истинных генов в изучаемой последовательности. Неудивительно, что в начале дискуссии о проекте генома методы анализа кДНК, которые были предложены (в частности, Сидни Бреннером и Полом Бергом) в качестве альтернативы секвенирования генома, сразу же были отвергнуты.
Однако я чувствовал, что нахожусь на правильном пути. Моя уверенность окрепла в 1990 году, когда меня пригласили на симпозиум в Японии, организованный производителем секвенаторов компанией