И вот тут возникает важнейший факт, который вообще-то относится к физической химии, но — внезапно — оказывается ключевым для понимания такой тонкой материи, как наследственность. Факт этот следующий. Первичная структура белка (то есть аминокислотная последовательность), как правило, однозначно определяет все остальные уровни его структуры, то есть всю укладку молекулы в объеме. Именно поэтому простая линейная последовательность нуклеотидов — иначе говоря, нуклеотидный текст — может полностью определить все свойства любой сколь угодно сложной белковой молекулы. Ведь первичная структура такой молекулы тоже линейна, и ее тоже можно считать текстом. Только вот «буквы» в этих текстах разные.
И перед нами немедленно возникает следующий вопрос: каким образом нуклеотидный «алфавит» переводится в аминокислотный?
Генетический код
Пока большинство биологов считало гены белками, все было относительно просто. Белок, как мы знаем, представляет собой линейную цепочку аминокислот, которые могут чередоваться в любом порядке. Двадцать аминокислот — это количество, вполне сравнимое с количеством букв в каком-нибудь древнем алфавите, вроде греческого или финикийского. Такая система кодирования позволяет хранить любую информацию не хуже, чем в обычной книге. Получается, что «белок является как бы длинным предложением, записанным с помощью двадцати букв»[63].
Правда, надо тут же заметить, что до открытия великой двойной спирали практически никто из биологов в таких понятиях не рассуждал. Перейти с привычного «аналогового» языка традиционной биологии на «цифровой» язык новой биологии, изучающей информационные процессы, им и в дальнейшем было непросто. Многим даже очень крупным ученым, профессионально сложившимся до 1953 года, это вообще так никогда и не удалось. Идея цифровой записи наследственной информации вживалась в биологию с удивительным трудом, несмотря на то что со времен работ Менделя к тому времени прошло уже почти 100 лет. Впору предположить, что эта идея противоречила какой-то фундаментальной особенности склада ума большинства людей, выбиравших биологию своей профессией.
Так или иначе после открытия генетической роли ДНК все заметно усложнилось. Стало понятно, что «базой данных», хранящей последовательности белков, служит не какой-то особый белок, специально приспособленный для записи информации (как это вполне можно было бы вообразить), а совершенно другой полимер, резко отличающийся от белка химически и к тому же содержащий всего-навсего четыре типа мономеров вместо 20. Так возникла проблема перекодировки, или, в более привычных нам терминах, проблема генетического кода.
Тут обязательно нужно пояснение. В сети и публицистике довольно часто встречается мнение, будто генетический код — примерно то же самое, что и генетическая информация. Так вот, это совершенно неправильно. Код — это не сама информация, а словарь, с помощью которого ее можно прочитать. Или более строго:
Итак, чего стоит ожидать от генетического кода? У тех ученых, которые сразу после открытия двойной спирали ДНК первыми занялись этим вопросом, получилось примерно следующее:
• аминокислот в составе белков 20, а разновидностей нуклеотидов в ДНК всего четыре. Значит, каждая аминокислота должна кодироваться не одним нуклеотидом, а неким их сочетанием. Примерно так, например, вводятся с помощью клавиш китайские и японские иероглифы;
• отличающихся друг от друга двоек нуклеотидов (дублетов) может существовать максимум 16. Для кодирования всех аминокислот этого не хватит. Значит, генетический код должен быть как минимум
• отличающихся друг от друга троек нуклеотидов (триплетов) может существовать максимум 64. То есть их намного больше, чем аминокислот. Значит, каждая аминокислота, скорее всего, кодируется не одним триплетом, а несколькими разными. Таким образом, надо ожидать, что генетический код —
Человека, который первым опубликовал эти соображения, звали Георгий Антонович Гамов. Это был крупный физик-теоретик, причастный к созданию теории Большого взрыва. Занятия биологией для него были эпизодом, но очень плодотворным. Гамов вычислил «на кончике пера» основные параметры генетического кода, и вскоре эксперименты показали, что предсказал он их в основном правильно.