Генетический код — догма и руководство к действию!
Три главных типа биополимеров — ДНК, РНК и белки — существуют в организме не обособленно. Они связаны между собой отношением, которое великий ученый Фрэнсис Крик назвал «основной догмой молекулярной биологии». Суть «догмы» в том, что генетическая информация в клетке хранится в виде последовательности молекулы ДНК, а реализуется в виде последовательности белка, причем посредником в процессе переноса информации является молекула РНК. Процесс перекодирования нуклеотидной последовательности в аминокислотную происходит на специальных молекулярных машинах — рибосомах.
Используя нестрогую компьютерную аналогию, ДНК можно сравнить с программой, написанной на одном из языков программирования высокого уровня (например, С++). Аппарат трансляции, включающий в себя разнообразные РНК, работает как компилятор, переводящий (транслирующий) эту программу в машинный код, понятный компьютеру. А белок можно уподобить исполняемому файлу игры, получившейся на выходе. Если не знать о принципах компилирования, обнаружить какую-либо связь между исходным текстом программы и итоговым EХЕ-файлом практически невозможно. Именно поэтому ученые так долго не могли заметить взаимосвязь между ДНК и белками.
Другой, более бытовой, аналогией может быть связь между рецептом пирога (ДНК) и собственно пирогом (белком). Превращение информации, торопливо записанной на клочке бумаги, в праздничное блюдо происходит благодаря умелым рукам кулинара (рибосомы), который в нужной последовательности соединяет необходимые ингредиенты. Но для человека, не знакомого с письменностью, взаимосвязь между кусочком бумаги и лакомством будет выглядеть как загадка, а может быть, и колдовство.
Кусок ДНК, который кодирует последовательность того или иного белка, называется «ген». Совокупность генов в организме формирует его геном. Это первое — и очень приблизительное — определение молекулярных основ живого, которое постепенно будет уточнено (и усложнено).
Правила, устанавливающие соответствие между последовательностью ДНК и последовательностью белка, которую кодирует данный ген, называются генетическим кодом. Генетический код в основных чертах един для всех живых существ на Земле, и редкие отступления от него у некоторых бактерий и одноклеточных представляют собой исключения, лишь подтверждающие правило. Единство генетического кода является основным доказательством общего происхождения всех форм жизни, известных нам на сегодняшний день.
Генетический код триплетен. Это означает, что одна аминокислота в составе белка кодируется тремя нуклеотидами в составе ДНК. (Аналогично слова «три» и «два», по три буквы в каждом, кодируют в русском языке информацию о цифрах «3» и «2».) Четыре нуклеотида ДНК способны составить 64 триплетных кодона — основных «слов» генетического алфавита. Большая часть этих кодонов кодирует аминокислоты. Причем, поскольку аминокислот всего 20, это значит, что некоторые аминокислоты кодирует несколько разных кодонов, подобно тому как в естественном языке слова-синонимы могут обозначать один и тот же предмет. Это свойство генетического кода, когда несколько кодонов соответствуют одной и той же аминокислоте, называется вырожденностью. Три кодона из 64 не кодируют никаких аминокислот. Это так называемые стоп-кодоны. Их функция — в нужный момент прекращать синтез белка. Стоп-кодон в конце последовательности, кодирующей белок, играет ту же роль, что и точка в конце предложения в человеческих языках.
Замена (мутация) в нуклеотидной последовательности гена влечет за собой ошибку (мутацию) в аминокислотной последовательности белка или даже полное прекращение его синтеза — к такому результату может привести незапланированное появление стоп-кодона в начале гена.
А теперь попробуйте решить несложную, на первый взгляд, задачу. Каждая аминокислота кодируется тремя нуклеотидами, средняя длина белка составляет примерно 200 аминокислотных остатков. Сколько же белков кодирует человеческий геном, имеющий размер 3,1 млрд пар оснований («пар» — потому что обычная структура ДНК в клетке — это двойная спираль)? Неужели больше 5 млн?! (3,1 млрд: (200 * 3)). Но нет. Всего лишь около 20 000–25 000. Откуда же берется такое колоссальное расхождение между размерами генома и количеством белков?
(Строго говоря, приведенные выше цифры не совсем точны, поскольку с одного гена могут считываться несколько разных белков, так что общее число разных белков в человеческом организме будет больше 20 000–25 000, но все равно гораздо меньше 5 млн. При этом в каждой отдельной клетке будет синтезироваться лишь та часть из них, что соответствует ее специализации.)