В начале происходит нуклеофильная атака донорного экзона, затем происходит разрезание, кусочек GU заворачивается и присоединяется к А. Затем разрезается вторая часть, первый экзон соединяется со вторым, и образуется интрон.
Если посмотреть, какую долю гена составляют экзоны, то самый большой известный транскрипт (у гена миодистрофина) имеет длину около 2,5 миллионов нуклеотидов. У него в зрелую часть РНК переходит 14 тыс нуклеотидов (0,6 %), а остальные 99,4 % от первичного транскрипта выкидывается (интроны).
С ростом размеров гена в хромосоме его белок-кодирующая часть увеличивается незначительно, а количество интронов в гене растет. С ростом числа интронов растет число сайтов сплайсинга и вероятность их повреждения. Поэтому для генов с большим числом интронов потеря функции при мутации может быть связана не с белок-кодирующей частью ДНК, а с регуляторными элементами сплайсинга.
Секвенирование генома человека показало, что некоторые экзоны многократно повторены в геноме. Это могут повторы экзонов в составе одного гена, или присутствие одного и того же экзона в составе нескольких разных генов. Получается, что экзоны, основные элементы структуры РНК, то есть белок-кодирующие элементы, в процессе эволюции могут каким-то образом размножаться в геноме и «перетасовываться» между разными генами. Такое явление получило название exon shuffling — перетасовка экзонов. Ниже показаны разные белки, в которых содержатся одинаковые экзоны. Таким образом, оказывается, что эволюция — это нередко именно блоковые изменения генома, а не точечные изменения.
Ген фибронектина содержит 12 копий экзона, кодирующего "палец" белка. Этот же модуль найдет в продуктах других генов. Он содержит также модули, встречающихся в белках определенных типов, таких как мембранные клеточные рецепторы и белки внеклеточюго матрикса.
Классификация генов по их функциям
На 2001 год для более 40 % генов человека не было никаких предположений относительно выполняемых функций. А для остальных раскладка была достаточно условной. Принадлежность белка к одному функциональному классу не исключает его принадлежности также и к другому классу. Например, то, что белок связывается с ДНК, не означает, что он не может быть еще и ферментом и т. д. Это — характеристика, которая была дана гену по той его части, которая связана с охарактеризованной функцией, но, вообще говоря, такая функция у белка может быть и не одна.
Больше всего генов отвечают за экспрессию, репликацию и поддержание функций генома; около 20 % — за передачу сигналов между клетками, около 17 % — за то, чтобы клетка сама по себе была здорова, и для других функции не классифицированы.
Оказывается, что у человека, по сравнению с дрожжами, бактериями и т. д., в геноме имеется больше генов регуляторов транскрипции. То есть, транскрипционные регуляторы сильно размножились в эволюционной линии млекопитающих, в частности, человека. Предполагается, что разнообразие регуляторов транскрипции обеспечивает большую тонкость реакции генома на сигналы внешней среды. То есть у млекопитающих больше число ансамблей координировано транскрибируемых генов, чем в других группах.
Около половины длины фрагмента занимают элементы, структура и функция которых понятна. Это пены (экзоны и нитроны) и псевдогены, короткие (SINE)и длинные (LINE) диспергированные повторы, длинные концевые повторы (LTR), транспозоны, микросателлиты.