Выше показано, как выглядит кусок генома человека («50 000 п.н.). Около половины длины этого фрагмента ДНК занимают элементы, структура и функция которых понятна. Среди этих элементов есть гены (экзоны и интроны) и псевдогены — есть гены функциональные, а есть их нефункциональные копии. Они, обычно, не содержат интронов (считается, что после транскрипции и при преобразовании зрелой РНК возможен процесс встраивания ее обратно в геном в виде ДНК-копии; тогда это будет ген, содержащий лишний «хвост» и не содержащий интронов). А также короткие (SINE) и длинные (LINE) диспергированные повторы, длинные концевые повторы (LTR) — следы, оставшиеся после транспозиции, транспозоны, микросателлиты.
К 2001 году в геноме человека было выявлено 1112 "генов болезней" (то есть таких, мутации в которых ведут к заболеванию) и еще есть 94 "составных" гена, образующихся при опухолевых перестройках генома. Пока, в основном, раскрыты по механизму те заболевания, которые затрагивают белок-кодирующую часть гена. Возможно, не меньшее количество мутаций, вызывающих болезни, будет найдено и в участках регуляции транскрипции, сплайсинга и стабильности РНК.
В геноме человека выявлено 1112 “генов болезней” + 94 “составных” гена, образующихся при опухолевых перестройках генома
McKusick еа, Science (2001), v291, р.1224
По представлениям на март 2005 года, у человека 24000 белок-кодирующих генов, из них 1700 генов ассоциированы с заболеваниями. Обнаружено 44,500 мутаций в этих 1700 генах (в среднем 26 на ген), связанных к заболеваниям. А для остальных 10 000 000 известных мутаций подобная связь не выявлена.
20 % смертей в США происходит из-за того, что прием лекарства осуществлялся либо не того, либо не так. Но это связано не с некомпетентностью врачей, а с тем, что мы все генетически разные. У болезней много мишеней и если бить не по той мишени, то лекарство точно не будет полезным, а потому может быть и вредным. У человека может быть специфическая реакция на данное лекарство (слишком низкая или слишком высокая скорость метаболизма). А в нашей стране ведущая пока причина смертей взрослого населения — пьянство. Эта первопричина просто скрыта за определением «травматизм» (производственный, бытовой, дорожный и т. д.), который и указывают как причину смерти. Выявлена корреляция потребления алкоголя в нашей стране и продолжительности жизни: когда, снижается потребление алкоголя, продолжительность жизни идет вверх, и наоборот.
Если два белка характеризуются сходной последовательностью аминокислотных остатков (выше критической длины, до которой совпадения могут быть чисто случайными), то у них есть общая предковая последовательность, и соответствующий предковый ген. Количество таких предковых структур у белков весьма ограничено.
К примеру, был один ген в геноме, а потом их стало два (дупликация). Со временем мутации изменили эти гены каждый по-своему. А потом этот вид дал начало двум новым видам (см. рис. ниже). Все эти гены являются «родственниками» (гомологами), но по-разному называются. Гомологичные гены, которые мы рассматриваем в составе разных видов, называются ортологи, а гомологичные гены в одном геноме называют паралоги.