Генетический код: описание, характеристики, история исследования. Код в коде: раскрыт второй генетический код

Генетический код – это система записи наследственной информации в молекулах нуклеиновых кислот, основанная на определённом чередовании последовательностей нуклеотидов в ДНК или РНК, образующих кодоны, соответствующие аминокислотам в белке.

Свойства генетического кода.

Генетический код имеет несколько свойств.

    Триплетность.

    Вырожденность или избыточность.

    Однозначность.

    Полярность.

    Неперекрываемость.

    Компактность.

    Универсальность.

Следует отметить, что некоторые авторы предлагают ещё и другие свойства кода, связанные с химическими особенностями входящих в код нуклеотидов или с частотой встречаемости отдельных аминокислот в белках организма и т.д. Однако эти свойство вытекают из вышеперечисленных, поэтому там мы их и рассмотрим.

а. Триплетность. Генетический код, как и многое сложно организованные система имеет наименьшую структурную и наименьшую функциональную единицу. Триплет – наименьшая структурная единица генетического кода. Состоит она из трёх нуклеотидов. Кодон – наименьшая функциональная единица генетического кода. Как правило, кодонами называют триплеты иРНК. В генетическом коде кодон выполняет несколько функций. Во-первых, главная его функция заключается в том, что он кодирует одну аминокислоту. Во-вторых, кодон может не кодировать аминокислоту, но, в этом случае, он выполняет другую функцию (см. далее). Как видно из определения, триплет – это понятие, которое характеризует элементарную структурную единицу генетического кода (три нуклеотидов). Кодон – характеризует элементарную смысловую единицу генома – три нуклеотида определяют присоединение к полипептидной цепочки одной аминокислоты.

Элементарную структурную единицу вначале расшифровали теоретически, а затем её существование подтвердили экспериментально. И действительно, 20 аминокислот невозможно закодировать одним или двумя нуклеотидом т.к. последних всего 4. Три нуклеотида из четырёх дают 4 3 = 64 варианта, что с избытком перекрывает число имеющихся у живых организмах аминокислот (см.табл. 1).

Представленные в таблице 64 сочетания нуклеотидов имеют две особенности. Во-первых, из 64 вариантов триплетов только 61 являются кодонами и кодируют какую либо аминокислоту, их называют смысловые кодоны . Три триплета не кодируют

аминокислот а являются стоп-сигналами, обозначающие конец трансляции. Таких триплетов три – УАА, УАГ, УГА , их ещё называют «бессмысленные» (нонсенс кодоны). В результате мутации, которая связана с заменой в триплете одного нуклеотида на другой, из смыслового кодона может возникнуть бессмысленный кодон. Такой тип мутации называютнонсенс-мутация . Если такой стоп-сигнал сформировался внутри гена (в его информационной части), то при синтезе белка в этом месте процесс будет постоянно прерываться – синтезироваться будет только первая (до стоп-сигнала) часть белка. У человека с такой патологией будет ощущаться нехватка белка и возникнут симптомы, связанные с этой нехваткой. Например, такого рода мутация выявлена в гене, кодирующем бета-цепь гемоглобина. Синтезируется укороченная неактивная цепь гемоглобина, которая быстро разрушается. В результате формируется молекула гемоглобина лишённая бета-цепи. Понятно, что такая молекула вряд ли будет полноценно выполнять свои обязанности. Возникает тяжёлое заболевания, развивающееся по типу гемолитической анемии (бета-ноль талассемия, от греческого слова «Таласа» — Средиземное море, где эта болезнь впервые обнаружена).

Механизм действия стоп-кодонов отличается от механизма действия смысловых кодонов. Это следует из того, что для всех кодоны, кодирующие аминокислоты, найдены соответствующие тРНК. Для нонсенс-кодонов тРНК не найдены. Следовательно, в процессе остановки синтеза белка тРНК не принимает участие.

Кодон АУГ (у бактерий иногда ГУГ) не только кодируют аминокислоту метионин и валин, но и является инициатором трансляции .

б. Вырожденность или избыточность.

61 из 64 триплетов кодируют 20 аминокислот. Такое трёхразовое превышение числа триплетов над количеством аминокислот позволяет предположить, что в переносе информации могут быть использованы два варианта кодирования. Во-первых, не все 64 кодона могут быть задействованы в кодировании 20 аминокислот, а только 20 и, во-вторых, аминокислоты могут кодироваться несколькими кодонами. Исследования показали, что природа использовала последний вариант.

Его предпочтение очевидно. Если бы из 64 варианта триплетов в кодировании аминокислот участвовало только 20, то 44 триплета (из 64) оставались бы не кодирующими, т.е. бессмысленными (нонсенс-кодонами). Ранее мы указывали, насколько опасно для жизнедеятельности клетки превращение кодирующего триплета в результате мутации в нонсенс-кодон — это существенно нарушает нормальную работу РНК-полимеразы, приводя в конечном итоге к развитию заболеваний. В настоящее время в нашем геноме три кодона являются бессмысленными, а теперь представьте, что было бы если число нонсенс-кодонов увеличится в примерно в 15 раз. Понятно, что в такой ситуации переход нормальных кодонов в нонсенс-кодоны будет неизмеримо выше.

Код, при котором одна аминокислота кодируется несколькими триплетами, называется вырожденным или избыточным. Почти каждой аминокислоте соответствует несколько кодонов. Так, аминокислота лейцин может кодироваться шестью триплетами - УУА, УУГ, ЦУУ, ЦУЦ, ЦУА, ЦУГ. Валин кодируется четырьмя триплетами, фенилаланин - двумя и только триптофан и метионин кодируются одним кодоном. Свойство, которое связано с записью одной и той же информации разными символами носит названиевырожденность.

Число кодонов, предназначенных для одной аминокислоты, хорошо коррелируется с частотой встречаемости аминокислоты в белках.

И это, скорее всего, не случайно. Чем больше частота встречаемости аминокислоты в белке, тем чаще представлен кодон этой аминокислоты в геноме, тем выше вероятность его повреждения мутагенными факторами. Поэтому понятно, что мутированный кодон имеет больше шансов кодировать туже аминокислоту при высокой его вырожденности. С этих позиций вырожденность генетического кода является механизмом защищающим геном человека от повреждений.

Необходимо отметить, что термин вырожденность используется в молекулярной генетики и в другом смысле. Так основная часть информации в кодоне приходится на первые два нуклеотида, основание в третьем положении кодона оказывается малосущественным. Этот феномен называют “вырожденностью третьего основания”. Последняя особенность сводит до минимума эффект мутаций. Например, известно, что основной функцией эритроцитов крови является перенос кислорода от легких к тканям и углекислого газа от тканей к легким. Осуществляет эту функцию дыхательный пигмент - гемоглобин, который заполняет всю цитоплазму эритроцита. Состоит он из белковой части – глобина, который кодируется соответствующим геном. Кроме белка в молекулу гемоглобина входит гем, содержащий железо. Мутации в глобиновых генах приводят к появлению различных вариантов гемоглобинов. Чаще всего мутации связаны с заменой одного нуклеотида на другой и появлением в гене нового кодона , который может кодировать новую аминокислоту в полипептидной цепи гемоглобина. В триплете, в результате мутации может быть заменён любой нуклеотид – первый, второй или третий. Известно несколько сотен мутаций, затрагивающих целостность генов глобина. Около400 из них связаны с заменой единичных нуклеотидов в гене и соответствующей аминокислотной заменой в полипептиде. Из них только100 замен приводят к нестабильности гемоглобина и различного рода заболеваниям от легких до очень тяжелых. 300 (примерно 64%) мутаций-замен не влияют на функцию гемоглобина и не приводят к патологии. Одной из причин этого является упомянутая выше “вырожденность третьего основания”, когда замена третьего нуклеотида в триплете кодирующем серин, лейцин, пролин, аргинин и некоторые другие аминокислоты приводит к появлению кодона-синонима, кодирующего ту же аминокислоту. Фенотипически такая мутация не проявится. В отличие от этого любая замена первого или второго нуклеотида в триплете в 100 % случаях приводит к появлению нового варианта гемоглобина. Но и в этом случае тяжёлых фенотипических нарушений может и не быть. Причиной этому является замена аминокислоты в гемоглобине на другую сходную с первой по физико-химическим свойствам. Например, если аминокислота, обладающая гидрофильными свойствами, заменена на другую аминокислоту, но с такими же свойствами.

Гемоглобин состоит из железопорфириновой группы гема (к ней и присоединяются молекулы кислорода и углекислоты) и белка - глобина. Гемоглобин взрослого человека (НвА) содержит две идентичные -цепи и две -цепи. Молекула -цепи содержит 141 аминокислотных остатков, -цепочка - 146, — и -цепи различаются по многим аминокислотным остаткам. Аминокислотная последовательность каждой глобиновой цепи кодируется своим собственным геном. Ген, кодирующий -цепь располагается в коротком плече 16 хромосомы, -ген - в коротком плече 11 хромосомы. Замена в гене, кодирующем -цепь гемоглобина первого или второго нуклеотида практически всегда приводит к появлению в белка новых аминокислот, нарушению функций гемоглобина и тяжёлым последствия для больного. Например, замена “Ц” в одном из триплетов ЦАУ (гистидин) на “У” - приведет к появлению нового триплета УАУ, кодирующего другую аминокислоту - тирозин Фенотипически это проявится в тяжёлом заболевании.. Аналогичная замена в 63 положении -цепи полипептида гистидина на тирозин приведет к дестабилизации гемоглобина. Развивается заболевание метгемоглобинемия. Замена, в результате мутации, глутаминовой кислоты на валин в 6-м положении -цепи является причиной тяжелейшего заболевания - серповидно-клеточной анемии. Не будем продолжать печальный список. Отметим только, что при замене первых двух нуклеотидов может появится аминокислота по физико-химическим свойствам похожая на прежнюю. Так, замена 2-го нуклеотида в одном из триплетов, кодирующего глутаминовую кислоту (ГАА) в -цепи на “У” приводит к появлению нового триплета (ГУА), кодирующего валин, а замена первого нуклеотида на “А” формирует триплет ААА, кодирующий аминокислоту лизин. Глутаминовая кислота и лизин сходны по физико-химическим свойствам - они обе гидрофильны. Валин - гидрофобная аминокислота. Поэтому, замена гидрофильной глютаминовой кислоты на гидрофобный валин, значительно меняет свойства гемоглобина, что, в конечном итоге, приводит к развитию серповидноклеточной анемии, замена же гидрофильной глютаминовой кислоты на гидрофильный лизин в меньшей степени меняет функцию гемоглобина - у больных возникает легкая форма малокровия. В результате замены третьего основания новый триплет может кодировать туже аминокислоты, что и прежней. Например, если в триплете ЦАУ урацил был заменён на цитозин и возник триплет ЦАЦ, то практически никаких фенотипических изменений у человека выявлено не будет. Это понятно, т.к. оба триплета кодируют одну и туже аминокислоту – гистидин.

В заключении уместно подчеркнуть, что вырожденность генетического кода и вырожденность третьего основания с общебиологических позиция являются защитными механизмами, которые заложены в эволюции в уникальной структуре ДНК и РНК.

в. Однозначность.

Каждый триплет (кроме бессмысленных) кодирует только одну аминокислоту. Таким образом, в направлении кодон – аминокислота генетический код однозначен, в направлении аминокислота – кодон – неоднозначен (вырожденный).

Однозначен

Кодон аминокислота

Вырожденный

И в этом случае необходимость однозначности в генетическом коде очевидна. При другом варианте при трансляции одного и того же кодона в белковую цепочку встраивались бы разные аминокислоты и в итоге формировались белков с различной первичной структурой и разной функцией. Метаболизм клетки перешёл бы в режим работы «один ген – несколько поипептидов». Понятно, что в такой ситуации регулирующая функция генов была бы полностью утрачена.

г. Полярность

Считывание информации с ДНК и с иРНК происходит только в одном направлении. Полярность имеет важное значение для определения структур высшего порядка (вторичной, третичной и т.д.). Ранее мы говорили о том, что структуры низшего порядка определяют структуры более высшего порядка. Третичная структура и структуры более высокого порядка у белков, формируются сразу же как только синтезированная цепочка РНК отходит от молекулы ДНК или цепочка полипептида отходит от рибосомы. В то время когда свободный конец РНК или полипептида приобретает третичную структуру, другой конец цепочки ещё продолжает синтезироваться на ДНК (если транскрибируется РНК) или рибосоме (если транскрибируется полипептид).

Поэтому однонаправленный процесс считывания информации (при синтезе РНК и белка) имеет существенное значение не только для определения последовательности нуклеотидов или аминокислот в синтезируемом веществе, но для жёсткой детерминации вторичной, третичной и т.д. структур.

д. Неперекрываемость.

Код может быть перекрывающимся и не перекрывающимся. У большинства организмов код не перекрывающийся. Перекрывающийся код найден у некоторых фагов.

Сущность не перекрывающего кода заключается в том, что нуклеотид одного кодона не может быть одновременно нуклеотидом другого кодона. Если бы код был перекрывающим, то последовательность из семи нуклеотидов (ГЦУГЦУГ) могла кодировать не две аминокислоты (аланин-аланин) (рис.33,А) как в случае с не перекрывающимся кодом, а три (если общим является один нуклеотид) (рис. 33, Б) или пять (если общими являются два нуклеотида) (см. рис. 33, В). В последних двух случаях мутация любого нуклеотида привела бы к нарушению в последовательности двух, трёх и т.д. аминокислот.

Однако установлено, что мутация одного нуклеотида всегда нарушает включение в полипептид одной аминокислоты. Это существенный довод в пользу того, что код является не перекрывающимся.

Поясним это на рисунке 34. Жирными линиями показаны триплеты кодирующие аминокислоты в случае не перекрывающегося и перекрывающегося кода. Эксперименты однозначно показали, что генетический код является не перекрывающимся. Не вдаваясь в детали эксперимента отметим, что если заменить в последовательности нуклеотидов (см. рис.34) третий нуклеотид У (отмечен звёздочкой) на какой-либо другой то:

1. При неперекрывающемся коде контролируемый этой последовательностью белок имел бы замену одной (первой) аминокислоте (отмечена звёздочками).

2. При перекрывающемся коде в варианте А произошла бы замена в двух (первой и второй) аминокислотах (отмечены звёздочками). При варианте Б замена коснулась бы трёх аминокислот (отмечены звёздочками).

Однако многочисленные опыты показали, что при нарушении одного нуклеотида в ДНК, нарушения в белке всегда касаются только одной аминокислоты, что характерно для неперекрывающегося кода.

ГЦУГЦУГ ГЦУГЦУГ ГЦУГЦУГ

ГЦУ ГЦУ ГЦУ УГЦ ЦУГ ГЦУ ЦУГ УГЦ ГЦУ ЦУГ

*** *** *** *** *** ***

Аланин – Аланин Ала – Цис – Лей Ала – Лей – Лей – Ала – Лей

А Б В

Не перекрывающийся код Перекрывающийся код

Рис. 34. Схема, объясняющая наличие в геноме не перекрывающегося кода (объяснение в тексте).

Неперекрываемость генетического кода связана с ещё одним свойством – считывание информации начинается с определённой точки – сигнала инициации. Таким сигналом инициации в иРНК является кодон, кодирующий метионин АУГ.

Следует отметить, что у человека всё-таки имеется небольшое число генов, которые отступают от общего правила и перекрываются.

е. Компактность.

Между кодонами нет знаков препинания. Иными словами триплеты не отделены друг от друга, например, одним ничего не значащим нуклеотидом. Отсутствие в генетической коде «знаков препинания» было доказано в экспериментах.

ж. Универсальность.

Код един для всех организмов живущих на Земле. Прямое доказательство универсальности генетического кода было получено при сравнении последовательностей ДНК с соответствующими белковыми последовательностями. Оказалось, что во всех бактериальных и эукариотических геномах используется одни и те же наборы кодовых значений. Есть и исключения, но их не много.

Первые исключения из универсальности генетического кода были обнаружены в митохондриях некоторых видов животных. Это касалось кодона терминатора УГА, который читался так же как кодон УГГ, кодирующий аминокислоту триптофан. Были найдены и другие более редкие отклонения от универсальности.

Кодовая система ДНК.

Генетический код днк состоит из 64 триплетов нуклеотидов. Эти триплеты называют кодонами. Каждый кодон кодирует одну из 20 аминокислот, используемых в синтезе белков. Это дает некоторую избыточность в коде: большинство аминокислот кодируется более чем одним кодоном.
Один кодон выполняет две взаимосвязанные функции: сигнализирует о начале перевода и кодирует включения аминокислоты метионина (Met) в растущую полипептидную цепь. Кодовая система днк устроена так, что генетический код может быть выражен либо как РНК-кодонами, либо кодонамиДНК. РНК-кодоны встречаются в РНК (мРНК) и эти кодоны способны читать информацию в процессе синтеза полипептидов (процесс, называемый переводом). Но каждая молекула мРНК приобретает последовательность нуклеотидов в транскрипции с соответствующего гена.

Все, кроме двух аминокислот (Met и Trp) могут быть закодированы посредством от 2 до 6 различных кодонов. Тем не менее, геном большинства организмов показывает, что определенные кодоны предпочтительны по сравнению с другими. У человека, например, аланин кодируется GCC четыре раза чаще, чем в GCG. Это, вероятно, свидетельствует о большей эффективности перевода аппарата трансляции (например, рибосомы) для некоторых кодонов.

Генетический код является почти универсальным. Те же кодоны назначены на тот же участок аминокислот и тем же сигналы пуска и остановки в подавляющем большинстве совпадают у животных, растений и микроорганизмов. Тем не менее, некоторые исключения были найдены. Большинство из них включают назначение одного или двух из трех стоп-кодонов к аминокислоте.

Сегодня ни для кого не секрет, что программа жизнедеятельности всех живых организмов записана на молекуле ДНК. Проще всего представить молекулу ДНК в виде длинной лестницы. Вертикальные стойки этой лестницы состоят из молекул сахара, кислорода и фосфора. Вся важная рабочая информация в молекуле записана на перекладинах лестницы — они состоят из двух молекул, каждая из которых крепится к одной из вертикальных стоек. Эти молекулы — азотистые основания — называются аденин, гуанин, тимин и цитозин, но обычно их обозначают просто буквами А, Г, Т и Ц. Форма этих молекул позволяет им образовывать связи — законченные ступеньки — лишь определенного типа. Это связи между основаниями А и Т и между основаниями Г и Ц (образованную таким образом пару называют «парой оснований» ). Других типов связи в молекуле ДНК быть не может.

Спускаясь по ступенькам вдоль одной цепи молекулы ДНК, вы получите последовательность оснований. Именно это сообщение в виде последовательности оснований и определяет поток химических реакций в клетке и, следовательно, особенности организма, обладающего данной ДНК. Согласно центральной догме молекулярной биологии , на молекуле ДНК закодирована информация о белках , которые, в свою очередь, выступая в роли ферментов (см. Катализаторы и ферменты), регулируют все химические реакции в живых организмах.

Строгое соответствие между последовательностью пар оснований в молекуле ДНК и последовательностью аминокислот, составляющих белковые ферменты, называется генетическим кодом. Генетический код был расшифрован вскоре после открытия двуспиральной структуры ДНК. Было известно, что недавно открытая молекула информационной , или матричной РНК (иРНК, или мРНК), несет информацию, записанную на ДНК. Биохимики Маршалл Уоррен Ниренберг (Marshall W. Nirenberg) и Дж. Генрих Маттеи (J. Heinrich Matthaei) из Национального института здравоохранения в городке Бетезда под Вашингтоном, округ Колумбия, поставили первые эксперименты, которые привели к разгадке генетического кода.

Они начали с того, что синтезировали искусственные молекулы иРНК, состоявшие только из повторяющегося азотистого основания урацила (который является аналогом тимина, «Т», и образует связи только с аденином, «А», из молекулы ДНК). Они добавляли эти иРНК в тестовые пробирки со смесью аминокислот, причем в каждой пробирке лишь одна из аминокислот была помечена радиоактивной меткой. Исследователи обнаружили, что искусственно синтезированная ими иРНК инициировала образование белка лишь в одной пробирке, где находилась меченая аминокислота фенилаланин. Так они установили, что последовательность «—У—У—У—» на молекуле иРНК (и, следовательно, эквивалентную ей последовательность «—А—А—А—» на молекуле ДНК) кодирует белок, состоящий только из аминокислоты фенилаланина. Это было первым шагом к расшифровке генетического кода.

Сегодня известно, что три пары оснований молекулы ДНК (такой триплет получил название кодон ) кодируют одну аминокислоту в белке. Выполняя эксперименты, аналогичные описанному выше, генетики в конце концов расшифровали весь генетический код, в котором каждому из 64 возможных кодонов соответствует определенная аминокислота.

Генетический код, выраженный в кодонах, это система кодирования информации о строении белков, присущая всем живым организмам планеты. Его расшифровка заняла десятилетие, а вот то, что он существует, наука понимала почти столетие. Универсальность, специфичность, однонаправленность, а особенно вырожденность генетического кода имеют важное биологическое значение.

История открытий

Проблема кодирования всегда была ключевой в биологии. К матричному строению генетического кода наука продвигалась довольно неспешно. С момента обнаружения Дж. Уотсоном и Ф. Криком в 1953 году двойной спиральной структуры ДНК начался этап разгадывания самой структуры кода, который побудил веру в величие природы. Линейная структура белков и такая же структура ДНК подразумевала наличие генетического кода как соответствия двух текстов, но записанных при помощи разных алфавитов. И если алфавит белков был известен, то знаки ДНК стали предметом изучения биологов, физиков и математиков.

Нет смысла описывать все шаги в решении этой загадки. Прямой эксперимент, доказавший и подтвердивший, что между кодонами ДНК и аминокислотами белка существует четкая и последовательная соответственность, провели в 1964 году Ч. Яновски и С. Бреннер. А далее - период расшифровки генетического кода in vitro (в пробирке) с использованием техник синтеза белка в бесклеточных структурах.

Полностью расшифрованный код E. Coli был обнародован в 1966 году на симпозиуме биологов в Колд-Спринг-Харборе (США). Тогда и открылась избыточность (вырожденность) генетического кода. Что это значит, объяснилось довольно просто.

Раскодирование продолжается

Получение данных о расшифровке наследственного кода стало одним из самых значительных событий прошлого столетия. Сегодня наука продолжает углубленно исследовать механизмы молекулярных кодировок и его системных особенностей и переизбытка знаков, в чем выражается свойство вырожденности генетического кода. Отдельная отрасль изучения - возникновение и эволюционирование системы кодирования наследственного материала. Доказательства связи полинуклеотидов (ДНК) и полипептидов (белки) дали толчок развитию молекулярной биологии. А та, в свою очередь, биотехнологиям, биоинженерии, открытиям в селекции и растениеводстве.

Догмы и правила

Главная догма молекулярной биологии - информация передается с ДНК на информационную РНК, а после с нее на белок. В обратном направлении передача возможна с РНК на ДНК и с РНК на другую РНК.

Но матрицей или основой всегда остается ДНК. И все остальные фундаментальные особенности передачи информации - это отражение этого матричного характера передачи. А именно передачи путем осуществления синтеза на матрице других молекул, которые и станут структурой воспроизводства наследственной информации.

Генетический код

Линейное кодирование структуры белковых молекул осуществляется с помощью комплементарных кодонов (триплетов) нуклеотидов, которых всего 4 (адеин, гуанин, цитозин, тимин (урацил)), что спонтанно приводит к образованию другой цепочки нуклеотидов. Одинаковое число и химическая комплиментарность нуклеотидов - это главное условие такого синтеза. Но при образовании белковой молекулы качества соответствия количества и качества мономеров нет (ДНК нуклеотиды - аминокислоты белка). Это и есть природный наследственный код - система записи в последовательности нуклеотидов (кодонах) последовательности аминокислот в белке.

Генетический код обладает несколькими свойствами:

  • Триплетность.
  • Однозначность.
  • Направленность.
  • Неперекрываемость.
  • Избыточность (вырожденность) генетического кода.
  • Универсальность.

Приведем краткую характеристику, концентрируя внимание на биологическом значении.

Триплетность, непрерывность и наличие стоп-сигналов

Каждой из 61 аминокислоты соответствует один смысловой триплет (тройка) нуклеотидов. Три триплета не несут информацию об аминокислоте и являются стоп-кодонами. Каждый нуклеотид в цепочке входит в состав триплета, а не существует сам по себе. В конце и в начале цепочки нуклеотидов, отвечающих за один белок, находятся стоп-кодоны. Они запускают или останавливают трансляцию (синтез белковой молекулы).

Специфичность, неперекрываемость и однонаправленность

Каждый кодон (триплет) кодирует только одну аминокислоту. Каждый триплет не зависит от соседнего и не перекрывается. Один нуклеотид может входить только в один триплет в цепочке. Синтез белка идет всегда только в одном направлении, что регулируют стоп-кодоны.

Избыточности генетического кода

Каждый триплет нуклеотидов кодирует одну аминокислоту. Всего 64 нуклеотида, из них 61 - кодируют аминокислоты (смысловые кодоны), а три - бессмысленные, то есть аминокислоту не кодируют (стоп-кодоны). Избыточность (вырожденность) генетического кода заключается в том, что в каждом триплете могут быть произведены замены - радикальные (приводят к замене аминокислоты) и консервативные (не меняют класс аминокислоты). Легко посчитать, что если в триплете можно провести 9 замен (1, 2 и 3 позиция), каждый нуклеотид можно заменить на 4 - 1 = 3 других варианта, то общее количество возможных вариантов замен нуклеотида будет 61 по 9 = 549.

Вырожденность генетического кода проявляется в том, что 549 вариантов - это намного больше, чем необходимо для закодировки информации о 21 аминокислоте. При этом из 549 вариантов 23 замены приведут к образованию стоп-кодонов, 134 + 230 замены - консервативны, и 162 замены - радикальны.

Правило вырожденности и исключения

Если два кодона имеют два одинаковых первых нуклеотида, а оставшиеся представлены нуклеотидами одного класса (пуриновые или пиримидиновые), то они несут информацию об одной и той же аминокислоте. Это и есть правило вырожденности или избыточности генетического кода. Два исключения - АУА и УГА - первый кодирует метионин, хотя должен был бы изолейцин, а второй - стоп-кодон, хотя должен был бы кодировать триптофан.

Значение вырожденности и универсальности

Именно эти два свойства генетического кода имеют наибольшее биологическое значение. Все свойства, перечисленные выше, характерны для наследственной информации всех форм живых организмов на нашей планете.

Вырожденность генетического кода имеет приспособительное значение, как многократное дублирование кода одной аминокислоты. Кроме того, это означает снижение значимости (вырождение) третьего нуклеотида в кодоне. Такой вариант сводит к минимуму мутационные повреждения в ДНК, которые повлекут за собой грубые нарушения в структуре белка. Это защитный механизм живых организмов планеты.

Лекция 5. Генетический код

Определение понятия

Генетический код - это система записи информации о последовательности расположения аминокислот в белках с помощью последовательности расположения нуклеотидов в ДНК.

Поскольку ДНК непосредственного участия в синтезе белка не принимает, то код записывается на языке РНК. В РНК вместо тимина входит урацил.

Свойства генетического кода

1. Триплетность

Каждая аминокислота кодируется последовательностью из 3-х нуклеотидов.

Определение: триплет или кодон - последовательность из трех нуклеотидов, кодирующая одну аминокислоту.

Код не может быть моноплетным, поскольку 4 (число разных нуклеотидов в ДНК) меньше 20. Код не может быть дуплетным, т.к. 16 (число сочетаний и перестановок из 4-х нуклеотидов по 2) меньше 20. Код может быть триплетным, т.к. 64 (число сочетаний и перестановок из 4-х по 3) больше 20.

2. Вырожденность.

Все аминокислоты, за исключением метионина и триптофана, кодируются более чем одним триплетом:

2 АК по 1 триплету = 2.

9 АК по 2 триплета = 18.

1 АК 3 триплета = 3.

5 АК по 4 триплета = 20.

3 АК по 6 триплетов = 18.

Всего 61 триплет кодирует 20 аминокислот.

3. Наличие межгенных знаков препинания.

Определение:

Ген - это участок ДНК, кодирующий одну полипептидную цепь или одну молекулу tPHK , r РНК или sPHK .

Гены tPHK , rPHK , sPHK белки не кодируют.

В конце каждого гена, кодирующего полипептид, находится, по меньшей мере, один из 3-х триплетов, кодирующих терминирующие кодоны РНК, или стоп-сигналы. В мРНК они имеют следующий вид: UAA , UAG , UGA . Они терминируют (оканчивают) трансляцию.

Условно к знакам препинания относится и кодон AUG - первый после лидерной последовательности. (См. лекцию 8) Он выполняет функцию заглавной буквы. В этой позиции он кодирует формилметионин (у прокариот).

4. Однозначность.

Каждый триплет кодирует лишь одну аминокислоту или является терминатором трансляции.

Исключение составляет кодон AUG . У прокариот в первой позиции (заглавная буква) он кодирует формилметионин, а в любой другой - метионин.

5. Компактность, или отсутствие внутригенных знаков препинания.
Внутри гена каждый нуклеотид входит в состав значащего кодона.

В 1961 г. Сеймур Бензер и Френсис Крик экспериментально доказали триплетность кода и его компактность.

Суть эксперимента: "+" мутация - вставка одного нуклеотида. "-" мутация - выпадение одного нуклеотида. Одиночная "+" или "-" мутация в начале гена портит весь ген. Двойная "+" или "-" мутация тоже портит весь ген.

Тройная "+" или "-" мутация в начале гена портит лишь его часть. Четверная "+" или "-" мутация опять портит весь ген.

Эксперимент доказывает, что код тршплетен и внутри гена нет знаков препинания. Эксперимент был проведен на двух рядом расположенных фаговых генах и показал, кроме того, наличие знаков препинания между генами.

6. Универсальность.

Генетический код един для всех живущих на Земле существ.

В 1979 г. Беррел открыл идеальный код митохондрий человека.

Определение:

«Идеальным» называется генетический код, в котором выполняется правило вырожденности квазидублетного кода: Если в двух триплетах совпадают первые два нуклеотида, а третьи нуклеотиды относятся к одному классу (оба - пурины или оба - пиримидины), то эти триплеты кодируют одну и ту же аминокислоту.

Из этого правила в универсальном коде есть два исключения. Оба отклонения от идеального кода в универсальном касаются принципиальных моментов: начала и конца синтеза белка:

Кодон

Универсальный

код

Митохондриальные коды

Позвоночные

Беспозвоночные

Дрожжи

Растения

STOP

STOP

С UA

А G А

STOP

STOP

230 замен не меняют класс кодируемой аминокислоты. к рываемость.

В 1956 г. Георгий Гамов предложил вариант перекрываемого кода. Согласно Гамовскому коду, каждый нуклеотид, начиная с третьего в гене, входит в состав 3-х кодонов. Когда генетический код был расшифрован, оказалось, что он неперекрываем, т.е. каждый нуклеотид входит в состав лишь одного кодона.

Достоинства перекрываемого генетического кода: компактность, меньшая зависимость структуры белка от вставки или делеции нуклеотида.

Недостаток: большая зависимость структуры белка от замены нуклеотида и ограничение на соседей.

В 1976 г. была секвенирована ДНК фага φХ174. У него одноцепочечная кольцевая ДНК, состоящая из 5375 нуклеотидов. Было известно, что фаг кодирует 9 белков. Для 6 из них были определены гены, располагающиеся друг за другом.

Выяснилось, что есть перекрывание. Ген Е полностью находится внутри гена D . Его инициирующий кодон появляется в результате сдвига считывания на один нуклеотид. Ген J начинается там, где кончается ген D . Инициирующий кодон гена J перекрывается с терминирующим кодоном гена D в результате сдвига на два нуклеотида. Конструкция называется "сдвиг рамки считывания" на число нуклеотидов, некратное трем. На сегодняшний день перекрывание показано только для нескольких фагов.

Информационная емкость ДНК

На Земле живет 6 миллиардов человек. Наследственная информация о них
заключена в 6x10 9 сперматозоидах. По разным оценкам у человека от 30 до 50
тысяч генов. У всех людей ~ 30x10 13 генов или 30x10 16 пар нуклеотидов, которые составляют 10 17 кодонов. Средняя книжная страница содержит 25x10 2 знаков. ДНК 6x10 9 сперматозоидов содержит информацию, равную по объему примерно

4x10 13 книжных страниц. Эти страницы заняли бы объем 6-и зданий НГУ. 6x10 9 сперматозоидов занимают половину наперстка. Их ДНК занимает менее четверти наперстка.

Генетический код - это способ кодирования последовательности аминокислот в молекуле белка с помощью последовательности нуклеотидов в молекуле нуклеиновой кислоты. Свойства генетического кода вытекают из особенностей этого кодирования.

Каждой аминокислоте белка сопоставляется в соответствие три подряд идущих нуклеотида нуклеиновой кислоты - триплет , или кодон . Каждый из нуклеотидов может содержать одно из четырех азотистых оснований. В РНК это аденин (A), урацил (U), гуанин (G), цитозин (C). По-разному комбинируя азотистые основания (в данном случае содержащие их нуклеотиды) можно получить множество различных триплетов: AAA, GAU, UCC, GCA, AUC и т. д. Общее количество возможных комбинаций - 64, т. е. 4 3 .

В состав белков живых организмов входит около 20 аминокислот. Если бы природа «задумала» кодировать каждую аминокислоту не тремя, а двумя нуклеотидами, то разнообразия таких пар не хватило бы, так как их оказалось бы всего 16, т.е. 4 2 .

Таким образом, основное свойство генетического кода - его триплетность . Каждая аминокислота кодируется тройкой нуклеотидов.

Поскольку возможных разных триплетов существенно больше, чем используемых в биологических молекулах аминокислот, то в живой природе было реализовано такое свойство как избыточность генетического кода. Многие аминокислоты стали кодироваться не одним кодоном, а несколькими. Например, аминокислота глицин кодируется четырьмя различными кодонами: GGU, GGC, GGA, GGG. Избыточность также называют вырожденностью .

Соответствие между аминокислотами и кодонами отражают в виде таблиц. Например, таких:

По отношению к нуклеотидам генетический код обладает таким свойством как однозначность (или специфичность ): каждый кодон соответствует только одной аминокислоте. Например, кодоном GGU можно закодировать только глицин и больше никакую другую аминокислоту.

Еще раз. Избыточность - это про то, что несколько триплетов могут кодировать одну и ту же аминокислоту. Специфичность - каждый конкретный кодон может кодировать только одну аминокислоту.

В генетическом коде нет специальных знаков препинания (если не считать стоп-кодонов, обозначающих окончание синтеза полипептида). Функцию знаков препинания выполняют сами триплеты - окончание одного обозначает, что следом начнется другой. Отсюда следуют следующие два свойства генетического кода: непрерывность и неперекрываемость . Под непрерывность понимают считывание триплетов сразу друг за другом. Под неперекрываемостью - то, что каждый нуклеотид может входить в состав только одного триплета. Так первый нуклеотид следующего триплета всегда стоит после третьего нуклеотида предшествующего триплета. Кодон не может начаться со второго или третьего нуклеотида предшествующего кодона. Другими словами, код не перекрывается.

Генетический код обладает свойством универсальности . Он един для всех организмов на Земле, что говорит о единстве происхождения жизни. При этом встречаются очень редкие исключения. Например, некоторые триплеты митохондрий и хлоропластов кодируют другие, а не обычные для них, аминокислоты. Это может говорить о том, что на заре развития жизни существовали немного различные вариации генетического кода.

Наконец, генетический код обладает помехоустойчивостью , которая является следствием такого его свойства как избыточность. Точечные мутации , иногда происходящие в ДНК , обычно приводят к замене одного азотистого основания на другое. При этом изменяется триплет. Например, было AAA, после мутации стало AAG. Однако подобные изменения не всегда приводят к изменению аминокислоты в синтезируемом полипептиде, так как оба триплета из-за свойства избыточности генетического кода могут соответствовать одной аминокислоте. Учитывая, что мутации чаще вредны, свойство помехоустойчивости полезно.