Понятие о гене, генетическом коде.

Генетический код разных организмов обладает некоторыми общими свойствами:
1) Триплетность. Для записи любой, в том числе и наследственной информации используется определенный шифр, элементом которого является буква, или символ. Совокупность таких символов составляет алфавит. Отдельные сообщения записываются комбинацией символов, которые называются кодовыми группами, или кодонами. Известен алфавит, состоящий всего из двух символов, - это азбука Морзе. В ДНК 4 буквы – первые буквы названий азотистых оснований (А, Г, Т, Ц), значит, генетический алфавит состоит всего из 4 символов. Что же является кодовой группой, или, словом генетического кода? Известно 20 основных аминокислот, содержание которых должно быть записано генетическим кодом, т. е. 4 буквы должны дать 20 кодовых слов. Допустим, слово состоит из одного символа, тогда мы получим только 4 кодовые группы. Если же слово состоит из двух символов, то таких групп будет только 16, а этого явно мало, чтобы закодировать 20 аминокислот. Следовательно, в кодовом слове должно быть минимум 3 нуклеотида, что даст 64 (43) сочетания. Такого количества триплетных сочетаний вполне достаточно для кодирования всех аминокислот. Таким образом, кодон генетического кода – это триплет нуклеотидов.
2) Вырожденность (избыточность) – свойство генетического кода состоящее с одной стороны, в том, что он содержит избыточные триплеты, т. е. синонимы, а с другой – «бессмысленные» триплеты. Поскольку код включает 64 сочетания, а кодируются только 20 аминокислот, то некоторые аминокислоты кодируются несколькими триплетами (аргинин, серин, лейцин – шестью; валин, пролин, аланин, глицин, треонин – четырьмя; изолейцин – тремя; фенилаланин, тирозин, гистидин, лизин, аспарагин, глутамин, цистеин, аспарагиновая и глутаминовая кислоты – двумя; метионин и триптофан – одним триплетом). Некоторые кодовые группы (УАА, УАГ, УГА) вообще не несут смысловой нагрузки, т. е. являются «бессмысленными» триплетами. «Бессмысленные», или nonsense, кодоны выполняют функцию терминаторов цепей – знаков препинания в генетическом тексте – служат сигналом окончания синтеза белковой цепи. Такая избыточность кода имеет большое значение для повышения надежности передачи генетической информации.
3) Неперекрываемость. Кодовые триплеты никогда не перекрываются, т. е. всегда транслируются вместе. При считывании информации с молекулы ДНК невозможно использование азотистого основания одного триплета в комбинации с основаниями другого триплета.
4) Однозначность. Нет случаев, когда один и тот же триплет соответствовал бы более чем одной кислоте.
5) Отсутствие разделительных знаков внутри гена. Генетический код считывается с определенного места без запятых.
6) Универсальность. У различных видов живых организмов (вирусов, бактерий, растений, грибов и животных) одинаковые триплеты кодируют одни и те же аминокислоты.
7) Видовая специфичность. Количество и последовательность азотистых оснований в цепи ДНК у разных организмов различные.

ГЕНЕТИЧЕСКИЙ КОД (греч, genetikos относящийся к происхождению; син.: код, биологический код, аминокислотный код, белковый код, код нуклеиновых к-т ) - система записи наследственной информации в молекулах нуклеиновых кислот животных, растений, бактерий и вирусов чередованием последовательности нуклеотидов.

Генетическая информация (рис.) из клетки в клетку, из поколения в поколение, за исключением РНК-содержащих вирусов, передается путем редупликации молекул ДНК (см. Репликация). Реализация наследственной информации ДНК в процессе жизнедеятельности клетки осуществляется через 3 типа РНК: информационную (иРНК или мРНК), рибосомную (рРНК) и транспортную (тРНК), которые с помощью фермента РНК-полимеразы синтезируются на ДНК как на матрице. При этом последовательность нуклеотидов в молекуле ДНК однозначно определяет последовательность нуклеотидов во всех трех типах РНК (см. Транскрипция). Информацию гена (см.), кодирующего белковую молекулу, несет только иРНК. Конечным продуктом реализации наследственной информации является синтез белковых молекул, специфичность которых определяется последовательностью входящих в них аминокислот (см. Трансляция).

Поскольку в составе ДНК или РНК представлено только по 4 разных азотистых основания [в ДНК - аденин (А), тимин (Т), гуанин (Г), цитозин (Ц); в РНК - аденин (А), урацил (У), цитозин (Ц), гуанин (Г)], последовательность которых определяет последовательность 20 аминокислот в составе белка, возникает проблема Г. к., т. е. проблема перевода 4-буквенного алфавита нуклеиновых к-т в 20-буквенный алфавит полипептидов.

Впервые идея матричного синтеза белковых молекул с правильным предсказанием свойств гипотетической матрицы была сформулирована Н. К. Кольцовым в 1928 г. В 1944 г. Эйвери (О. Avery) с соавт, установил, что за передачу наследственных признаков при трансформации у пневмококков ответственны молекулы ДНК. В 1948 г. Чаргафф (E. Chargaff) показал, что во всех молекулах ДНК имеет место количественное равенство соответствующих нуклеотидов (А-T, Г-Ц). В 1953 г. Ф. Крик, Дж. Уотсон и Уилкинс (М. H. F. Wilkins), исходя из этого правила и данных рентгеноструктурного анализа (см.), пришли к выводу, что молекул а ДНК представляет собой двойную спираль, состоящую из двух полинуклеотидных нитей, соединенных между собой водородными связями. Причем против А одной цепи во второй может находиться только Т, против Г - только Ц. Эта комплементарность приводит к тому, что последовательность нуклеотидов одной цепи однозначно определяет последовательность другой. Второй существенный вывод, вытекающий из этой модели,- молекула ДНК способна к самовоспроизведению.

В 1954 г. Гамов (G. Gamow) сформулировал проблему Г. к. в ее современном виде. В 1957 г. Ф. Крик высказал Гипотезу адаптера, предположив, что аминокислоты взаимодействуют с нуклеиновой к-той не непосредственно, а через посредников (теперь известных под названием тРНК). В ближайшие после этого годы все принципиальные звенья общей схемы передачи генетической информации, вначале гипотетичные, были подтверждены экспериментально. В 1957 г. были открыты иРНК [А. С. Спирин, А. Н. Белозерский с соавт.; Фолькин и Астрахан (E. Volkin, L. Astrachan)] и тРНК [Хоугленд (М. В. Hoagland)]; в 1960 г. синтезирована ДНК вне клетки с использованием в качестве матрицы существующих макромолекул ДНК (А. Корнберг) и открыт ДНК-зависимый синтез РНК [Вейсс (S. В. Weiss) с соавт.]. В 1961 г. была создана бесклеточная система, в к-рой в присутствии естественной РНК или синтетических полирибонуклеотидов осуществлялся синтез белковоподобных веществ [М. Ниренберг и Маттеи (J. H. Matthaei)]. Проблема познания Г. к. состояла из исследования общих свойств кода и собственно его расшифровки, т. е. выяснения, какие комбинации нуклеотидов (кодоны) кодируют определенные аминокислоты.

Общие свойства кода были выяснены независимо от его расшифровки и в основном до нее путем анализа молекулярных закономерностей образования мутаций (Ф. Крик и соавт., 1961; Н. В. Лучник, 1963). Они сводятся к следующему:

1. Код универсален, т. е. идентичен, по крайней мере в основном, для всех живых существ.

2. Код триплетен, т. е. каждая аминокислота кодируется тройкой нуклеотидов.

3. Код неперекрывающийся, т. е. данный нуклеотид не может входить в состав более чем одного кодона.

4. Код вырожден, т. е. одна аминокислота может кодироваться несколькими триплетами.

5. Информация о первичной структуре белка считывается с иРНК последовательно, начиная с фиксированной точки.

6. Большинство возможных триплетов имеет «смысл», т. е. кодирует аминокислоты.

7. Из трех «букв» кодона преимущественное значение имеют лишь две (облигатные), третья же (факультативная) несет значительно меньшую информацию.

Прямая расшифровка кода состояла бы в сравнении последовательности нуклеотидов в структурном гене (или синтезированной на нем иРНК) с последовательностью аминокислот в соответствующем белке. Однако такой путь пока технически невозможен. Были применены два других пути: синтез белка в бесклеточной системе с использованием в качестве матрицы искусственных полирибонуклеотидов известного состава и анализ молекулярных закономерностей образования мутаций (см.). Первый принес положительные результаты раньше и исторически сыграл в расшифровке Г. к. большую роль.

В 1961 г. М. Ниренберг и Маттеи применили в качестве матрицы гомо-полимер - синтетическую полиуридиловую к-ту (т. е. искусственную РНК состава УУУУ...) и получили полифенилаланин. Из этого следовало, что кодон фенилаланина состоит из нескольких У, т. е. в случае триплетного кода расшифровывается как УУУ. Позже наряду с гомополимерами были использованы полирибонуклеотиды, состоявшие из разных нуклеотидов. При этом был известен только состав полимеров, расположение же нуклеотидов в них было статистическим, поэтому и анализ результатов был статистическим и давал косвенные выводы. Довольно быстро удалось найти хотя бы по одному триплету для всех 20 аминокислот. Выяснилось, что присутствие органических растворителей, изменение pH или температуры, некоторые катионы и особенно антибиотики делают код неоднозначным: те же кодоны начинают стимулировать включение других аминокислот, в некоторых случаях один кодон начинал кодировать до четырех разных аминокислот. Стрептомицин влиял на считывание информации как в бесклеточных системах, так и in vivo, причем был эффективен только на стрептомицинчувствительных штаммах бактерий. У стрептомицинзависимых штаммов он «исправлял» считывание с кодонов, изменившихся в результате мутации. Подобные результаты давали основание сомневаться в правильности расшифровки Г. к. с помощью бесклеточной системы; требовалось подтверждение, и в первую очередь данными in vivo.

Основные данные о Г. к. in vivo получены при анализе аминокислотного состава белков у организмов, обработанных мутагенами (см.) с известным механизмом действия, напр, азотистой к-той, к-рая вызывает в молекуле ДНК замену Ц на У и А на Г. Полезную информацию дают также анализ мутаций, вызванных неспецифическими мутагенами, сравнение различий в первичной структуре родственных белков у разных видов, корреляция между составом ДНК и белков и т. п.

Расшифровка Г. к. на основании данных in vivo и in vitro дала совпадающие результаты. Позже были разработаны три других метода расшифровки кода в бесклеточных системах: связывание аминоацил-тРНК (т. е. тРНК с присоединенной активированной аминокислотой) тринуклеотидами известного состава (М. Ниренберг и соавт., 1965), связывание аминоацил-тРНК полинуклеотидами, начинающимися с определенного триплета (Маттеи с соавт., 1966), и использование в качестве иРНК полимеров, в которых известен не только состав, но и порядок нуклеотидов (X. Корана и соавт., 1965). Все три метода дополняют друг друга, а результаты находятся в соответствии с данными, полученными в опытах in vivo.

В 70-х гг. 20 в. появились методы особенно надежной проверки результатов расшифровки Г. к. Известно, что мутации, возникающие под действием профлавина, состоят в выпадении или вставке отдельных нуклеотидов, что приводит к сдвигу рамки считывания. У фага Т4 был вызван профлавином ряд мутаций, при которых изменился состав лизоцима. Этот состав был проанализирован и сопоставлен с теми кодонами, которые должны были получиться при сдвиге рамки считывания. Получилось полное соответствие. Дополнительно этот метод позволил установить, какие именно триплеты вырожденного кода кодируют каждую из аминокислот. В 1970 г. Адамсу (J. М. Adams) с сотрудниками удалось провести частичную расшифровку Г. к. прямым методом: у фага R17 определили последовательность оснований во фрагменте длиной в 57 нуклеотидов и сравнили с аминокислотной последовательностью белка его оболочки. Результаты полностью совпали с полученными менее прямыми методами. Т. о., код расшифрован полностью и верно.

Результаты расшифровки сведены в таблицу. В ней указан состав кодонов и РНК. Состав антикодонов тРНК комплементарен кодонам иРНК, т. е. вместо У в них находится А, вместо А - У, вместо Ц - Г и вместо Г - Ц, и соответствует кодонам структурного гена (той нити ДНК, с к-рой считывается информация) с той лишь разницей, что место тимина занимает урацил. Из 64 триплетов, которые могут быть образованы сочетанием 4 нуклеотидов, 61 имеет «смысл», т. е. кодирует аминокислоты, а 3 являются «нонсенсами» (лишенными смысла). Между составом триплетов и их смыслом имеется довольно четкая зависимость, к-рая была обнаружена еще при анализе общих свойств кода. В ряде случаев триплеты, кодирующие определенную аминокислоту (напр., пролин, аланин), характеризуются тем, что два первых нуклеотида (облигатные) у них одинаковы, а третий (факультативный) может быть любым. В других случаях (при кодировании, напр., аспарагина, глутамина) один и тот же смысл имеют два сходных триплета, у которых совпадают два первых нуклеотида, а на месте третьего стоит любой пурин или любой пиримидин.

Нонсенс-кодоны, 2 из которых имеют специальные названия, соответствующие обозначению фаговых мутантов (УАА-охра, УАГ-амбер, УГА-опал), хотя и не кодируют каких-либо аминокислот, но имеют большое значение при считывании информации, кодируя конец полипептидной цепи.

Считывание информации происходит в направлении от 5 1 -> 3 1 - к концу нуклеотидной цепи (см. Дезоксирибонуклеиновые кислоты). При этом синтез белка идет от аминокислоты со свободной аминогруппой к аминокислоте со свободной карбоксильной группой. Начало синтеза кодируется триплетами АУГ и ГУГ, которые в этом случае включают специфичную стартовую аминоацил-тРНК, а именно N-формилметио-нил-тРНК. Эти же триплеты при локализации внутри цепи кодируют соответственно метионин и валин. Неоднозначность снимается тем, что началу считывания предшествует нонсенс. Есть данные, говорящие в пользу того, что граница между участками иРНК, кодирующими разные белки, состоит более чем из двух триплетов и что в этих местах меняется вторичная структура РНК; этот вопрос находится в стадии исследования. Если нонсенс-кодон возникает внутри структурного гена, то соответствующий белок строится только до места расположения этого кодона.

Открытие и расшифровка генетического кода - выдающееся достижение молекулярной биологии - оказало влияние на все биол, науки, положив в ряде случаев начало развитию специальных крупных разделов (см. Молекулярная генетика). Эффект открытия Г. к. и связанных с ним исследований сравнивают с тем эффектом, который оказала на биол, науки теория Дарвина.

Универсальность Г. к. является прямым доказательством универсальности основных молекулярных механизмов жизни у всех представителей органического мира. Между тем большие различия в функциях генетического аппарата и его строении при переходе от прокариотов к эукариотам и от одноклеточных к многоклеточным, вероятно, связаны и с молекулярными различиями, исследование которых - одна из задач будущего. Поскольку исследования Г. к.- дело лишь последних лет, значение полученных результатов для практической медицины носит лишь Косвенный характер, позволяя пока понять природу заболеваний, механизм действия возбудителей болезней и лекарственных веществ. Однако открытие таких явлений, как трансформация (см.), трансдукция (см.), супрессия (см.), указывает на принципиальную возможность исправления патологически измененной наследственной информации или ее коррекции - так наз. генная инженерия (см.).

Таблица. ГЕНЕТИЧЕСКИЙ КОД

Первый нуклеотид кодона

Второй нуклеотид кодона

Третий, нуклеотид кодона

Фенилаланин

J Нонсенс

Триптофан

Гистидин

Глутаминовая кислота

Изолейцин

Аспарагиновая

Метионин

Аспарагин

Глутамин

* Кодирует конец цепи.

** Кодирует также начало цепи.

Библиография: Ичас М. Биологический код, пер. с англ., М., 1971; Лучник Н.Б. Биофизика цитогенетических поражений и генетический код, Л., 1968; Молекулярная генетика, пер. с англ., под ред. А. Н. Белозерского, ч. 1, М., 1964; Нуклеиновые кислоты, пер. с англ., под ред. А. Н. Белозерского, М., 1965; Уотсон Дж. Д. Молекулярная биология гена, пер. с англ., М., 1967; Физиологическая генетика, под ред. М. Е. Лобашева С. Г., Инге-Вечтомо-ва, Л., 1976, библиогр.; Desoxyribonuc-leins&ure, Schlttssel des Lebens, hrsg. v„ E. Geissler, B., 1972; The genetic code, Gold Spr. Harb. Symp. quant. Biol., v. 31, 1966; W o e s e C. R. The genetic code, N. Y. a. o., 1967.

Под генетическим кодом принято понимать такую систему знаков, обозначающих последовательное расположение соединений нуклеотидов в ДНКа и РНКа, которая соответствует другой знаковой системе, отображающей последовательность аминокислотных соединений в молекуле белка.

Это важно!

Когда учёным удалось изучить свойства генетического кода, одним из главных была признана универсальность. Да, как ни странно это звучит, все объединяет один, универсальный, общий генетический код. Формировался он на протяжении большого временного промежутка, и процесс закончился около 3,5 миллиардов лет назад. Следовательно, в структуре кода можно проследить следы его эволюции, от момента зарождения до сегодняшнего дня.

Когда говорится о последовательности расположения элементов в генетическом коде, имеется в виду, что она далеко не хаотична, а имеет строго определённый порядок. И это тоже во многом определяет свойства генетического кода. Это равнозначно расположению букв и слогов в словах. Стоит нарушить привычный порядок, и большинство того, что мы будем читать на книжных или газетных страницах, превратится в нелепую абракадабру.

Основные свойства генетического кода

Обычно код несёт в себе какую-либо информацию, зашифрованную особым образом. Для того чтобы расшифровать кода, необходимо знать отличительные особенности.

Итак, основные свойства генетического кода - это:

  • триплетность;
  • вырожденность или избыточность;
  • однозначность;
  • непрерывность;
  • уже указанная выше универсальность.

Остановимся подробнее на каждом свойстве.

1. Триплетность

Это когда три соединения нуклеотидов образуют последовательную цепочку внутри молекулы (т.е. ДНК или же РНК). В результате создаётся соединение триплета или кодирует одну из аминокислот, место её нахождения в цепи пептидов.

Различают кодоны (они же кодовые слова!) по их последовательности соединения и по типу тех азотистых соединений (нуклеотидов), которые входят в их состав.

В генетике принято выделять 64 кодоновых типа. Они могут образовывать комбинации из четырёх типов нуклеотидов по 3 в каждом. Это равносильно возведению числа 4 в третью степень. Таким образом, возможно образование 64-х нуклеотидных комбинаций.

2. Избыточность генетического кода

Это свойство прослеживается тогда, когда для шифрования одной аминокислоты требуется несколько кодонов, обычно в пределах 2-6. И только и триптофана можно кодировать с помощью одного триплета.

3. Однозначность

Она входит в свойства генетического кода как показатель здоровой генной наследственности. Например, о хорошем состоянии крови, о нормальном гемоглобине может рассказать медикам стоящий на шестом месте в цепочке триплет ГАА. Именно он несёт информацию о гемоглобине, и им же кодируется А если человек болен анемией, один из нуклеотидов заменяется на другую букву кода - У, что и является сигналом заболевания.

4. Непрерывность

При записи этого свойства генетического кода следует помнить, что кодоны, как звенья цепочки, располагаются не на расстоянии, а в прямой близости, друг за другом в нуклеиновой кислотной цепи, и цепь эта не прерывается - в ней нет начала или конца.

5. Универсальность

Никогда не следует забывать, что всё сущее на Земле объединено общим генетическим кодом. И потому у примата и человека, у насекомого и птицы, столетнего баобаба и едва проклюнувшейся из-под земли травинки одинаковыми триплетами кодируются схожие аминокислоты.

Именно в генах заложена основная информация о свойствах того или иного организма, своего рода программа, которую организм получает в наследство от живших ранее и которая существует как генетический код.

Лекция 5. Генетический код

Определение понятия

Генетический код - это система записи информации о последовательности расположения аминокислот в белках с помощью последовательности расположения нуклеотидов в ДНК.

Поскольку ДНК непосредственного участия в синтезе белка не принимает, то код записывается на языке РНК. В РНК вместо тимина входит урацил.

Свойства генетического кода

1. Триплетность

Каждая аминокислота кодируется последовательностью из 3-х нуклеотидов.

Определение: триплет или кодон - последовательность из трех нуклеотидов, кодирующая одну аминокислоту.

Код не может быть моноплетным, поскольку 4 (число разных нуклеотидов в ДНК) меньше 20. Код не может быть дуплетным, т.к. 16 (число сочетаний и перестановок из 4-х нуклеотидов по 2) меньше 20. Код может быть триплетным, т.к. 64 (число сочетаний и перестановок из 4-х по 3) больше 20.

2. Вырожденность.

Все аминокислоты, за исключением метионина и триптофана, кодируются более чем одним триплетом:

2 АК по 1 триплету = 2.

9 АК по 2 триплета = 18.

1 АК 3 триплета = 3.

5 АК по 4 триплета = 20.

3 АК по 6 триплетов = 18.

Всего 61 триплет кодирует 20 аминокислот.

3. Наличие межгенных знаков препинания.

Определение:

Ген - это участок ДНК, кодирующий одну полипептидную цепь или одну молекулу tPHK , r РНК или sPHK .

Гены tPHK , rPHK , sPHK белки не кодируют.

В конце каждого гена, кодирующего полипептид, находится, по меньшей мере, один из 3-х триплетов, кодирующих терминирующие кодоны РНК, или стоп-сигналы. В мРНК они имеют следующий вид: UAA , UAG , UGA . Они терминируют (оканчивают) трансляцию.

Условно к знакам препинания относится и кодон AUG - первый после лидерной последовательности. (См. лекцию 8) Он выполняет функцию заглавной буквы. В этой позиции он кодирует формилметионин (у прокариот).

4. Однозначность.

Каждый триплет кодирует лишь одну аминокислоту или является терминатором трансляции.

Исключение составляет кодон AUG . У прокариот в первой позиции (заглавная буква) он кодирует формилметионин, а в любой другой - метионин.

5. Компактность, или отсутствие внутригенных знаков препинания.
Внутри гена каждый нуклеотид входит в состав значащего кодона.

В 1961 г. Сеймур Бензер и Френсис Крик экспериментально доказали триплетность кода и его компактность.

Суть эксперимента: "+" мутация - вставка одного нуклеотида. "-" мутация - выпадение одного нуклеотида. Одиночная "+" или "-" мутация в начале гена портит весь ген. Двойная "+" или "-" мутация тоже портит весь ген.

Тройная "+" или "-" мутация в начале гена портит лишь его часть. Четверная "+" или "-" мутация опять портит весь ген.

Эксперимент доказывает, что код тршплетен и внутри гена нет знаков препинания. Эксперимент был проведен на двух рядом расположенных фаговых генах и показал, кроме того, наличие знаков препинания между генами.

6. Универсальность.

Генетический код един для всех живущих на Земле существ.

В 1979 г. Беррел открыл идеальный код митохондрий человека.

Определение:

«Идеальным» называется генетический код, в котором выполняется правило вырожденности квазидублетного кода: Если в двух триплетах совпадают первые два нуклеотида, а третьи нуклеотиды относятся к одному классу (оба - пурины или оба - пиримидины), то эти триплеты кодируют одну и ту же аминокислоту.

Из этого правила в универсальном коде есть два исключения. Оба отклонения от идеального кода в универсальном касаются принципиальных моментов: начала и конца синтеза белка:

Кодон

Универсальный

код

Митохондриальные коды

Позвоночные

Беспозвоночные

Дрожжи

Растения

STOP

STOP

С UA

А G А

STOP

STOP

230 замен не меняют класс кодируемой аминокислоты. к рываемость.

В 1956 г. Георгий Гамов предложил вариант перекрываемого кода. Согласно Гамовскому коду, каждый нуклеотид, начиная с третьего в гене, входит в состав 3-х кодонов. Когда генетический код был расшифрован, оказалось, что он неперекрываем, т.е. каждый нуклеотид входит в состав лишь одного кодона.

Достоинства перекрываемого генетического кода: компактность, меньшая зависимость структуры белка от вставки или делеции нуклеотида.

Недостаток: большая зависимость структуры белка от замены нуклеотида и ограничение на соседей.

В 1976 г. была секвенирована ДНК фага φХ174. У него одноцепочечная кольцевая ДНК, состоящая из 5375 нуклеотидов. Было известно, что фаг кодирует 9 белков. Для 6 из них были определены гены, располагающиеся друг за другом.

Выяснилось, что есть перекрывание. Ген Е полностью находится внутри гена D . Его инициирующий кодон появляется в результате сдвига считывания на один нуклеотид. Ген J начинается там, где кончается ген D . Инициирующий кодон гена J перекрывается с терминирующим кодоном гена D в результате сдвига на два нуклеотида. Конструкция называется "сдвиг рамки считывания" на число нуклеотидов, некратное трем. На сегодняшний день перекрывание показано только для нескольких фагов.

Информационная емкость ДНК

На Земле живет 6 миллиардов человек. Наследственная информация о них
заключена в 6x10 9 сперматозоидах. По разным оценкам у человека от 30 до 50
тысяч генов. У всех людей ~ 30x10 13 генов или 30x10 16 пар нуклеотидов, которые составляют 10 17 кодонов. Средняя книжная страница содержит 25x10 2 знаков. ДНК 6x10 9 сперматозоидов содержит информацию, равную по объему примерно

4x10 13 книжных страниц. Эти страницы заняли бы объем 6-и зданий НГУ. 6x10 9 сперматозоидов занимают половину наперстка. Их ДНК занимает менее четверти наперстка.

Генетический код, выраженный в кодонах, это система кодирования информации о строении белков, присущая всем живым организмам планеты. Его расшифровка заняла десятилетие, а вот то, что он существует, наука понимала почти столетие. Универсальность, специфичность, однонаправленность, а особенно вырожденность генетического кода имеют важное биологическое значение.

История открытий

Проблема кодирования всегда была ключевой в биологии. К матричному строению генетического кода наука продвигалась довольно неспешно. С момента обнаружения Дж. Уотсоном и Ф. Криком в 1953 году двойной спиральной структуры ДНК начался этап разгадывания самой структуры кода, который побудил веру в величие природы. Линейная структура белков и такая же структура ДНК подразумевала наличие генетического кода как соответствия двух текстов, но записанных при помощи разных алфавитов. И если алфавит белков был известен, то знаки ДНК стали предметом изучения биологов, физиков и математиков.

Нет смысла описывать все шаги в решении этой загадки. Прямой эксперимент, доказавший и подтвердивший, что между кодонами ДНК и аминокислотами белка существует четкая и последовательная соответственность, провели в 1964 году Ч. Яновски и С. Бреннер. А далее - период расшифровки генетического кода in vitro (в пробирке) с использованием техник синтеза белка в бесклеточных структурах.

Полностью расшифрованный код E. Coli был обнародован в 1966 году на симпозиуме биологов в Колд-Спринг-Харборе (США). Тогда и открылась избыточность (вырожденность) генетического кода. Что это значит, объяснилось довольно просто.

Раскодирование продолжается

Получение данных о расшифровке наследственного кода стало одним из самых значительных событий прошлого столетия. Сегодня наука продолжает углубленно исследовать механизмы молекулярных кодировок и его системных особенностей и переизбытка знаков, в чем выражается свойство вырожденности генетического кода. Отдельная отрасль изучения - возникновение и эволюционирование системы кодирования наследственного материала. Доказательства связи полинуклеотидов (ДНК) и полипептидов (белки) дали толчок развитию молекулярной биологии. А та, в свою очередь, биотехнологиям, биоинженерии, открытиям в селекции и растениеводстве.

Догмы и правила

Главная догма молекулярной биологии - информация передается с ДНК на информационную РНК, а после с нее на белок. В обратном направлении передача возможна с РНК на ДНК и с РНК на другую РНК.

Но матрицей или основой всегда остается ДНК. И все остальные фундаментальные особенности передачи информации - это отражение этого матричного характера передачи. А именно передачи путем осуществления синтеза на матрице других молекул, которые и станут структурой воспроизводства наследственной информации.

Генетический код

Линейное кодирование структуры белковых молекул осуществляется с помощью комплементарных кодонов (триплетов) нуклеотидов, которых всего 4 (адеин, гуанин, цитозин, тимин (урацил)), что спонтанно приводит к образованию другой цепочки нуклеотидов. Одинаковое число и химическая комплиментарность нуклеотидов - это главное условие такого синтеза. Но при образовании белковой молекулы качества соответствия количества и качества мономеров нет (ДНК нуклеотиды - аминокислоты белка). Это и есть природный наследственный код - система записи в последовательности нуклеотидов (кодонах) последовательности аминокислот в белке.

Генетический код обладает несколькими свойствами:

  • Триплетность.
  • Однозначность.
  • Направленность.
  • Неперекрываемость.
  • Избыточность (вырожденность) генетического кода.
  • Универсальность.

Приведем краткую характеристику, концентрируя внимание на биологическом значении.

Триплетность, непрерывность и наличие стоп-сигналов

Каждой из 61 аминокислоты соответствует один смысловой триплет (тройка) нуклеотидов. Три триплета не несут информацию об аминокислоте и являются стоп-кодонами. Каждый нуклеотид в цепочке входит в состав триплета, а не существует сам по себе. В конце и в начале цепочки нуклеотидов, отвечающих за один белок, находятся стоп-кодоны. Они запускают или останавливают трансляцию (синтез белковой молекулы).

Специфичность, неперекрываемость и однонаправленность

Каждый кодон (триплет) кодирует только одну аминокислоту. Каждый триплет не зависит от соседнего и не перекрывается. Один нуклеотид может входить только в один триплет в цепочке. Синтез белка идет всегда только в одном направлении, что регулируют стоп-кодоны.

Избыточности генетического кода

Каждый триплет нуклеотидов кодирует одну аминокислоту. Всего 64 нуклеотида, из них 61 - кодируют аминокислоты (смысловые кодоны), а три - бессмысленные, то есть аминокислоту не кодируют (стоп-кодоны). Избыточность (вырожденность) генетического кода заключается в том, что в каждом триплете могут быть произведены замены - радикальные (приводят к замене аминокислоты) и консервативные (не меняют класс аминокислоты). Легко посчитать, что если в триплете можно провести 9 замен (1, 2 и 3 позиция), каждый нуклеотид можно заменить на 4 - 1 = 3 других варианта, то общее количество возможных вариантов замен нуклеотида будет 61 по 9 = 549.

Вырожденность генетического кода проявляется в том, что 549 вариантов - это намного больше, чем необходимо для закодировки информации о 21 аминокислоте. При этом из 549 вариантов 23 замены приведут к образованию стоп-кодонов, 134 + 230 замены - консервативны, и 162 замены - радикальны.

Правило вырожденности и исключения

Если два кодона имеют два одинаковых первых нуклеотида, а оставшиеся представлены нуклеотидами одного класса (пуриновые или пиримидиновые), то они несут информацию об одной и той же аминокислоте. Это и есть правило вырожденности или избыточности генетического кода. Два исключения - АУА и УГА - первый кодирует метионин, хотя должен был бы изолейцин, а второй - стоп-кодон, хотя должен был бы кодировать триптофан.

Значение вырожденности и универсальности

Именно эти два свойства генетического кода имеют наибольшее биологическое значение. Все свойства, перечисленные выше, характерны для наследственной информации всех форм живых организмов на нашей планете.

Вырожденность генетического кода имеет приспособительное значение, как многократное дублирование кода одной аминокислоты. Кроме того, это означает снижение значимости (вырождение) третьего нуклеотида в кодоне. Такой вариант сводит к минимуму мутационные повреждения в ДНК, которые повлекут за собой грубые нарушения в структуре белка. Это защитный механизм живых организмов планеты.