В биологии слово ген ( греч . γένος , genos ; [1] поколение [2] или рождение [1] или пол ) имеет два значения. Менделевский ген является основной единицей наследственности . Молекулярный ген представляет собой последовательность нуклеотидов в ДНК , которая транскрибируется с образованием функциональной РНК . Существует два типа молекулярных генов: гены, кодирующие белки, и некодирующие гены. [3] [4] [5] [6]
Во время экспрессии генов ДНК сначала копируется в РНК . РНК может быть непосредственно функциональной или быть промежуточной матрицей для синтеза белка.
Передача генов потомству организма является основой наследования фенотипических признаков от одного поколения к другому. Эти гены составляют различные последовательности ДНК, называемые генотипом , которые специфичны для каждого конкретного человека в генофонде популяции данного вида . Генотип, наряду с факторами окружающей среды и развития, в конечном итоге определяет фенотип человека. Большинство биологических признаков возникает под совместным влиянием полигенов (набора различных генов) и взаимодействий генов и окружающей среды . Некоторые генетические черты видны мгновенно, например цвет глаз или количество конечностей, другие нет, например группа крови , риск определенных заболеваний или тысячи основных биохимических процессов, составляющих жизнь .
Ген может приобретать мутации в своей последовательности , что приводит к появлению в популяции различных вариантов, известных как аллели . Эти аллели кодируют несколько разные версии гена, что может вызывать разные фенотипические признаки. [7] Гены развиваются в результате естественного отбора / выживания наиболее приспособленных и генетического дрейфа аллелей.
Термин « ген» был введен датским ботаником, физиологом растений и генетиком Вильгельмом Йохансеном в 1909 году . [8] Он вдохновлен древнегреческим : γόνος, gonos , что означает потомство и продолжение рода.
Существует много разных способов использования термина «ген», основанных на различных аспектах его наследования, отбора, биологической функции или молекулярной структуры, но большинство этих определений делятся на две категории: менделевский ген или молекулярный ген. [3] [9] [10] [11] [12]
Менделевский ген является классическим геном генетики и относится к любому наследственному признаку. Это ген, описанный в «Эгоистичном гене». [13] Более подробное обсуждение этой версии гена можно найти в статьях « Генетика » и «Геноцентрированный взгляд на эволюцию» .
Определение молекулярного гена чаще используется в биохимии, молекулярной биологии и большей части генетики — ген, который описывается с точки зрения последовательности ДНК. [3] Существует много разных определений этого гена, некоторые из которых вводят в заблуждение или неверны. [9] [14]
Самые ранние работы в области молекулярной генетики предложили концепцию, согласно которой один ген производит один белок (первоначально «один ген — один фермент»). [15] [16] Однако гены, продуцирующие репрессорные РНК, были предложены в 1950-х годах [17] , а к 1960-м годам в учебниках использовались определения молекулярных генов, в том числе те, которые определяют функциональные молекулы РНК, такие как рибосомальная РНК и тРНК (некодирующие гены). а также гены, кодирующие белки. [18]
Идея о двух видах генов до сих пор является частью определения гена в большинстве учебников. Например,
Важными частями таких определений являются: (1) ген соответствует единице транскрипции; (2) гены продуцируют как мРНК, так и некодирующие РНК; и (3) регуляторные последовательности контролируют экспрессию гена, но не являются частью самого гена. Однако есть еще одна важная часть определения, и она подчеркивается в книге Костаса Кампуракиса «Осмысление генов».
Акцент на функции имеет важное значение, поскольку существуют участки ДНК, которые производят нефункциональные транскрипты, и их нельзя назвать генами. К ним относятся очевидные примеры, такие как транскрибируемые псевдогены, а также менее очевидные примеры, такие как мусорная РНК, образующаяся в виде шума из-за ошибок транскрипции. Согласно этому определению, чтобы квалифицироваться как настоящий ген, необходимо доказать, что транскрипт выполняет биологическую функцию. [9]
Ранние предположения о размере типичного гена основывались на генетическом картировании с высоким разрешением, а также на размере белков и молекул РНК. В то время (1965 г.) длина в 1500 пар оснований казалась разумной. [18] Это было основано на идее, что ген — это ДНК, которая непосредственно отвечает за производство функционального продукта. Открытие интронов в 1970-х годах означало, что многие эукариотические гены были намного больше, чем можно было предположить по размеру функционального продукта. Например, типичные гены, кодирующие белки млекопитающих, имеют длину около 62 000 пар оснований (транскрибируемая область), и, поскольку их около 20 000, они занимают около 35–40% генома млекопитающих (включая геном человека). [22] [23] [24]
Несмотря на то, что как гены, кодирующие белок, так и некодирующие гены известны уже более 50 лет, до сих пор существует ряд учебников, веб-сайтов и научных публикаций, которые определяют ген как последовательность ДНК, определяющую белок. Другими словами, определение ограничивается генами, кодирующими белки. Вот пример из недавней статьи в журнале American Scientist.
Это ограниченное определение настолько распространено, что в последнее время оно породило множество статей, критикующих это «стандартное определение» и призывающих к новому расширенному определению, включающему некодирующие гены. [26] [27] [28] Однако это так называемое «новое» определение существует уже более полувека, и неясно, почему некоторые современные авторы игнорируют некодирующие гены. [ редакция ]
Хотя некоторые определения могут быть более широко применимы, чем другие, фундаментальная сложность биологии означает, что ни одно определение гена не может полностью охватить все аспекты. Не все геномы представляют собой ДНК (например, РНК-вирусы ), [29] бактериальные опероны представляют собой несколько областей, кодирующих белок, транскрибируемых в одну большую мРНК, альтернативный сплайсинг позволяет одной геномной области кодировать несколько продуктов района, а транс-сплайсинг объединяет мРНК из более короткой кодирующей последовательности. по всему геному. [30] [31] [32] Поскольку молекулярные определения исключают такие элементы, как интроны, промоторы и другие регуляторные области , вместо этого они считаются «связанными» с геном и влияют на его функцию.
Иногда используется еще более широкое рабочее определение, чтобы охватить сложность этих разнообразных явлений, где ген определяется как объединение геномных последовательностей, кодирующих согласованный набор потенциально перекрывающихся функциональных продуктов. [33] Это определение классифицирует гены по их функциональным продуктам (белки или РНК), а не по их конкретным локусам ДНК, при этом регуляторные элементы классифицируются как области , связанные с генами . [33]
Существование дискретных наследуемых единиц было впервые предположено Грегором Менделем (1822–1884). [34] С 1857 по 1864 год в Брно , Австрийская империя (сегодняшняя Чехия), он изучал закономерности наследования у 8000 обыкновенных съедобных растений гороха , отслеживая различные признаки от родителя к потомству. Он описал их математически как 2 n комбинаций, где n — количество различных характеристик исходного гороха. Хотя он не использовал термин « ген» , он объяснил свои результаты с точки зрения дискретных унаследованных единиц, которые порождают наблюдаемые физические характеристики. Это описание послужило прообразом различия Вильгельма Йохансена между генотипом (генетическим материалом организма) и фенотипом (наблюдаемыми признаками этого организма). Мендель также был первым, кто продемонстрировал независимый ассортимент , различие между доминантными и рецессивными признаками, различие между гетерозиготой и гомозиготой , а также феномен прерывистого наследования.
До работы Менделя доминирующей теорией наследственности была теория смешанного наследования , [35] которая предполагала, что каждый родитель вносит свой вклад в процесс оплодотворения и что признаки родителей смешиваются и смешиваются, чтобы произвести потомство. Чарльз Дарвин разработал теорию наследственности, которую он назвал пангенезисом , от греческого pan («все, целое») и генезиса («рождение»)/genos («происхождение»). [36] [37] Дарвин использовал термин «геммула» для описания гипотетических частиц, которые будут смешиваться во время размножения.
Работа Менделя осталась практически незамеченной после ее первой публикации в 1866 году, но была заново открыта в конце 19 века Хьюго де Фрисом , Карлом Корренсом и Эрихом фон Чермаком , которые (утверждали, что пришли) пришли к аналогичным выводам в своих собственных исследованиях. [38] В частности, в 1889 году Гюго де Врис опубликовал свою книгу « Внутриклеточный пангенезис» , [39] в которой постулировал, что разные признаки имеют индивидуальных наследственных носителей и что наследование определенных признаков в организмах происходит в частицах. Де Врис назвал эти единицы «пангенами» ( Pangens на немецком языке) в честь теории пангенезиса Дарвина 1868 года.
Двадцать лет спустя, в 1909 году, Вильгельм Йохансен ввел термин «ген» [8] , а в 1906 году Уильям Бейтсон — термин « генетика » [40] [33], в то время как Эдуард Страсбургер , среди других, все еще использовал термин «панген». для фундаментальной физической и функциональной единицы наследственности. [39] : Предисловие переводчика, viii.
Прогресс в понимании генов и наследственности продолжался на протяжении всего 20 века. Эксперименты 1940-1950-х годов показали, что дезоксирибонуклеиновая кислота (ДНК) является молекулярным хранилищем генетической информации. [41] [42] Структура ДНК была изучена Розалиндой Франклин и Морисом Уилкинсом с использованием рентгеновской кристаллографии , что побудило Джеймса Д. Уотсона и Фрэнсиса Крика опубликовать модель двухцепочечной молекулы ДНК, парные нуклеотидные основания которой указывают на убедительная гипотеза механизма генетической репликации. [43] [44]
В начале 1950-х годов преобладала точка зрения, что гены в хромосоме действуют как отдельные объекты, расположенные как бусины на нитке. Эксперименты Бензера с использованием мутантов , дефектных по области rII бактериофага Т4 (1955–1959), показали, что отдельные гены имеют простую линейную структуру и, вероятно, эквивалентны линейному участку ДНК. [45] [46]
В совокупности эти исследования установили центральную догму молекулярной биологии , которая гласит, что белки транслируются с РНК , которая транскрибируется с ДНК . С тех пор было показано, что из этой догмы есть исключения, такие как обратная транскрипция ретровирусов . Современное исследование генетики на уровне ДНК известно как молекулярная генетика .
В 1972 году Уолтер Фирс и его команда первыми определили последовательность гена: последовательность белка оболочки бактериофага MS2 . [47] Последующая разработка Фредериком Сэнгером секвенирования ДНК с обрывом цепи в 1977 году повысила эффективность секвенирования и превратила его в рутинный лабораторный инструмент. [48] Автоматизированная версия метода Сэнгера использовалась на ранних этапах проекта «Геном человека» . [49]
Теории, разработанные в начале 20-го века для объединения менделевской генетики с дарвиновской эволюцией, называются современным синтезом — термин, введенный Джулианом Хаксли . [50]
Этот взгляд на эволюцию был подчеркнут геноцентричным взглядом на эволюцию Джорджа К. Уильямса . Он предположил, что менделевский ген является единицей естественного отбора с определением: «то, что разделяется и рекомбинируется с заметной частотой». [51] : 24 Связанные идеи, подчеркивающие центральную роль менделевских генов и важность естественного отбора в эволюции, были популяризированы Ричардом Докинсом . [13] [52]
Развитие нейтральной теории эволюции в конце 1960-х годов привело к признанию того, что случайный генетический дрейф является основным фактором эволюции и что нейтральная теория должна быть нулевой гипотезой молекулярной эволюции. [53] Это привело к построению филогенетических деревьев и разработке молекулярных часов , которые лежат в основе всех методов датирования с использованием последовательностей ДНК. Эти методы не ограничиваются молекулярными последовательностями генов, но могут использоваться на всех сегментах ДНК генома.
Подавляющее большинство организмов кодируют свои гены в длинных цепях ДНК (дезоксирибонуклеиновая кислота). ДНК состоит из цепи , состоящей из четырех типов нуклеотидных субъединиц, каждая из которых состоит из пятиуглеродного сахара ( 2-дезоксирибозы ), фосфатной группы и одного из четырех оснований аденина , цитозина , гуанина и тимина . [54] : 2.1
Две цепи ДНК закручиваются друг вокруг друга, образуя двойную спираль ДНК , в которой фосфатно-сахарный остов закручивается по спирали снаружи, а основания направлены внутрь, при этом основания аденина соединяются с тимином, а основания гуанина с цитозином. Специфичность спаривания оснований возникает потому, что аденин и тимин образуют две водородные связи , тогда как цитозин и гуанин образуют три водородные связи. Таким образом, две цепи двойной спирали должны быть комплементарными , а их последовательность оснований совпадать, так что аденины одной цепи соединяются с тиминами другой цепи и так далее. [54] : 4.1
Благодаря химическому составу пентозных остатков оснований нити ДНК обладают направленностью. Один конец полимера ДНК содержит открытую гидроксильную группу дезоксирибозы ; это известно как 3'-конец молекулы. Другой конец содержит открытую фосфатную группу; это 5'-конец . Две нити двойной спирали идут в противоположных направлениях. Синтез нуклеиновой кислоты, включая репликацию и транскрипцию ДНК , происходит в направлении 5'→3', поскольку новые нуклеотиды добавляются посредством реакции дегидратации , в которой обнаженный 3'-гидроксил используется в качестве нуклеофила . [55] : 27,2
Экспрессия генов , закодированных в ДНК, начинается с транскрипции гена в РНК , второй тип нуклеиновой кислоты, очень похожий на ДНК, но мономеры которого содержат сахарную рибозу , а не дезоксирибозу . РНК также содержит основание урацил вместо тимина . Молекулы РНК менее стабильны, чем ДНК, и обычно являются одноцепочечными. Гены, кодирующие белки, состоят из серии трехнуклеотидных последовательностей , называемых кодонами , которые служат «словами» на генетическом «языке». Генетический код определяет соответствие при трансляции белка между кодонами и аминокислотами . Генетический код практически одинаков для всех известных организмов. [54] : 4.1
Полный набор генов в организме или клетке известен как его геном , который может храниться в одной или нескольких хромосомах . Хромосома состоит из одной очень длинной спирали ДНК, на которой закодированы тысячи генов. [54] : 4.2 Область хромосомы, в которой расположен конкретный ген, называется ее локусом . Каждый локус содержит одну аллель гена; однако члены популяции могут иметь разные аллели в этом локусе, каждый со слегка отличающейся последовательностью генов.
Большинство эукариотических генов хранятся в наборе крупных линейных хромосом. Хромосомы упакованы в ядре в комплекс с запасными белками, называемыми гистонами , образуя единицу, называемую нуклеосомой . ДНК, упакованная и конденсированная таким образом, называется хроматином . [54] : 4.2 Способ хранения ДНК на гистонах, а также химические модификации самого гистона регулируют, доступен ли конкретный участок ДНК для экспрессии генов . Помимо генов, хромосомы эукариот содержат последовательности, обеспечивающие копирование ДНК без деградации концевых участков и сортировку на дочерние клетки во время клеточного деления: точки начала репликации , теломеры и центромеры . [54] : 4.2 Истоки репликации — это области последовательности, где инициируется репликация ДНК для создания двух копий хромосомы. Теломеры представляют собой длинные участки повторяющихся последовательностей, которые замыкают концы линейных хромосом и предотвращают деградацию кодирующих и регуляторных областей во время репликации ДНК . Длина теломер уменьшается каждый раз, когда геном реплицируется, и это участвует в процессе старения . [57] Центромера необходима для связывания волокон веретена и разделения сестринских хроматид на дочерние клетки во время клеточного деления . [54] : 18,2
Прокариоты ( бактерии и археи ) обычно хранят свои геномы в одной большой кольцевой хромосоме . Точно так же некоторые эукариотические органеллы содержат оставшуюся кольцевую хромосому с небольшим количеством генов. [54] : 14.4 Прокариоты иногда дополняют свою хромосому дополнительными небольшими кольцами ДНК, называемыми плазмидами , которые обычно кодируют лишь несколько генов и могут передаваться от одного человека к другому. Например, гены устойчивости к антибиотикам обычно кодируются бактериальными плазмидами и могут передаваться между отдельными клетками, даже принадлежащими к разным видам, посредством горизонтального переноса генов . [58]
В то время как хромосомы прокариот относительно богаты генами, хромосомы эукариот часто содержат участки ДНК, которые не выполняют никакой очевидной функции. Простые одноклеточные эукариоты имеют относительно небольшое количество такой ДНК, тогда как геномы сложных многоклеточных организмов , включая человека, содержат абсолютное большинство ДНК без выявленной функции. [59] Эту ДНК часто называют « мусорной ДНК ». Однако более поздние исследования показывают, что, хотя ДНК, кодирующая белок, составляет всего лишь 2% человеческого генома , около 80% оснований в геноме могут быть экспрессированы, поэтому термин «мусорная ДНК» может быть неправильным. [30]
Структура гена, кодирующего белок, состоит из множества элементов, из которых реальная последовательность, кодирующая белок , часто составляет лишь небольшую часть. К ним относятся интроны и нетранслируемые области зрелой мРНК. Некодирующие гены также могут содержать интроны, которые удаляются во время процессинга для получения зрелой функциональной РНК.
Все гены связаны с регуляторными последовательностями , необходимыми для их экспрессии. Во-первых, генам необходима последовательность промотора . Промотор распознается и связывается факторами транскрипции , которые рекрутируют и помогают РНК-полимеразе связываться с областью для инициации транскрипции. [54] : 7.1 Распознавание обычно происходит в виде консенсусной последовательности, такой как ТАТА-бокс . Ген может иметь более одного промотора, в результате чего информационные РНК ( мРНК ) различаются по тому, насколько далеко они простираются на 5'-конце. [61] Гены с высокой степенью транскрипции имеют «сильные» промоторные последовательности, которые образуют прочные ассоциации с факторами транскрипции, тем самым инициируя транскрипцию с высокой скоростью. Другие гены имеют «слабые» промоторы, которые образуют слабые ассоциации с факторами транскрипции и реже инициируют транскрипцию. [54] : 7.2 Эукариотические промоторные области гораздо сложнее и их труднее идентифицировать, чем прокариотические промоторы. [54] : 7,3
Кроме того, гены могут иметь регуляторные области, расположенные на много тысяч оснований выше или ниже гена, которые изменяют экспрессию. Они действуют путем связывания с факторами транскрипции, которые затем заставляют ДНК образовывать петлю, так что регуляторная последовательность (и связанный фактор транскрипции) становится близко к сайту связывания РНК-полимеразы. [62] Например, энхансеры увеличивают транскрипцию, связывая белок- активатор , который затем помогает привлечь РНК-полимеразу к промотору; и наоборот, сайленсеры связывают белки- репрессоры и делают ДНК менее доступной для РНК-полимеразы. [63]
Зрелая информационная РНК, полученная из генов, кодирующих белок, содержит нетранслируемые области на обоих концах, которые содержат сайты связывания для рибосом , РНК-связывающих белков , микроРНК , а также терминатор , а также стартовые и стоп-кодоны . [64] Кроме того, большинство открытых рамок считывания эукариот содержат нетранслируемые интроны , которые удаляются, и экзоны , которые соединяются вместе в процессе, известном как сплайсинг РНК . Наконец, концы транскриптов генов определяются сайтами расщепления и полиаденилирования (CPA) , где вновь образованная пре-мРНК расщепляется, и к 3'-концу добавляется цепочка из ~ 200 аденозинмонофосфатов. Поли (А) -хвост защищает зрелую мРНК от деградации и выполняет другие функции, влияя на трансляцию, локализацию и транспорт транскрипта из ядра. Сплайсинг с последующим CPA приводит к образованию окончательной зрелой мРНК , которая кодирует белок или продукт РНК. [65] Хотя общие механизмы, определяющие расположение генов человека, известны, идентификация точных факторов, регулирующих эти клеточные процессы, является областью активных исследований. Например, известные особенности последовательности 3'-UTR могут объяснить только половину всех концов генов человека. [66]
Многие некодирующие гены эукариот имеют разные механизмы терминации транскрипции и не имеют pol(A)-хвостов.
Многие прокариотические гены организованы в опероны с множеством кодирующих белок последовательностей, которые транскрибируются как единое целое. [67] [68] Гены оперона транскрибируются в виде непрерывной информационной РНК , называемой полицистронной мРНК . Термин цистрон в этом контексте эквивалентен гену. Транскрипция мРНК оперона часто контролируется репрессором , который может находиться в активном или неактивном состоянии в зависимости от присутствия специфических метаболитов. [69] В активном состоянии репрессор связывается с последовательностью ДНК в начале оперона, называемой операторной областью , и подавляет транскрипцию оперона ; когда репрессор неактивен, может произойти транскрипция оперона (см., например, оперон Lac ). Продукты генов-оперонов обычно имеют родственные функции и участвуют в одной и той же регуляторной сети . [54] : 7,3
Хотя многие гены имеют простую структуру, как и большая часть биологии, другие могут быть весьма сложными или представлять собой необычные крайние случаи. Эукариотические гены часто имеют интроны, которые часто намного больше, чем их экзоны, [70] [71] и в эти интроны могут даже вкладываться другие гены . [72] Ассоциированные энхансеры могут находиться на расстоянии многих тысяч оснований или даже находиться на совершенно разных хромосомах, действующих посредством физического контакта между двумя хромосомами. [73] [74] Один ген может кодировать множество различных функциональных продуктов путем альтернативного сплайсинга , и, наоборот, ген может быть разделен по хромосомам, но эти транскрипты снова объединяются в функциональную последовательность путем транс-сплайсинга . [75] Также возможно, что перекрывающиеся гены имеют общую часть своей последовательности ДНК либо на противоположных цепях, либо на одной и той же цепи (в другой рамке считывания или даже в одной и той же рамке считывания). [76]
Во всех организмах требуется два шага, чтобы прочитать информацию, закодированную в ДНК гена, и произвести указанный им белок. Сначала ДНК гена транскрибируется в информационную РНК ( мРНК ). [54] : 6.1 Во-вторых, мРНК транслируется в белок. [54] : 6.2 Гены, кодирующие РНК, все еще должны пройти первый этап, но не транслируются в белок. [77] Процесс производства биологически функциональной молекулы РНК или белка называется экспрессией гена , а полученная молекула называется генным продуктом .
Нуклеотидная последовательность ДНК гена определяет аминокислотную последовательность белка через генетический код . Наборы из трех нуклеотидов, известные как кодоны , соответствуют определенной аминокислоте. [54] : 6 Принцип, согласно которому три последовательных основания ДНК кодируют каждую аминокислоту, был продемонстрирован в 1961 году с использованием мутаций сдвига рамки считывания в гене rIIB бактериофага Т4 [78] (см. эксперимент Крика, Бреннера и др. ).
Кроме того, « старт-кодон » и три « стоп-кодона » обозначают начало и конец области, кодирующей белок . Существует 64 возможных кодона (четыре возможных нуклеотида в каждом из трех положений, следовательно, 4–3 возможных кодона) и всего 20 стандартных аминокислот; следовательно, код является избыточным, и несколько кодонов могут обозначать одну и ту же аминокислоту. Соответствие между кодонами и аминокислотами практически универсально для всех известных живых организмов. [79]
Транскрипция производит одноцепочечную молекулу РНК , известную как информационная РНК , нуклеотидная последовательность которой комплементарна ДНК, с которой она была транскрибирована. [54] : 6.1. мРНК действует как промежуточное звено между геном ДНК и его конечным белковым продуктом. ДНК гена используется в качестве матрицы для создания комплементарной мРНК. мРНК соответствует последовательности кодирующей цепи ДНК гена, поскольку она синтезируется как дополнение к цепи матрицы . Транскрипция осуществляется ферментом , называемым РНК-полимеразой , который считывает цепь матрицы в направлении от 3' к 5' и синтезирует РНК от 5' к 3' . Чтобы инициировать транскрипцию, полимераза сначала распознает и связывает промоторную область гена. Таким образом, основным механизмом регуляции генов является блокирование или секвестрация промоторной области либо путем прочного связывания молекулами -репрессорами , которые физически блокируют полимеразу, либо путем организации ДНК так, что промоторная область недоступна. [54] : 7
У прокариот транскрипция происходит в цитоплазме ; для очень длинных транскриптов трансляция может начинаться с 5'-конца РНК, в то время как 3'-конец все еще транскрибируется. У эукариот транскрипция происходит в ядре, где хранится ДНК клетки. Молекула РНК, продуцируемая полимеразой, известна как первичный транскрипт и подвергается посттранскрипционным модификациям перед экспортом в цитоплазму для трансляции. Одной из выполненных модификаций является сплайсинг интронов , которые представляют собой последовательности в транскрибируемой области, которые не кодируют белок. Альтернативные механизмы сплайсинга могут привести к тому, что зрелые транскрипты одного и того же гена будут иметь разные последовательности и, таким образом, кодировать разные белки. Это основная форма регуляции в эукариотических клетках, а также встречается у некоторых прокариот. [54] : 7,5 [80]
Трансляция — это процесс, при котором зрелая молекула мРНК используется в качестве матрицы для синтеза нового белка . [54] : 6.2 Трансляция осуществляется рибосомами , крупными комплексами РНК и белка, ответственными за проведение химических реакций по добавлению новых аминокислот к растущей полипептидной цепи путем образования пептидных связей . Генетический код считывается по три нуклеотида одновременно в единицах, называемых кодонами , посредством взаимодействия со специализированными молекулами РНК, называемыми транспортными РНК (тРНК). Каждая тРНК имеет три неспаренных основания, известных как антикодон , которые комплементарны кодону, который она считывает на мРНК. ТРНК также ковалентно присоединена к аминокислоте , указанной комплементарным кодоном. Когда тРНК связывается с комплементарным кодоном в цепи мРНК, рибосома присоединяет свой аминокислотный груз к новой полипептидной цепи, которая синтезируется от аминоконца до карбоксильного конца . Во время и после синтеза большинство новых белков должны свернуть свою активную трехмерную структуру , прежде чем они смогут выполнять свои клеточные функции. [54] : 3
Гены регулируются таким образом, что они экспрессируются только тогда, когда продукт необходим, поскольку экспрессия требует ограниченных ресурсов. [54] : 7 Клетка регулирует экспрессию своих генов в зависимости от ее внешней среды (например, доступных питательных веществ , температуры и других стрессов ), ее внутренней среды (например , цикла деления клетки , метаболизма , статуса инфекции ) и ее специфической роли в многоклеточном организме . организм. Экспрессию генов можно регулировать на любом этапе: от инициации транскрипции до процессинга РНК и посттрансляционной модификации белка. Регуляция генов метаболизма лактозы в E. coli ( lac- оперон ) была первым подобным механизмом, описанным в 1961 году. [81]
Типичный ген, кодирующий белок, сначала копируется в РНК в качестве промежуточного продукта при производстве конечного белкового продукта. [54] : 6.1 В других случаях молекулы РНК являются реальными функциональными продуктами, как, например, при синтезе рибосомальной РНК и транспортной РНК . Некоторые РНК, известные как рибозимы , способны выполнять ферментативные функции , тогда как другие, такие как микроРНК и рибопереключатели, выполняют регуляторную роль. Последовательности ДНК , с которых транскрибируются такие РНК, известны как гены некодирующей РНК . [77]
Некоторые вирусы хранят весь свой геном в виде РНК и вообще не содержат ДНК. [82] [83] Поскольку они используют РНК для хранения генов, их клеточные хозяева могут синтезировать свои белки сразу после заражения и без задержки в ожидании транскрипции. [84] С другой стороны, РНК- ретровирусы , такие как ВИЧ , требуют обратной транскрипции своего генома из РНК в ДНК, прежде чем их белки смогут быть синтезированы.
Организмы наследуют свои гены от родителей. Бесполые организмы просто наследуют полную копию генома своего родителя. Половые организмы имеют две копии каждой хромосомы, поскольку они наследуют по одному полному набору от каждого родителя. [54] : 1
Согласно менделевскому наследованию , вариации фенотипа организма (наблюдаемых физических и поведенческих характеристик) частично обусловлены вариациями его генотипа (определенного набора генов). Каждый ген определяет определенный признак с различной последовательностью гена ( аллелей ), приводящей к различным фенотипам. Большинство эукариотических организмов (таких как растения гороха, над которыми работал Мендель) имеют по два аллеля для каждого признака, по одному унаследованному от каждого родителя. [54] : 20
Аллели в локусе могут быть доминантными или рецессивными ; доминантные аллели дают начало соответствующим фенотипам при спаривании с любой другой аллелью того же признака, тогда как рецессивные аллели дают начало соответствующему фенотипу только при спаривании с другой копией того же аллеля. Зная генотипы организмов, можно определить, какие аллели доминантные, а какие рецессивные. Например, если аллель, определяющая высокие стебли у растений гороха, доминирует над аллелем, определяющим короткие стебли, то растения гороха, унаследовавшие один высокий аллель от одного родителя и один короткий аллель от другого родителя, также будут иметь высокие стебли. Работа Менделя продемонстрировала, что аллели независимо сортируются при производстве гамет или зародышевых клеток , обеспечивая вариации в следующем поколении. Хотя менделевское наследование остается хорошей моделью для многих признаков, детерминированных отдельными генами (включая ряд хорошо известных генетических нарушений ), оно не включает физические процессы репликации ДНК и деления клеток. [85] [86]
Рост, развитие и размножение организмов зависят от деления клеток ; процесс, при котором одна клетка делится на две обычно идентичные дочерние клетки . Для этого необходимо сначала сделать дубликат каждого гена в геноме в процессе, называемом репликацией ДНК . [54] : 5.2 Копии создаются специализированными ферментами , известными как ДНК-полимеразы , которые «читают» одну цепь двойной спирали ДНК, известную как матричная цепь, и синтезируют новую комплементарную цепь. Поскольку двойная спираль ДНК удерживается вместе за счет спаривания оснований , последовательность одной цепи полностью определяет последовательность ее комплемента; следовательно, для создания точной копии ферменту необходимо прочитать только одну цепь. Процесс репликации ДНК полуконсервативный ; то есть копия генома, унаследованная каждой дочерней клеткой, содержит одну исходную и одну вновь синтезированную цепь ДНК. [54] : 5,2
Скорость репликации ДНК в живых клетках была впервые измерена как скорость удлинения ДНК фага Т4 в инфицированной фагом E. coli и оказалась впечатляюще быстрой. [87] В период экспоненциального роста ДНК при 37 °C скорость элонгации составляла 749 нуклеотидов в секунду.
После завершения репликации ДНК клетка должна физически разделить две копии генома и разделиться на две отдельные мембраносвязанные клетки. [54] : 18.2 У прокариот ( бактерий и архей ) это обычно происходит посредством относительно простого процесса, называемого бинарным делением , при котором каждый кольцевой геном прикрепляется к клеточной мембране и разделяется на дочерние клетки, когда мембрана инвагинирует , разделяя цитоплазму на две мембраносвязанные части. Бинарное деление происходит чрезвычайно быстро по сравнению со скоростью деления клеток у эукариот . Деление эукариотических клеток — более сложный процесс, известный как клеточный цикл ; Репликация ДНК происходит во время фазы этого цикла, известной как S-фаза , тогда как процесс сегрегации хромосом и расщепления цитоплазмы происходит во время M-фазы . [54] : 18,1
Дупликация и передача генетического материала от одного поколения клеток к другому лежит в основе молекулярной наследственности и связи между классической и молекулярной картиной генов. Организмы наследуют характеристики своих родителей, поскольку клетки потомства содержат копии генов родительских клеток. У организмов , размножающихся бесполым путем , потомство будет генетической копией или клоном родительского организма. У организмов , размножающихся половым путем , специализированная форма деления клеток, называемая мейозом, приводит к образованию клеток, называемых гаметами или зародышевыми клетками , которые являются гаплоидными или содержат только одну копию каждого гена. [54] : 20.2 Гаметы, вырабатываемые самками, называются яйцеклетками или яйцеклетками, а гаметы, вырабатываемые самцами, называются сперматозоидами . Две гаметы сливаются, образуя диплоидную оплодотворенную яйцеклетку — одну клетку, содержащую два набора генов, по одной копии каждого гена от матери и одной от отца. [54] : 20
В процессе мейотического деления клеток иногда может произойти событие, называемое генетической рекомбинацией или кроссинговером , при котором длина ДНК на одной хроматиде заменяется длиной ДНК на соответствующей гомологичной несестринской хроматиде. Это может привести к реассортации связанных иначе аллелей. [54] : 5.5. Менделевский принцип независимого ассортимента утверждает, что каждый из двух генов родителя по каждому признаку независимо сортируется в гаметы; какой аллель организм наследует по одному признаку, не связан с тем, какой аллель он наследует по другому признаку. Фактически это справедливо только для генов, которые не находятся в одной хромосоме или расположены очень далеко друг от друга на одной хромосоме. Чем ближе два гена расположены в одной хромосоме, тем теснее они будут связаны в гаметах и тем чаще они будут появляться вместе (так называемое генетическое сцепление ). [88] Очень близкие гены по существу никогда не разделяются, поскольку крайне маловероятно, что между ними произойдет точка кроссовера. [88]
Репликация ДНК по большей части чрезвычайно точна, однако случаются ошибки ( мутации ). [54] : 7,6. Частота ошибок в эукариотических клетках может составлять всего 10 -8 на нуклеотид за репликацию, [89] [90] тогда как для некоторых РНК-вирусов она может достигать 10 -3 . [91] Это означает, что каждое поколение, каждый геном человека накапливает около 30 новых мутаций. [92] Небольшие мутации могут быть вызваны репликацией ДНК и последствиями повреждения ДНК и включают точечные мутации , при которых изменяется одно основание, и мутации сдвига рамки считывания , при которых одно основание вставляется или удаляется. Любая из этих мутаций может изменить ген по миссенсу (изменение кодона , кодирующего другую аминокислоту) или по нонсенсу (преждевременный стоп-кодон ). [93] Более крупные мутации могут быть вызваны ошибками рекомбинации и вызывать хромосомные аномалии, включая дупликацию , делецию, перестановку или инверсию больших участков хромосомы. Кроме того, механизмы репарации ДНК могут вносить мутационные ошибки при восстановлении физических повреждений молекулы. Восстановление, даже при мутации, более важно для выживания, чем восстановление точной копии, например, при восстановлении двухцепочечных разрывов . [54] : 5,4
Когда в популяции вида присутствует несколько различных аллелей гена, это называется полиморфным . Большинство различных аллелей функционально эквивалентны, однако некоторые аллели могут вызывать разные фенотипические признаки . Самая распространенная аллель гена называется диким типом , а редкие аллели называются мутантами . Генетическая изменчивость относительных частот различных аллелей в популяции обусловлена как естественным отбором, так и генетическим дрейфом . [94] Аллель дикого типа не обязательно является предком менее распространенных аллелей и не обязательно является более подходящей .
Большинство мутаций внутри генов нейтральны и не влияют на фенотип организма ( молчащие мутации ). Некоторые мутации не меняют аминокислотную последовательность, поскольку одну и ту же аминокислоту кодируют несколько кодонов ( синонимные мутации ). Другие мутации могут быть нейтральными, если они приводят к изменению аминокислотной последовательности, но белок по-прежнему функционирует аналогично новой аминокислоте (например, консервативные мутации ). Однако многие мутации вредны или даже смертельны и удаляются из популяции путем естественного отбора. Генетические нарушения являются результатом вредных мутаций и могут быть вызваны спонтанной мутацией у пораженного человека или могут передаваться по наследству. Наконец, небольшая часть мутаций приносит пользу , улучшая приспособленность организма и чрезвычайно важна для эволюции, поскольку их направленный отбор приводит к адаптивной эволюции . [54] : 7,6
Взаимосвязь между генами можно измерить, сравнивая последовательности их ДНК. Если уровень сходства превышает минимальное значение, можно сделать вывод, что гены происходят от общего предка; они гомологичны . [95] [96] Гены, которые связаны прямым происхождением от общего предка, являются ортологичными генами - они обычно встречаются в одном и том же локусе у разных видов. Гены, родственные в результате дупликации генов, являются парологичными генами. [97] [98]
Часто полагают, что функции ортологичных генов более сходны, чем функции паралогичных, хотя различия минимальны. [99] [100]
Наиболее распространенным источником новых генов в эукариотических линиях является дупликация генов , которая приводит к изменению числа копий существующего гена в геноме. [101] [102] Полученные гены (паралоги) могут затем расходиться по последовательности и функциям. Сформированные таким образом наборы генов составляют генное семейство . Дупликация и потеря генов внутри семьи являются обычным явлением и представляют собой основной источник эволюционного биоразнообразия . [103] Иногда дупликация гена может привести к образованию нефункциональной копии гена, или функциональная копия может подвергаться мутациям, которые приводят к потере функции; такие нефункциональные гены называются псевдогенами . [54] : 7,6
Гены-сироты , последовательность которых не имеет сходства с существующими генами, встречаются реже, чем дубликаты генов. Геном человека содержит примерно от 18 [104] до 60 [105] генов, не имеющих идентифицируемых гомологов за пределами человека. Гены-сироты возникают в основном либо в результате возникновения de novo из ранее некодирующей последовательности , либо в результате дупликации гена с последующим таким быстрым изменением последовательности, что исходное родство становится необнаружимым. [106] Гены de novo обычно короче и проще по структуре, чем большинство эукариотических генов, с небольшим количеством интронов или вообще без них. [101] В течение длительных периодов эволюции рождение генов de novo может быть ответственным за значительную часть таксономически ограниченных семейств генов. [107]
Горизонтальный перенос генов относится к передаче генетического материала посредством механизма, отличного от воспроизводства . Этот механизм является распространенным источником новых генов у прокариот , и иногда считается, что он больше способствует генетической изменчивости, чем дупликации генов. [108] Это распространенное средство распространения устойчивости к антибиотикам , вирулентности и адаптивных метаболических функций. [58] [109] Хотя горизонтальный перенос генов редко встречается у эукариот, вероятные примеры были идентифицированы в геномах протистов и водорослей , содержащих гены бактериального происхождения. [110] [111]
Геном представляет собой совокупный генетический материал организма и включает в себя как гены, так и некодирующие последовательности . [112] Гены эукариот можно аннотировать с помощью FINDER. [113]
Размер генома и количество кодируемых им генов сильно различаются у разных организмов. Наименьшие геномы встречаются у вирусов [ 122] и вироидов (которые действуют как один некодирующий ген РНК). [123] И наоборот, растения могут иметь чрезвычайно большие геномы, [124] рис содержит >46 000 генов, кодирующих белок. [118] Общее количество генов, кодирующих белок ( протеом Земли ), оценивается в 5 миллионов последовательностей. [125]
Хотя количество пар оснований ДНК в геноме человека известно с 1950-х годов, предполагаемое количество генов со временем менялось по мере того, как определения генов и методы их обнаружения уточнялись. Первоначальные теоретические прогнозы количества человеческих генов в 1960-х и 1970-х годах были основаны на оценках мутационной нагрузки и количестве мРНК, и эти оценки, как правило, составляли около 30 000 генов, кодирующих белок. [126] [127] [128] В 1990-е годы предполагалось, что число генов может достигать 100 000, а ранние данные по обнаружению мРНК ( метки экспрессируемых последовательностей ) предполагали, что число генов превышает традиционное значение в 30 000 генов, о которых сообщалось в учебниках во время 1980-е годы. [129]
Первоначальный проект последовательностей человеческого генома подтвердил более ранние предсказания о наличии около 30 000 генов, кодирующих белок, однако эта оценка упала примерно до 19 000 в связи с продолжающимся проектом аннотаций GENCODE . [130] Число некодирующих генов точно неизвестно, но последние оценки Ensembl предполагают наличие 26 000 некодирующих генов. [131]
Эссенциальные гены — это набор генов, которые считаются критически важными для выживания организма. [133] Это определение предполагает наличие в изобилии всех соответствующих питательных веществ и отсутствие экологического стресса. Лишь небольшая часть генов организма имеет важное значение. У бактерий примерно 250–400 генов необходимы для Escherichia coli и Bacillus subtilis , что составляет менее 10% их генов. [134] [135] [136] Половина этих генов являются ортологами в обоих организмах и в значительной степени участвуют в синтезе белка . [136] У почкующихся дрожжей Saccharomyces cerevisiae количество незаменимых генов несколько выше — 1000 генов (~20% их генов). [137] Хотя это количество труднее измерить у высших эукариот, мыши и люди, по оценкам, имеют около 2000 основных генов (~ 10% их генов). [138] Синтетический организм Syn 3 имеет минимальный геном, состоящий из 473 основных генов и квазинезаменимых генов (необходимых для быстрого роста), хотя 149 имеют неизвестную функцию. [132]
К эссенциальным генам относятся гены «домашнего хозяйства» (критически важные для основных функций клеток) [139], а также гены, которые экспрессируются на разных этапах развития или жизненного цикла организма . [140] Гены «домашнего хозяйства» используются в качестве экспериментального контроля при анализе экспрессии генов , поскольку они конститутивно экспрессируются на относительно постоянном уровне.
Номенклатура генов была установлена Комитетом по номенклатуре генов HUGO (HGNC), комитетом Организации генома человека , для каждого известного человеческого гена в форме утвержденного названия гена и символа (краткой аббревиатуры ), доступ к которым можно получить через база данных, поддерживаемая HGNC. Символы выбираются уникальными, и каждый ген имеет только один символ (хотя утвержденные символы иногда меняются). Символы предпочтительно должны соответствовать другим членам семейства генов и гомологам других видов, особенно мыши , поскольку она играет роль общего модельного организма . [141]
Генная инженерия — это модификация генома организма с помощью биотехнологий . С 1970-х годов было разработано множество методов , позволяющих специально добавлять, удалять и редактировать гены в организме. [142] Недавно разработанные методы геномной инженерии используют сконструированные ферменты нуклеазы для целевого восстановления ДНК в хромосоме , чтобы либо разрушить, либо отредактировать ген после устранения разрыва. [143] [144] [145] [146] Сопутствующий термин «синтетическая биология» иногда используется для обозначения обширной генной инженерии организма. [147]
Генная инженерия в настоящее время является рутинным инструментом исследования модельных организмов . Например, гены легко добавляются к бактериям [148] , а линии нокаутных мышей с нарушенной функцией определенного гена используются для исследования функции этого гена. [149] [150] Многие организмы были генетически модифицированы для применения в сельском хозяйстве , промышленной биотехнологии и медицине .
Для многоклеточных организмов обычно создают эмбрион , который вырастает во взрослый генетически модифицированный организм . [151] Однако геномы клеток взрослого организма можно редактировать с помощью методов генной терапии для лечения генетических заболеваний.
… сама наука [т.е. изучение селекции и гибридизации растений] до сих пор безымянна, и мы можем описать наши занятия только громоздкими и часто вводящими в заблуждение перифразами.
Чтобы преодолеть эту трудность, я предлагаю на рассмотрение Конгресса термин «
Генетика»
, который достаточно указывает на то, что наши труды посвящены выяснению явлений наследственности и изменчивости: другими словами, физиологии происхождения с подразумеваемым отношением к теоретические проблемы эволюционистов и систематиков и их применение к практическим проблемам селекционеров, будь то животных или растений.