stringtranslate.com

Семейство генов

Филогенетическое дерево семейства генов Mup

Семейство генов — это набор из нескольких похожих генов, образованных путем дупликации одного исходного гена , и, как правило, имеющих схожие биохимические функции. Одним из таких семейств являются гены субъединиц человеческого гемоглобина ; десять генов находятся в двух кластерах на разных хромосомах, называемых α-глобиновыми и β-глобиновыми локусами. Считается, что эти два кластера генов возникли в результате дупликации гена-предшественника примерно 500 миллионов лет назад. [1]

Гены классифицируются по семействам на основе общих нуклеотидных или белковых последовательностей . Филогенетические методы могут использоваться в качестве более строгого теста. Положения экзонов в кодирующей последовательности могут использоваться для вывода об общем происхождении. Знание последовательности белка, кодируемого геном, может позволить исследователям применять методы, которые находят сходства среди белковых последовательностей, которые предоставляют больше информации, чем сходства или различия среди последовательностей ДНК .

Если гены семейства генов кодируют белки, термин « семейство белков» часто используется аналогично термину «семейство генов» .

Расширение или сокращение семейств генов вдоль определенной линии может быть вызвано случайностью или может быть результатом естественного отбора. [2] Различить эти два случая на практике часто бывает сложно. В недавних работах используется комбинация статистических моделей и алгоритмических методов для обнаружения семейств генов, находящихся под воздействием естественного отбора. [3]

Комитет по номенклатуре генов HUGO (HGNC) создает схемы номенклатуры, используя символ «ствол» (или «корень») для членов семейства генов (по гомологии или функции) с иерархической системой нумерации для различения отдельных членов. [4] [5] Например, для семейства пероксиредоксинов корневым символом является PRDX , а членами семейства являются PRDX1 , PRDX2 , PRDX3 , PRDX4 , PRDX5 и PRDX6 .

Базовая структура

Филогения генов как линии в филогении серых видов. Вверху: предковая дупликация гена производит два паралога ( гистон H1.1 и 1.2 ). Событие видообразования производит ортологов у двух дочерних видов (человека и шимпанзе). Внизу: у отдельного вида ( E. coli ) ген имеет схожую функцию ( гистоноподобный нуклеоид-структурирующий белок ), но имеет отдельное эволюционное происхождение и поэтому является аналогом .

Один из уровней организации генома — это группировка генов в несколько семейств генов. [6] [7] Семейства генов — это группы родственных генов, которые имеют общего предка. Члены семейств генов могут быть паралогами или ортологами. Паралоги генов — это гены со схожими последовательностями из одного и того же вида, тогда как ортологи генов — это гены со схожими последовательностями из разных видов. Семейства генов сильно различаются по размеру, разнообразию последовательностей и расположению. В зависимости от разнообразия и функций генов в семействе семейства можно классифицировать как мультигенные семейства или суперсемейства. [6] [8]

Мультигенные семейства обычно состоят из членов со схожими последовательностями и функциями, хотя высокая степень расхождения (на уровне последовательности и/или функции) не приводит к удалению гена из семейства генов. Отдельные гены в семействе могут быть расположены близко друг к другу на одной и той же хромосоме или разбросаны по всему геному на разных хромосомах. Из-за сходства их последовательностей и их перекрывающихся функций отдельные гены в семействе часто разделяют регуляторные элементы контроля. [6] [8] В некоторых случаях члены генов имеют идентичные (или почти идентичные) последовательности. Такие семейства позволяют экспрессировать огромное количество генного продукта за короткое время по мере необходимости. Другие семейства позволяют экспрессировать похожие, но специфические продукты в разных типах клеток или на разных стадиях развития организма. [6]

Суперсемейства намного больше, чем отдельные мультигенные семьи. Суперсемейства содержат до сотен генов, включая множественные мультигенные семьи, а также отдельных членов генов. Большое количество членов позволяет суперсемействам быть широко разбросанными, при этом некоторые гены сгруппированы, а некоторые разбросаны далеко друг от друга. Гены разнообразны по последовательности и функции, демонстрируя различные уровни экспрессии и отдельные регуляторные элементы. [6] [8]

Некоторые семейства генов также содержат псевдогены , последовательности ДНК, которые очень похожи на установленные последовательности генов, но не функциональны. [9] Существуют различные типы псевдогенов. Необработанные псевдогены — это гены, которые со временем приобрели мутации, став нефункциональными. Обработанные псевдогены — это гены, которые утратили свою функцию после перемещения по геному путем ретротранспозиции. [8] [9] Псевдогены, которые стали изолированными от семейства генов, в котором они возникли, называются сиротами . [6]

Формирование

Генные семейства возникли из множественных дупликаций гена-предка, за которыми последовали мутация и дивергенция. [6] Дупликации могут происходить в пределах одной линии (например, у людей может быть две копии гена, который встречается только один раз у шимпанзе) или они являются результатом видообразования. Например, один ген у предка людей и шимпанзе теперь встречается у обоих видов и может считаться «дублированным» посредством видообразования. В результате дупликации посредством видообразования генное семейство может включать 15 генов, по одной копии в каждом из 15 различных видов.

Дублирование

При формировании семейств генов существует четыре уровня дупликации: 1) дупликация и перетасовка экзонов , 2) дупликация всего гена , 3) дупликация мультигенного семейства и 4) дупликация всего генома . Дупликация и перетасовка экзонов приводит к появлению вариаций и новых генов. Затем гены дублируются, образуя мультигенные семейства, которые дублируются, образуя суперсемейства, охватывающие несколько хромосом. Дупликация всего генома удваивает количество копий каждого гена и семейства генов. [6] Дупликация или полиплоидизация всего генома может быть либо автополиплоидизацией, либо аллоплоидизацией. Автополиплоидизация — это дупликация одного и того же генома, а аллополиплоидизация — это дупликация двух близкородственных геномов или гибридизированных геномов разных видов. [8]

Дупликация происходит в основном за счет неравномерных кроссинговеров в мейозе зародышевых клеток. (1,2) Когда две хромосомы смещаются, кроссинговер — обмен аллелями генов — приводит к тому, что одна хромосома расширяется или увеличивает число генов, а другая сокращается или уменьшает число генов. Расширение кластера генов — это дупликация генов, которая приводит к более крупным семействам генов. [6] [8]

Переезд

Гены-члены мультигенного семейства или мультигенных семейств в суперсемействах существуют на разных хромосомах из-за перемещения этих генов после дупликации гена-предка. Транспонируемые элементы играют роль в перемещении генов. Транспонируемые элементы распознаются инвертированными повторами на их 5' и 3' концах. Когда два транспонируемых элемента находятся достаточно близко в одном и том же регионе хромосомы, они могут образовывать составной транспозон. Белковая транспозаза распознает самые внешние инвертированные повторы, разрезая сегмент ДНК. Любые гены между двумя транспонируемыми элементами перемещаются, когда составной транспозон переходит в новую область генома. [6]

Обратная транскрипция — еще один метод перемещения генов. Транскрипт мРНК гена обратно транскрибируется или копируется обратно в ДНК. Эта новая ДНК-копия мРНК интегрируется в другую часть генома, в результате чего члены семейства генов рассеиваются. [8]

Особый тип мультигенного семейства участвует в перемещении семейств генов и членов семейств генов. Семейства LINE ( Long IN terspersed Elements ) и SINE ( Short IN terspersed Elements ) представляют собой высокоповторяющиеся последовательности ДНК, распространенные по всему геному. LINE содержат последовательность, которая кодирует белок обратной транскриптазы . Этот белок помогает копировать транскрипты РНК LINE и SINE обратно в ДНК и интегрирует их в различные области генома. Это самоподдерживает рост семейств LINE и SINE. Из-за высокоповторяющейся природы этих элементов LINE и SINE, когда они находятся близко друг к другу, также запускают события неравного кроссинговера, которые приводят к дупликациям одного гена и образованию семейств генов. [6] [8]

Дивергенция

Несинонимичные мутации, приводящие к замене аминокислот, увеличению числа дублирующихся копий гена. Дублирование приводит к появлению множественных копий одного и того же гена, что обеспечивает уровень избыточности, при котором мутации допускаются. При наличии одной функционирующей копии гена другие копии способны приобретать мутации, не нанося при этом большого вреда организмам. Мутации позволяют дублирующимся генам приобретать новые или другие функции. [8]

Согласованная эволюция

Некоторые мультигенные семейства чрезвычайно однородны, причем отдельные гены-члены разделяют идентичные или почти идентичные последовательности. Процесс, посредством которого генные семейства поддерживают высокую однородность, называется Согласованной эволюцией . Согласованная эволюция происходит посредством повторяющихся циклов неравных событий кроссинговера и повторяющихся циклов переноса и конверсии генов. Неравный кроссинговер приводит к расширению и сокращению генных семейств. Генные семейства имеют оптимальный диапазон размеров, к которому действует естественный отбор. Сокращение удаляет расходящиеся копии генов и не дает генным семействам становиться слишком большими. Расширение заменяет потерянные копии генов и не дает генным семействам становиться слишком маленькими. Повторяющиеся циклы переноса и конверсии генов все больше делают членов генных семейств более похожими. [6]

В процессе переноса генов аллельная генная конверсия смещена. Распространение мутантных аллелей в генном семействе в сторону однородности — это тот же самый процесс распространения выгодного аллеля в популяции в сторону фиксации. Генная конверсия также помогает в создании генетической изменчивости в некоторых случаях. [10]

Эволюция

Семейства генов, часть иерархии хранения информации в геноме, играют большую роль в эволюции и разнообразии многоклеточных организмов. Семейства генов представляют собой крупные единицы информации и генетической изменчивости. [6] В течение эволюционного времени семейства генов расширялись и сокращались, при этом гены внутри семейства дуплицировались и диверсифицировались в новые гены, а гены терялись. Целое семейство генов также может быть потеряно или приобретено посредством рождения генов de novo , посредством такой обширной дивергенции, что ген считается частью нового семейства, или посредством горизонтального переноса генов . Когда количество генов на геном остается относительно постоянным, это означает, что гены приобретаются и теряются с относительно одинаковой скоростью. Существуют некоторые закономерности, при которых гены с большей вероятностью будут потеряны, чем те, которые с большей вероятностью будут дуплицироваться и диверсифицироваться в несколько копий. [11]

Адаптивное расширение одного гена во множество изначально идентичных копий происходит, когда естественный отбор благоприятствует появлению дополнительных копий гена. Это происходит, когда на вид действует стрессор окружающей среды. Усиление гена чаще встречается у бактерий и является обратимым процессом. Сокращение семейств генов обычно происходит из-за накопления мутаций потери функции. Бессмысленная мутация, которая преждевременно останавливает транскрипцию гена, закрепляется в популяции, что приводит к потере генов. Этот процесс происходит, когда изменения в окружающей среде делают ген избыточным. [7]

Функциональная семья

В дополнение к классификации по эволюции (структурное семейство генов), HGNC также создает «семейства генов» по ​​функции в своей номенклатуре стеблей. [12] В результате, стебель может также относиться к генам, которые имеют одну и ту же функцию, часто являясь частью одного и того же белкового комплекса . Например, BRCA1 и BRCA2 — это неродственные гены, которые оба названы по их роли в раке молочной железы, а RPS2 и RPS3 — это неродственные рибосомальные белки, обнаруженные в одной и той же малой субъединице.

HGNC также поддерживает классификацию «группы генов» (ранее «семейства генов»). Ген может быть членом нескольких групп, и все группы образуют иерархию. Как и в случае со стволовой классификацией, существуют как структурные, так и функциональные группы. [4] [5]

Смотрите также

Ссылки

  1. ^ Нуссбаум, Роберт Л.; Макиннес, Родерик Р.; Уиллард, ikksiiskHuntington F. (2016). Thompson & Thompson Genetics in Medicine (8-е изд.). Филадельфия, Пенсильвания: Elsevier. стр. 25. ISBN 978-1-4377-0696-3.
  2. ^ Хартл, Д. Л. и Кларк АГ 2007. Принципы популяционной генетики. Глава 7, стр. 372.
  3. ^ Demuth, Jeffery P.; Bie, Tijl De; Stajich, Jason E.; Cristianini, Nello; Hahn, Matthew W.; Borevitz, Justin (20 декабря 2006 г.). "Эволюция семейств генов млекопитающих". PLOS ONE . 1 (1): e85. Bibcode : 2006PLoSO...1...85D. doi : 10.1371/journal.pone.0000085 . PMC 1762380. PMID  17183716 . 
  4. ^ ab Догерти, LC; Сил, RL; Райт, MW; Бруфорд, EA (5 июля 2012 г.). «Семейство генов имеет значение: расширение ресурса HGNC». Human Genomics . 6 (1): 4. doi : 10.1186/1479-7364-6-4 . PMC 3437568 . PMID  23245209. 
  5. ^ ab HGNC . "Помощь группе генов" . Получено 2020-10-13 .
  6. ^ abcdefghijklm Хартвелл, Леланд Х.; и др. (2011). Генетика: от генов к геномам (4-е изд.). Нью-Йорк: McGraw-Hill. ISBN 978-0-07-352526-6.
  7. ^ ab Demuth, JP; Hahn, MW (январь 2009). «Жизнь и смерть семейств генов». BioEssays . 31 (1): 29–39. doi :10.1002/bies.080085. PMID  19153999. S2CID  9528185.
  8. ^ abcdefghi Ohta, Tomoka (2008). "Семейства генов: мультигенные семейства и суперсемейства". eLS . doi :10.1038/npg.els.0005126. ISBN 978-0-470-01590-2.
  9. ^ ab Nussbaum, Robert L; et al. (2015). Генетика в медицине (8-е изд.). Филадельфия: Elsevier. ISBN 978-1-4377-0696-3.
  10. ^ Охта, Т. (30 сентября 2010 г.). «Конверсия генов и эволюция семейств генов: обзор». Гены . 1 (3): 349–56. doi : 10.3390/genes1030349 . PMC 3966226. PMID  24710091 . 
  11. ^ Джеймс, Дженнифер Э.; Нельсон, Пол Г.; Масел, Джоанна (4 апреля 2023 г.). «Дифференциальное сохранение доменов Pfam способствует долгосрочным эволюционным тенденциям». Молекулярная биология и эволюция . 40 (4): msad073. doi :10.1093/molbev/msad073. PMC 10089649. PMID  36947137 . 
  12. ^ "Что такое символ основы?". Часто задаваемые вопросы HGNC .