stringtranslate.com

Пангеном

Пангеномный анализ геномов Streptococcus agalactiae , выполненный с помощью программного обеспечения Anvi'o [1], разработкой которого руководит А. Мурат Эрен . Геномы получены из Tettelin et al. (2005). [2] Каждый круг соответствует одному геному, а каждый радиус представляет собой семейство генов. Внизу и справа локализованы основные семейства геномов. Некоторые семейства в ядре могут иметь более одного гомологичного гена на геном. В середине, слева от рисунка, наблюдается геном оболочки. Вверху слева показаны семейства из необязательного генома и синглтоны.

В области молекулярной биологии и генетики пангеном ( пангеном или супрагеном ) это полный набор генов всех штаммов в пределах клады . В более общем смысле, это объединение всех геномов клады. [2] [3] [4] [5] Пангеном можно разбить на «основной пангеном», который содержит гены, присутствующие у всех особей, «оболочечный пангеном», который содержит гены, присутствующие в двух или более штаммах, и «облачный пангеном», который содержит гены, обнаруженные только в одном штамме. [3] [4] [6] Некоторые авторы также называют облачный геном «вспомогательным геномом», содержащим «необязательные» гены, присутствующие в подмножестве штаммов, и штаммоспецифичные гены. [2] [3] [4] Обратите внимание, что использование термина «необязательный» было поставлено под сомнение, по крайней мере в геномах растений, поскольку вспомогательные гены играют «важную роль в эволюции генома и в сложном взаимодействии между геномом и окружающей средой». [5] Область изучения пангеномов называется пангеномикой. [2]

Генетический репертуар бактериального вида намного больше, чем генное содержимое отдельного штамма. [7] Некоторые виды имеют открытые (или обширные) пангеномы, в то время как другие имеют закрытые пангеномы. [2] Для видов с закрытым пангеномом очень мало генов добавляется на секвенированный геном (после секвенирования многих штаммов), и размер полного пангенома может быть теоретически предсказан. Виды с открытым пангеномом имеют достаточно генов, добавленных на дополнительный секвенированный геном, поэтому предсказание размера полного пангенома невозможно. [4] Размер популяции и универсальность ниши были предложены как наиболее влиятельные факторы при определении размера пангенома. [2]

Первоначально пангеномы были созданы для видов бактерий и архей , но в последнее время были разработаны эукариотические пангеномы, особенно для видов растений . Исследования растений показали, что динамика пангенома связана с мобильными элементами. [8] [9] [10] [11] Значимость пангенома возникает в эволюционном контексте, особенно в связи с метагеномикой , [12] но также используется в более широком контексте геномики . [13] Книга с открытым доступом, рассматривающая концепцию пангенома и ее последствия, под редакцией Теттелина и Медини, была опубликована весной 2020 года. [14]

Этимология

Термин «пангеном» был определен в его нынешнем значении Теттелином и др. в 2005 году; [2] он происходит от греческого слова παν, означающего «целый» или «все», в то время как геном — это широко используемый термин для описания полного генетического материала организма. Теттелин и др. применили этот термин специально к бактериям , чей пангеном «включает основной геном, содержащий гены, присутствующие во всех штаммах, и необязательный геном, состоящий из генов, отсутствующих в одном или нескольких штаммах, и генов, которые являются уникальными для каждого штамма». [2]

Части пангенома

В пангеноме мы можем выделить три набора генов: Core, Shell и Cloud genome. Core genome включает гены, которые присутствуют во всех проанализированных геномах. Чтобы избежать исключения семейств из-за артефактов секвенирования, некоторые авторы рассматривают softcore (>95% встречаемости). Shell genome состоит из генов, общих для большинства геномов (10-95% встречаемости). Семейства генов, присутствующие только в одном геноме или <10% встречаемости, описываются как Dispensable или Cloud genome.

Основной

Является частью пангенома, которая является общей для каждого генома в тестируемом наборе. Некоторые авторы разделили ядро ​​пангенома на жесткое ядро, те семейства гомологичных генов, которые имеют по крайней мере одну копию семейства, общего для каждого генома (100% геномов), и мягкое ядро ​​или расширенное ядро, [15] те семейства, которые распределены выше определенного порога (90%). В исследовании, которое включает пангеномы Bacillus cereus и Staphylococcus aureus , некоторые из которых были изолированы с международной космической станции, пороги, используемые для сегментации пангеномов, были следующими: «Облако», «Оболочка» и «Ядро», соответствующие семействам генов с присутствием в <10%, 10–95% и >95% геномов соответственно. [16]

Размер и пропорция основного генома к пангеному зависят от нескольких факторов, но особенно сильно они зависят от филогенетического сходства рассматриваемых геномов. Например, основное ядро ​​двух идентичных геномов также будет полным пангеномом. Основное ядро ​​рода всегда будет меньше основного генома вида. Гены, принадлежащие основному геному, часто связаны с функциями ведения домашнего хозяйства и первичным метаболизмом линии, тем не менее основной ген может также содержать некоторые гены, которые отличают вид от других видов рода, т. е. которые могут быть связаны с патогенностью и адаптацией ниши. [17]

Оболочка

Является частью пангенома, общей для большинства геномов в пангеноме. [18] Не существует общепринятого порога для определения генома оболочки, некоторые авторы считают семейство генов частью пангенома оболочки, если оно является общим для более чем 50% геномов в пангеноме. [19] Семейство может быть частью оболочки в результате нескольких эволюционных динамик, например, из-за потери гена в линии, где оно ранее было частью основного генома, как в случае ферментов в триптофановом опероне у Actinomyces , [20] или из-за приобретения гена и фиксации семейства генов, которое ранее было частью необязательного генома, как в случае гена trpF у нескольких видов Corynebacterium . [21]

Облако

Геном облака состоит из тех семейств генов, которые разделяет минимальное подмножество геномов в пангеноме, [22] он включает синглтоны или гены, присутствующие только в одном из геномов. Он также известен как периферический геном или вспомогательный геном. Семейства генов в этой категории часто связаны с экологической адаптацией. [ необходима цитата ]

Классификация

a) Закрытые пангеномы характеризуются большими основными геномами и небольшими дополнительными геномами. b) Открытые пангеномы, как правило, имеют небольшие основные геномы и большие дополнительные геномы. c) Размер открытых пангеномов имеет тенденцию увеличиваться с каждым добавленным геномом, в то время как размер закрытого пангенома имеет тенденцию быть асимптотическим, несмотря на добавление большего количества геномов. Благодаря этой характеристике можно предсказать полный размер пангенома для закрытых пангеномов.

Пангеном можно условно классифицировать как открытый или закрытый на основе значения альфа закона Хипса : [23] [15]

если то пангеном считается открытым.если то пангеном считается закрытым.

Обычно программное обеспечение пангенома может рассчитать параметры закона Кучи, которые наилучшим образом описывают поведение данных.

Открытый пангеном

Открытый пангеном возникает, когда число новых семейств генов в одной таксономической линии продолжает расти, не проявляя асимптотичности, независимо от того, сколько новых геномов добавляется к пангеному. Escherichia coli является примером вида с открытым пангеномом. Любой размер генома E. coli находится в диапазоне 4000–5000 генов, а размер пангенома, оцененный для этого вида с приблизительно 2000 геномами, состоит из 89 000 различных семейств генов. [24] Пангеном домена бактерий также считается открытым.

Закрытый пангеном

Закрытый пангеном возникает в родословной, когда только несколько семейств генов добавляются при включении новых геномов в анализ пангенома, а общее количество семейств генов в пангеноме, по-видимому, асимптотично к одному числу. Считается, что паразитизм и виды, которые являются специалистами в некоторой экологической нише , как правило, имеют закрытые пангеномы. Staphylococcus lugdunensis является примером комменсальной бактерии с закрытым пангеномом. [25]

История

Пангеном

Первоначальная концепция пангенома была разработана Теттелином и др. [2], когда они проанализировали геномы восьми изолятов Streptococcus agalactiae , где они описали основной геном, общий для всех изолятов, составляющий приблизительно 80% любого отдельного генома, плюс необязательный геном, состоящий из частично общих и штамм-специфических генов. Экстраполяция показала, что резервуар генов в пангеноме S. agalactiae огромен и что новые уникальные гены будут продолжать идентифицироваться даже после секвенирования сотен геномов. [2] Пангеном включает в себя всю совокупность генов, обнаруженных в секвенированных геномах данного вида микробов, и он может измениться, когда новые геномы секвенируются и включаются в анализ. [ необходима цитата ]

Супергеном определяется как все гены, доступные для определенного вида, пангеном — если было доступно секвенирование всех геномов одного вида. Метапангеном — это анализ пангенома, применяемый к метагеномным образцам, где оценивается объединение генов нескольких видов для заданной среды обитания.

Пангеном геномной линии отвечает за внутрилинейную изменчивость содержания генов. Пангеном развивается из-за: дупликации генов, динамики приобретения и потери генов и взаимодействия генома с мобильными элементами, которые формируются отбором и дрейфом. [26] Некоторые исследования указывают на то, что пангеномы прокариот являются результатом адаптивной, а не нейтральной эволюции , которая дает видам способность мигрировать в новые ниши. [27]

Супергеном

Супергеном можно рассматривать как реальный размер пангенома, если все геномы вида были секвенированы. [28] Он определяется как все гены, доступные для получения определенным видом. Его нельзя рассчитать напрямую, но его размер можно оценить по размеру пангенома, рассчитанному из доступных данных о геноме. Оценка размера облачного генома может вызывать беспокойство из-за его зависимости от встречаемости редких генов и геномов. В 2011 году геномная текучесть была предложена в качестве меры для классификации сходства на уровне генов среди групп секвенированных изолятов. [29] В некоторых родословных супергеномы действительно казались бесконечными , [30] как в случае домена бактерий. [31]

Метапангеном

«Метапангеном» был определен как результат анализа пангеномов в сочетании с окружающей средой, где обилие и распространенность кластеров генов и геномов восстанавливаются с помощью метагеномов дробовика. [32] Сочетание метагеномов с пангеномами, также называемое «метапангеномикой», выявляет результаты фильтрации пангеномного генофонда на уровне популяции, специфичные для среды обитания. [33]

Другие авторы считают, что Метапангеномика расширяет концепцию пангенома, включая последовательности генов , полученные из некультивируемых микроорганизмов с помощью подхода метагеномики . Метапангеном включает как последовательности из геномов, собранных с помощью метагенома ( MAG ), так и из геномов, полученных из культивируемых микроорганизмов. [34] Метапангеномика применялась для оценки разнообразия сообщества, адаптации микробной ниши, микробной эволюции, функциональной активности и сетей взаимодействия сообщества. [35] Платформа Anvi'o разработала рабочий процесс, который интегрирует анализ и визуализацию метапангеномов путем создания пангеномов и изучения их в сочетании с метагеномами. [32]

Примеры

Пангеном прокариот

Пангеном S. pneumoniae . (a) Количество новых генов как функция количества секвенированных геномов. Предсказанное количество новых генов резко падает до нуля, когда количество геномов превышает 50. (b) Количество основных генов как функция количества секвенированных геномов. Количество основных генов сходится к 1647 для количества геномов n→∞. Из Donati et al. [36]

В 2018 году 87% доступных полных геномных последовательностей были бактериями, что подогревало интерес исследователей к вычислению пангеномов прокариот на разных таксономических уровнях. [22] В 2015 году пангеном 44 штаммов бактерий Streptococcus pneumoniae показал мало новых генов, обнаруженных с каждым новым секвенированным геномом (см. рисунок). Фактически, прогнозируемое количество новых генов упало до нуля, когда количество геномов превысило 50 (отметим, однако, что эта закономерность не обнаружена у всех видов). Это означало бы, что S. pneumoniae имеет «закрытый пангеном». [37] Основным источником новых генов в S. pneumoniae был Streptococcus mitis, из которого гены были переданы горизонтально . Размер пангенома S. pneumoniae увеличивался логарифмически с числом штаммов и линейно с числом полиморфных участков отобранных геномов, что позволяет предположить, что приобретенные гены накапливаются пропорционально возрасту клонов. [36] Другим примером пангенома прокариот является Prochlorococcus , основной набор генома которого намного меньше пангенома, который используется различными экотипами Prochlorococcus . [38] Открытый пангеном наблюдался у таких экологических изолятов, как Alcaligenes sp. [39] и Serratia sp., [40], демонстрирующих симпатрический образ жизни. Тем не менее, открытый пангеном не является исключительным для свободно живущих микроорганизмов, исследование 2015 года бактерий Prevotella, выделенных от людей , сравнивало репертуары генов ее видов, полученных из разных участков тела человека. В нем также сообщалось об открытом пангеноме, демонстрирующем огромное разнообразие генофонда. [41]

У архей также есть некоторые исследования пангенома. Пангеном галобактерий показывает следующие семейства генов в подмножествах пангенома: ядро ​​(300), вариабельные компоненты (Softcore: 998, Cloud:36531, Shell:11784). [42]

Эукариотический пангеном

Эукариотические организмы, такие как грибы , животные и растения, также продемонстрировали наличие пангеномов. У четырех видов грибов, пангеном которых был изучен, от 80 до 90% моделей генов были обнаружены как основные гены. Остальные вспомогательные гены в основном участвовали в патогенезе и устойчивости к противомикробным препаратам. [43]

У животных изучается пангеном человека. В 2010 году исследование показало, что полный пангеном человека будет содержать ~19–40 мегабаз новой последовательности, не представленной в существующем эталонном геноме человека . [44] Консорциум Human Pangenome поставил перед собой цель признать разнообразие генома человека. В 2023 году был опубликован проект справочника по пангеному человека. [45] Он основан на 47 диплоидных геномах людей разной этнической принадлежности. [45] Планируется усовершенствовать справочник, охватывающий еще большее биоразнообразие из еще более широкой выборки. [45]

Среди растений есть примеры исследований пангенома в модельных видах, как диплоидных [9], так и полиплоидных, [10] и растущем списке сельскохозяйственных культур. [46] [47] Пангеномы показали себя многообещающим инструментом в селекции растений, учитывая структурные варианты и однонуклеотидные полиморфизмы в нереферентных геномах, что помогает решить проблему отсутствия наследуемости , которая сохраняется в исследованиях ассоциаций по всему геному . [48] Новая концепция, основанная на растениях, — это концепция пан-NLRome, которая представляет собой репертуар нуклеотидсвязывающих белков с богатыми лейцином повторами (NLR), внутриклеточных иммунных рецепторов, которые распознают патогенные белки и обеспечивают устойчивость к болезням. [49]

Вирус пангеном

Вирус не обязательно имеет гены, широко распространенные в кладах, как в случае 16S у бактерий , и поэтому основной геном полного вирусного домена пуст. Тем не менее, несколько исследований вычислили пангеном некоторых вирусных линий. Основной геном шести видов пандоравирусов включает 352 семейства генов, что составляет всего 4,7% пангенома, что приводит к открытому пангеному. [50]

Структуры данных

Число секвенированных геномов постоянно растет, «простое масштабирование существующих биоинформатических конвейеров будет недостаточным для использования всего потенциала таких богатых наборов геномных данных». [51] Пангеномные графы — это новые структуры данных, разработанные для представления пангеномов и эффективного сопоставления прочтений с ними. Они были рассмотрены Эйзенгой и др. [52]

Программные инструменты

Пангеномный анализ геномов Streptococcus agalactiae . [2] Пример филогений, созданных с помощью программного обеспечения BPGA. Это программное обеспечение позволяет нам генерировать филогении на основе кластеризации основного генома или пангенома. Основные и панфилогенетические реконструкции не обязательно совпадают.

По мере того, как интерес к пангеномам рос, было разработано несколько программных инструментов, помогающих анализировать этот тип данных. Для начала пангеномного анализа первым шагом является гомогенизация аннотации генома. [23] Для аннотации всех используемых геномов следует использовать одно и то же программное обеспечение, например GeneMark [53] или RAST. [54] В 2015 году группа рассмотрела различные виды анализов и инструментов, которые могут быть доступны исследователю. [55] Существует семь видов программного обеспечения, разработанных для анализа пангеномов: предназначенные для кластеризации гомологичных генов; определения однонуклеотидных полиморфизмов ; построения пангеномных профилей; построения филогенетических связей ортологичных генов/семейств штаммов/изолятов; поиска на основе функций; аннотации и/или курирования; и визуализации. [55]

Два наиболее цитируемых программных инструмента для пангеномного анализа в конце 2014 года [55] были Panseq [56] и конвейер анализа пангеномов (PGAP). [57] Другие варианты включают BPGA – конвейер анализа пангеномов для прокариотических геномов, [58] GET_HOMOLOGUES, [59] Roary. [60] и PanDelos. [61] В 2015 году были опубликованы обзор, посвященный пангеномам прокариот [62], и еще один – пангеномам растений. [63] Среди первых программных пакетов, разработанных для пангеномов растений, были PanTools. [64] и GET_HOMOLOGUES-EST. [11] [59] В 2018 году был выпущен panX, интерактивный веб-инструмент, позволяющий проверять эволюционную историю семейств генов. [65] panX может отображать выравнивание геномов, филогенетическое дерево, картирование мутаций и вывод о приобретении и потере семейства в филогении основного генома. В 2019 году OrthoVenn 2.0 [66] позволил сравнительную визуализацию семейств гомологичных генов в диаграммах Венна до 12 геномов. В 2023 году был разработан BRIDGEcereal для исследования и графического отображения гаплотипов на основе инделей из пангенома через идентификатор модели гена. [67]

Пангеномный граф из 3 117 геномов Acinetobacter baumannii. Ребра соответствуют геномной колокализации, а узлы — генам. Толщина ребер пропорциональна количеству геномов, разделяющих эту связь. Ребра между постоянными (похожими на основные гены), узлами оболочки и облака окрашены в оранжевый, зеленый и синий цвета соответственно.
Пангеномный граф из 3 117 геномов Acinetobacter baumannii , созданный с помощью программного обеспечения PPanGGOLiN. Ребра соответствуют геномной колокализации, а узлы — генам. Толщина ребер пропорциональна количеству геномов, разделяющих эту связь. Ребра между постоянными (похожими на основные гены), узлами оболочки и облака окрашены в оранжевый, зеленый и синий цвета соответственно.

В 2020 году Anvi'o [1] был доступен как мультиомная платформа, которая содержит пангеномный и метапангеномный анализы, а также рабочие процессы визуализации. В Anvi'o геномы отображаются в концентрических кругах, а каждый радиус представляет собой семейство генов, что позволяет сравнивать более 100 геномов в его интерактивной визуализации. В 2020 году было выпущено вычислительное сравнение инструментов для извлечения пангеномного содержимого на основе генов (таких как GET_HOMOLOGUES, PanDelos, Roary и других). [68] Инструменты сравнивались с методологической точки зрения, анализируя причины, по которым данная методология превосходит другие инструменты. Анализ проводился с учетом различных популяций бактерий, которые синтетически генерируются путем изменения эволюционных параметров. Результаты показывают дифференциацию производительности каждого инструмента, которая зависит от состава входных геномов. В 2020 году несколько инструментов снова представили графическое представление пангеномов, показывающее смежность генов (PPanGGOLiN, [46] Panaroo [65] ). Другие программные инструменты для пангеномики включают Prodigal, Prokka, PanVis, PanTools, Pangenome Graph Builder (PGGB), PanX, Pagoo и pgr-tk. [69]

Пример возможных выходных данных программного обеспечения BPGA. Пангеномный анализ геномов Streptococcus agalactiae . Слева показано распределение терминов Go по основному/необязательному/уникальному геному. В этом примере категории репликация, рекомбинация и репарация обогащены уникальными семействами генов. Справа показан типичный график пан/основной, при добавлении большего количества геномов размер ядра уменьшается, а размер пангенома, наоборот, увеличивается. [2]

Смотрите также

Ссылки

  1. ^ ab Eren AM, Kiefl E, Shaiber A, Veseli I, Miller SE, Schechter MS и др. (январь 2021 г.). «Community-led, integrated, reproducible multi-omics with anvi'o». Nature Microbiology . 6 (1): 3–6. doi :10.1038/s41564-020-00834-3. PMC  8116326 . PMID  33349678.
  2. ^ abcdefghijkl Tettelin H, Masignani V, Cieslewicz MJ, Donati C, Medini D, Ward NL, Angiuoli SV, Crabtree J, Jones AL, Durkin AS, DeBoy RT (2005-09-27). "Анализ генома множественных патогенных изолятов Streptococcus agalactiae: значение для микробного "пангенома"". Труды Национальной академии наук . 102 (39): 13950–13955. Bibcode : 2005PNAS..10213950T. doi : 10.1073/pnas.0506758102 . ISSN  0027-8424. PMC 1216834. PMID 16172379  . 
  3. ^ abc Медини Д., Донати С., Теттелин Х., Масиньяни В., Раппуоли Р. (декабрь 2005 г.). «Микробный пангеном». Текущее мнение в области генетики и развития . 15 (6): 589–94. дои :10.1016/j.где.2005.09.006. ПМИД  16185861.
  4. ^ abcd Vernikos G, Medini D, Riley DR, Tettelin H (февраль 2015 г.). «Десять лет пангеномного анализа». Current Opinion in Microbiology . 23 : 148–54. doi : 10.1016/j.mib.2014.11.016. PMID  25483351.
  5. ^ ab Marroni F, Pinosio S, Morgante M (апрель 2014 г.). «Структурная изменчивость и сложность генома: действительно ли необязательное необязательное?». Current Opinion in Plant Biology . 18 : 31–36. Bibcode : 2014COPB...18...31M. doi : 10.1016/j.pbi.2014.01.003. PMID  24548794.
  6. ^ Вольф YI, Макарова KS, Ютин N, Кунин EV (декабрь 2012 г.). «Обновленные кластеры ортологичных генов для архей: сложный предок архей и пути горизонтального переноса генов». Biology Direct . 7 : 46. doi : 10.1186/1745-6150-7-46 . PMC 3534625. PMID  23241446 . 
  7. ^ Mira A, Martín-Cuadrado AB, D'Auria G, Rodríguez-Valera F (2010). «Бактериальный пангеном: новая парадигма в микробиологии». Int Microbiol . 13 (2): 45–57. doi :10.2436/20.1501.01.110. PMID  20890839.
  8. ^ Morgante M, De Paoli E, Radovic S (апрель 2007 г.). «Транспозируемые элементы и пангеномы растений». Current Opinion in Plant Biology . 10 (2): 149–55. Bibcode : 2007COPB...10..149M. doi : 10.1016/j.pbi.2007.02.001. PMID  17300983.
  9. ^ ab Gordon SP, Contreras-Moreira B, Woods DP, Des Marais DL, Burgess D, Shu S и др. (декабрь 2017 г.). «Обширная вариация содержания генов в пангеноме Brachypodium distachyon коррелирует со структурой популяции». Nature Communications . 8 (1): 2184. Bibcode :2017NatCo...8.2184G. doi :10.1038/s41467-017-02292-8. PMC 5736591 . PMID  29259172. 
  10. ^ ab Gordon SP, Contreras-Moreira B, Levy JH, Djamei A, Czedik-Eysenberg A, Tartaglio VS и др. (июль 2020 г.). «Постепенная полиплоидная эволюция генома, выявленная с помощью пангеномного анализа Brachypodium hybridum и его диплоидных предшественников». Nature Communications . 11 (1): 3670. Bibcode :2020NatCo..11.3670G. doi : 10.1038/s41467-020-17302-5 . PMC 7391716 . PMID  32728126. 
  11. ^ ab Contreras-Moreira B, Cantalapiedra CP, García-Pereira MJ, Gordon SP, Vogel JP, Igartua E и др. (февраль 2017 г.). "Анализ пангеномов и транскриптомов растений с помощью GET_HOMOLOGUES-EST, решения для кластеризации последовательностей одного и того же вида". Frontiers in Plant Science . 8 : 184. doi : 10.3389/fpls.2017.00184 . PMC 5306281 . PMID  28261241. 
  12. ^ Reno ML, Held NL, Fields CJ, Burke PV, Whitaker RJ (май 2009 г.). «Биогеография пангенома Sulfolobus islandicus». Труды Национальной академии наук Соединенных Штатов Америки . 106 (21): 8605–10. Bibcode : 2009PNAS..106.8605R . doi : 10.1073/pnas.0808945106 . PMC 2689034. PMID  19435847. 
  13. ^ Reinhardt JA, Baltrus DA, Nishimura MT, Jeck WR, Jones CD, Dangl JL (февраль 2009 г.). «Сборка de novo с использованием данных коротких последовательностей с низким покрытием из патогена риса Pseudomonas syringae pv. oryzae». Genome Research . 19 (2): 294–305. doi :10.1101/gr.083311.108. PMC 2652211. PMID  19015323 . 
  14. ^ Теттелин Х, Медини Д (2020). Теттелин Х., Медини Д. (ред.). Пангеном (PDF) . дои : 10.1007/978-3-030-38281-0. ISBN 978-3-030-38280-3. PMID  32633908. S2CID  217167361.
  15. ^ ab Halachev MR, Loman NJ, Pallen MJ (2011). «Вычисление ортологов у бактерий и архей: подход «разделяй и властвуй»». PLOS ONE . ​​6 (12): e28388. Bibcode :2011PLoSO...628388H. doi : 10.1371/journal.pone.0028388 . PMC 3236195 . PMID  22174796. 
  16. ^ Blaustein RA, McFarland AG, Ben Maamar S, Lopez A, Castro-Wallace S, Hartmann EM (2019). «Пангеномный подход к пониманию микробных адаптаций в модельно-созданной среде, Международной космической станции, относительно человеческих хозяев и почвы». mSystems . 4 (1): e00281-18. doi :10.1128/mSystems.00281-18. PMC 6325168 . PMID  30637341. 
  17. ^ Москера-Рендон Дж., Рада-Браво А.М., Карденас-Брито С., Корредор М., Рестрепо-Пинеда Э., Бенитес-Паес А. (январь 2016 г.). «Анализ общепангеномной и молекулярной эволюции видов Pseudomonas aeruginosa». БМК Геномика . 17 (45): 45. дои : 10.1186/s12864-016-2364-4 . ПМК 4710005 . ПМИД  26754847. 
  18. ^ Snipen L, Ussery DW (январь 2010 г.). «Стандартная операционная процедура для вычисления пангеномных деревьев». Стандарты в геномных науках . 2 (1): 135–41. doi :10.4056/sigs.38923. PMC 3035256. PMID  21304685 . 
  19. ^ Селем-Мохика Н., Агилар С., Гутьеррес-Гарсия К., Мартинес-Герреро С.Э., Барона-Гомес Ф. (декабрь 2019 г.). «EvoMining раскрывает происхождение и судьбу ферментов биосинтеза натуральных продуктов». Микробная геномика . 5 (12): e000260. дои : 10.1099/mgen.0.000260 . ПМК 6939163 . ПМИД  30946645. 
  20. ^ Хуарес-Васкес А.Л., Эдирисингхе Х.Н., Вердуско-Кастро Э.А., Михальска К., Ву С., Нода-Гарсия Л. и др. (март 2017 г.). «Эволюция субстратной специфичности сохранившегося фермента, вызванная потерей гена». электронная жизнь . 6 (6): e22679. дои : 10.7554/eLife.22679 . ПМК 5404923 . ПМИД  28362260. 
  21. ^ Noda-García L, Camacho-Zarco AR, Medina-Ruíz S, Gaytán P, Carrillo-Tripp M, Fülöp V, Barona-Gómez F (сентябрь 2013 г.). «Эволюция субстратной специфичности фермента реципиента после горизонтального переноса генов». Молекулярная биология и эволюция . 30 (9): 2024–34. doi : 10.1093/molbev/mst115 . PMID  23800623.
  22. ^ ab Vernikos GS (2020). «Обзор инструментов пангенома и недавних исследований». Пангеном . стр. 89–112. doi :10.1007/978-3-030-38281-0_4. ISBN 978-3-030-38280-3. PMID  32633917. S2CID  219011507.
  23. ^ ab Costa SS, Guimarães LC, Silva A, Soares SC, Baraúna RA (2020). «Первые шаги в анализе пангеномов прокариот». Биоинформатика и биология . 14 : 1177932220938064. doi : 10.1177/1177932220938064. ПМЦ 7418249 . ПМИД  32843837. 
  24. ^ Land M, Hauser L, Jun SR, Nookaew I, Leuze MR, Ahn TH и др. (март 2015 г.). «Итоги 20-летнего секвенирования бактериальных геномов». Functional & Integrative Genomics . 15 (2): 141–61. doi :10.1007/s10142-015-0433-4. PMC 4361730. PMID  25722247 . 
  25. ^ Argemi X, Matelska D, Ginalski K, Riegel P, Hansmann Y, Bloom J и др. (август 2018 г.). «Сравнительный геномный анализ Staphylococcus lugdunensis показывает закрытый пангеном и множественные барьеры для горизонтального переноса генов». BMC Genomics . 19 (1): 621. doi : 10.1186/s12864-018-4978-1 . PMC 6102843 . PMID  30126366. 
  26. ^ Brockhurst MA, Harrison E, Hall JP, Richards T, McNally A, MacLean C (октябрь 2019 г.). «Экология и эволюция пангеномов». Current Biology . 29 (20): R1094–R1103. Bibcode : 2019CBio...29R1094B. doi : 10.1016/j.cub.2019.08.012 . PMID  31639358. S2CID  204823648.
  27. ^ McInerney JO, McNally A, O'Connell MJ (март 2017 г.). "Почему у прокариот пангеномы" (PDF) . Nature Microbiology . 2 (4): 17040. doi :10.1038/nmicrobiol.2017.40. PMID  28350002. S2CID  19612970.
  28. ^ Кунин EV (июнь 2015 г.). «Турбулентная сетевая динамика микробной эволюции и статистическое древо жизни». Журнал молекулярной эволюции . 80 (5–6): 244–50. Bibcode :2015JMolE..80..244K. doi :10.1007/s00239-015-9679-7. PMC 4472940 . PMID  25894542. 
  29. ^ Кислюк АО, Хейгеман Б, Бергман НХ, Вайц ДжС (январь 2011 г.). «Геномная текучесть: интегративный взгляд на разнообразие генов в микробных популяциях». BMC Genomics . 12 (12): 32. doi : 10.1186/1471-2164-12-32 . PMC 3030549 . PMID  21232151. 
  30. ^ Puigbò P, Lobkovsky AE, Kristensen DM, Wolf YI, Koonin EV (август 2014 г.). «Геномы в смятении: количественная оценка динамики генома в супергеномах прокариот». BMC Biology . 12 (66): 66. doi : 10.1186/s12915-014-0066-4 . PMC 4166000 . PMID  25141959. 
  31. ^ Lapierre P, Gogarten JP (март 2009). «Оценка размера бактериального пангенома». Trends in Genetics . 25 (3): 107–10. doi :10.1016/j.tig.2008.12.004. PMID  19168257.
  32. ^ ab Delmont TO, Eren AM (2018). «Связывание пангеномов и метагеномов: метапангеном Prochlorococcus». PeerJ . 6 : e4320. doi : 10.7717/peerj.4320 . PMC 5804319 . PMID  29423345. 
  33. ^ Utter DR, Бориси GG, Эрен AM, Кавано CM, Марк Уэлч JL (2020-12-16). «Метапангеномика орального микробиома дает представление об адаптации среды обитания и разнообразии сортов». Genome Biology . 21 (1): 293. doi : 10.1186/s13059-020-02200-2 . PMC 7739467 . PMID  33323129. 
  34. ^ Ma B, France M, Ravel J (2020). «Мета-пангеном: на перекрестке пангеномики и метагеномики». В Tettelin H, Medini D (ред.). Пангеном: разнообразие, динамика и эволюция геномов. Springer. стр. 205–218. doi :10.1007/978-3-030-38281-0_9. ISBN 978-3-030-38281-0. PMID  32633911. S2CID  219067583.
  35. ^ Zhong C, Chen C, Wang L, Ning K (2021). «Интеграция пангенома с метагеномом для профилирования микробного сообщества». Computational and Structural Biotechnology Journal . 19 : 1458–1466. doi : 10.1016/j.csbj.2021.02.021. PMC 8010324. PMID  33841754 . 
  36. ^ ab Donati C, Hiller NL, Tettelin H, Muzzi A, Croucher NJ, Angiuoli SV и др. (2010). «Структура и динамика пангенома Streptococcus pneumoniae и близкородственных видов». Genome Biology . 11 (10): R107. doi : 10.1186/gb-2010-11-10-r107 . PMC 3218663 . PMID  21034474. 
  37. ^ Rouli L, Merhej V, Fournier PE, Raoult D (сентябрь 2015 г.). «Бактериальный пангеном как новый инструмент для анализа патогенных бактерий». Новые микробы и новые инфекции . 7 : 72–85. doi :10.1016/j.nmni.2015.06.005. PMC 4552756. PMID  26442149 . 
  38. ^ Kettler GC, Martiny AC, Huang K, Zucker J, Coleman ML, Rodrigue S и др. (декабрь 2007 г.). «Закономерности и последствия приобретения и утраты генов в эволюции Prochlorococcus». PLOS Genetics . 3 (12): e231. doi : 10.1371/journal.pgen.0030231 . PMC 2151091. PMID  18159947 . 
  39. ^ Башарат З, Ясмин А, Хе Т, Тонг И (2018). "Секвенирование и анализ генома Alcaligenes faecalis subsp. phenolicus MB207". Scientific Reports . 8 (1): 3616. Bibcode :2018NatSR...8.3616B. doi :10.1038/s41598-018-21919-4. PMC 5827749 . PMID  29483539. 
  40. ^ Башарат З., Ясмин А. (2016). «Пангеномный анализ рода Serratia». arXiv : 1610.04160 [q-bio.GN].
  41. ^ Gupta VK, Chaudhari NM, Iskepalli S, Dutta C (март 2015 г.). «Расхождения в репертуаре генов среди референтных геномов Prevotella, полученных из различных участков тела человека». BMC Genomics . 16 (153): 153. doi : 10.1186/s12864-015-1350-6 . PMC 4359502 . PMID  25887946. 
  42. ^ Габа С., Кумари А., Медема М., Каушик Р. (декабрь 2020 г.). «Анализ пангенома и реконструкция предкового состояния класса галобактерий: вероятность нового надпорядка». Scientific Reports . 10 (1): 21205. Bibcode :2020NatSR..1021205G. doi :10.1038/s41598-020-77723-6. PMC 7713125 . PMID  33273480. 
  43. ^ McCarthy CG, Fitzpatrick DA (февраль 2019 г.). «Пангеномный анализ модельных видов грибов». Microbial Genomics . 5 (2). doi : 10.1099/mgen.0.000243 . PMC 6421352. PMID  30714895 . 
  44. ^ Ли Р, Ли Ю, Чжэн Х, Луо Р, Чжу Х, Ли Q, Цянь В, Рен Ю, Тянь Г, Ли Дж, Чжоу Г, Чжу Икс, Ву Х, Цинь Дж, Цзинь Икс, Ли Д, Цао Х, Ху Х, Бланш Х, Канн Х, Чжан Х, Ли С, Болунд Л, Кристиансен К, Ян Х, Ван Дж, Ван Дж (2010). «Построение карты последовательностей пангенома человека». Нат Биотехнология . 28 (1): 57–63. дои : 10.1038/nbt.1596. PMID  19997067. S2CID  205274447.
  45. ^ abc Liao WW, Asri M, Ebler J, Doerr D, Haukness M, Hickey G и др. (май 2023 г.). «Черновик справочника по пангеному человека». Nature . 617 (7960): 312–324. Bibcode :2023Natur.617..312L. doi : 10.1038/s41586-023-05896-x . PMC 10172123 . PMID  37165242. 
  46. ^ ab Gao L, Gonda I, Sun H и др. (май 2019 г.). «Пангеном томата раскрывает новые гены и редкий аллель, регулирующий вкус фруктов». Nature Genetics . 51 (6): 1044–51. doi :10.1038/s41588-019-0410-2. PMID  31086351. S2CID  152283283.
  47. ^ Джаякоди М., Падмарасу С., Хаберер Г. и др. (ноябрь 2020 г.). «Пангеном ячменя раскрывает скрытое наследие мутационной селекции». Природа . 588 (7837): 284–9. Бибкод : 2020Natur.588..284J. дои : 10.1038/s41586-020-2947-8 . ПМЦ 7759462 . ПМИД  33239781. 
  48. ^ Zhou Y, Zhang Z, Bao Z, Li H, Lyu Y, Zan Y, Wu Y, Cheng L, Fang Y, Wu K, Zhang J, Lyu H, Lin T, Gao Q, Saha S (8 июля 2022 г.). «Graph pangenome фиксирует отсутствующую наследуемость и расширяет возможности селекции томатов». Nature . 606 (7914): 527–534. Bibcode :2022Natur.606..527Z. doi : 10.1038/s41586-022-04808-9 . hdl : 20.500.11850/553553 . ISSN  1476-4687. PMC 9200638 . PMID  35676474. 
  49. ^ Ван де Вейер А.Л., Монтейро Ф., Фурцер О.Дж., Нишимура М.Т., Чевик В., Витек К., Джонс Дж.Д., Дангл Дж.Л., Вайгель Д., Бемм Ф. (август 2019 г.). «Общевидовой перечень генов и аллелей NLR у Arabidopsis thaliana». Клетка . 178 (5): 1260–72. дои : 10.1016/j.cell.2019.07.038 . ПМК 6709784 . ПМИД  31442410. 
  50. ^ Aherfi S, Andreani J, Baptiste E, Oumessoum A, Dornas FP, Andrade AC и др. (2018). «Большой открытый пангеном и малый основной геном гигантских пандоравирусов». Frontiers in Microbiology . 9 (9): 1486. ​​doi : 10.3389 /fmicb.2018.01486 . ​​PMC 6048876. PMID  30042742. 
  51. ^ Консорциум Computational Pan-Genomics (январь 2018 г.). «Computational pan-genomics: status, promises and challenges». Briefings in Bioinformatics . 19 (1): 118–135. doi :10.1093/bib/bbw089. PMC 5862344. PMID  27769991 . 
  52. ^ Эйзенга Дж. М., Новак А. М., Сиббесен Дж. А., Хеумос С., Гаффаари А., Хики Г. и др. (август 2020 г.). «Пангеномные графики». Ежегодный обзор геномики и генетики человека . 21 : 139–162. doi : 10.1146/annurev-genom-120219-080406. ПМК 8006571 . ПМИД  32453966. 
  53. ^ Besemer J, Lomsadze A, Borodovsky M (июнь 2001 г.). "GeneMarkS: метод самообучения для прогнозирования начала генов в микробных геномах. Значение для поиска мотивов последовательностей в регуляторных областях". Nucleic Acids Research . 29 (12): 2607–18. doi :10.1093/nar/29.12.2607. PMC 55746. PMID  11410670 . 
  54. ^ Aziz RK, Bartels D, Best AA, DeJongh M, Disz T, Edwards RA и др. (февраль 2008 г.). «Сервер RAST: быстрые аннотации с использованием технологии подсистем». BMC Genomics . 9 (9): 75. doi : 10.1186/1471-2164-9-75 . PMC 2265698 . PMID  18261238. 
  55. ^ abc Xiao J, Zhang Z, Wu J, Yu J (февраль 2015 г.). «Краткий обзор программных инструментов для пангеномики». Genomics, Proteomics & Bioinformatics . 13 (1): 73–6. doi :10.1016/j.gpb.2015.01.007. PMC 4411478 . PMID  25721608. 
  56. ^ Laing C, Buchanan C, Taboada EN, Zhang Y, Kropinski A, Villegas A и др. (сентябрь 2010 г.). «Анализ последовательности пангенома с использованием Panseq: онлайн-инструмент для быстрого анализа основных и дополнительных геномных регионов». BMC Bioinformatics . 11 (1): 461. doi : 10.1186/1471-2105-11-461 . PMC 2949892 . PMID  20843356. 
  57. ^ Zhao Y, Wu J, Yang J, Sun S, Xiao J, Yu J (февраль 2012 г.). «PGAP: конвейер анализа пангеномов». Биоинформатика . 28 (3): 416–8. doi :10.1093/bioinformatics/btr655. PMC 3268234. PMID  22130594 . 
  58. ^ Чаудхари НМ, Гупта ВК, Дутта К (апрель 2016 г.). «BPGA — сверхбыстрый конвейер анализа пангенома». Scientific Reports . 6 (24373): 24373. Bibcode :2016NatSR...624373C. doi :10.1038/srep24373. PMC 4829868 . PMID  27071527. 
  59. ^ ab Contreras-Moreira B, Vinuesa P (декабрь 2013 г.). "GET_HOMOLOGUES, универсальный программный пакет для масштабируемого и надежного анализа микробного пангенома". Applied and Environmental Microbiology . 79 (24): 7696–701. Bibcode :2013ApEnM..79.7696C. doi :10.1128/AEM.02411-13. PMC 3837814 . PMID  24096415. 
  60. ^ Page AJ, Cummins CA, Hunt M, Wong VK, Reuter S, Holden MT и др. (Ноябрь 2015 г.). «Roary: быстрый крупномасштабный анализ генома прокариот». Биоинформатика . 31 (22): 3691–3. doi : 10.1093/bioinformatics/btv421. PMC 4817141. PMID  26198102. 
  61. ^ Bonnici V, Giugno R, Manca V (ноябрь 2018 г.). «PanDelos: метод на основе словаря для обнаружения пангеномного контента». BMC Bioinformatics . 19 (Suppl 15): 437. doi : 10.1186/s12859-018-2417-6 . PMC 6266927. PMID  30497358 . 
  62. ^ Guimarães LC, Florczak-Wyspianska J, de Jesus LB, Viana MV, Silva A, Ramos RT и др. (август 2015 г.). «Внутри пангенома — обзор методов и программного обеспечения». Current Genomics . 16 (4): 245–52. doi :10.2174/1389202916666150423002311. PMC 4765519 . PMID  27006628. 
  63. ^ Golicz AA, Batley J, Edwards D (апрель 2016 г.). «На пути к пангеномике растений» (PDF) . Plant Biotechnology Journal . 14 (4): 1099–105. doi :10.1111/pbi.12499. PMID  26593040.
  64. ^ Шейхизаде С., Шранц М.Е., Акдель М., де Риддер Д., Смит С. (сентябрь 2016 г.). «PanTools: представление, хранение и исследование пангеномных данных». Биоинформатика . 32 (17): i487–i493. doi : 10.1093/bioinformatics/btw455 . PMID  27587666.
  65. ^ ab Ding W, Baumdicker F, Neher RA (январь 2018 г.). "panX: пангеномный анализ и исследование". Nucleic Acids Research . 46 (1): e5. doi :10.1093/nar/gkx977. PMC 5758898. PMID  29077859 . 
  66. ^ Xu L, Dong Z, Fang L, Luo Y, Wei Z, Guo H и др. (Июль 2019 г.). «OrthoVenn2: веб-сервер для сравнения целых геномов и аннотации ортологичных кластеров у нескольких видов». Nucleic Acids Research . 47 (W1): W52–W58. doi :10.1093/nar/gkz333. PMC 6602458. PMID  31053848. 
  67. ^ Zhang B, Huang H, Tibbs-Cortes LE, Vanous A, Zhang Z, Sanguinet K, Garland-Campbell KA, Yu J, Li X (2023). «Оптимизация неконтролируемого машинного обучения для исследования и графического отображения гаплотипов на основе инделей из пангеномов». Molecular Plant . 16 (6): 975–978. doi : 10.1016/j.molp.2023.05.005 . PMID  37202927.
  68. ^ Бонничи В., Марези Э., Джуньо Р. (2020). «Проблемы генно-ориентированных подходов к обнаружению содержимого пангенома». Брифинги по биоинформатике . 22 (3). дои : 10.1093/нагрудник/bbaa198. ISSN  1477-4054. ПМИД  32893299.
  69. ^ Бонничи В., Чикко Д. (2024-09-03). "Семь быстрых советов по генно-ориентированному вычислительному пангеномному анализу". BioData Mining . 17 (28): 28. doi : 10.1186/s13040-024-00380-2 . ISSN  1756-0381. PMC 11370085. PMID  39227987 .