stringtranslate.com

Анализ обогащения набора генов

Схематический обзор модульной структуры, лежащей в основе процедур анализа обогащения набора генов

Анализ обогащения набора генов (GSEA) (также называемый анализом функционального обогащения или анализом обогащения путей ) — это метод идентификации классов генов или белков , которые чрезмерно представлены в большом наборе генов или белков и могут иметь связь с различными фенотипами (например, различными моделями роста организмов или заболеваниями). Метод использует статистические подходы для идентификации значительно обогащенных или обедненных групп генов. Технологии транскриптомики и результаты протеомики часто идентифицируют тысячи генов, которые используются для анализа. [1]

Исследователи, проводящие высокопроизводительные эксперименты , которые дают наборы генов (например, гены, которые по-разному экспрессируются в разных условиях), часто хотят получить функциональный профиль этого набора генов, чтобы лучше понять базовые биологические процессы. Это можно сделать, сравнив входной набор генов с каждым из бинов (терминов) в онтологии геновстатистический тест можно выполнить для каждого бина, чтобы увидеть, обогащен ли он для входных генов.

Фон

После завершения проекта «Геном человека » проблема его интерпретации и анализа осталась. Для поиска генов, связанных с заболеваниями, использовались микрочипы ДНК для измерения количества экспрессии генов в разных клетках. Были проведены микрочипы на тысячах разных генов и сравнения результатов двух разных категорий клеток, например, нормальных клеток и раковых клеток. Однако этот метод сравнения недостаточно чувствителен для обнаружения тонких различий между экспрессией отдельных генов, поскольку заболевания обычно затрагивают целые группы генов. [2] Несколько генов связаны с одним биологическим путем, и поэтому именно аддитивное изменение экспрессии в наборах генов приводит к различию в фенотипической экспрессии. Анализ обогащения набора генов был разработан [2], чтобы сосредоточиться на изменениях экспрессии в группах априори определенных наборов генов. Таким образом, этот метод решает проблему необнаруживаемых, небольших изменений в экспрессии отдельных генов. [3]

Методы

Анализ обогащения набора генов использует априорные наборы генов, которые были сгруппированы вместе по их участию в одном и том же биологическом пути или по проксимальному расположению на хромосоме. [1] Базу данных этих предопределенных наборов можно найти в базе данных молекулярных сигнатур (MSigDB). [4] [5] В GSEA ДНК-микрочипы, или теперь РНК-Seq , по-прежнему выполняются и сравниваются между двумя категориями клеток, но вместо того, чтобы сосредоточиться на отдельных генах в длинном списке, фокусируется на наборе генов. [1] Исследователи анализируют, попадают ли большинство генов в наборе в крайности этого списка: верх и низ списка соответствуют наибольшим различиям в экспрессии между двумя типами клеток. Если набор генов попадает либо в верхнюю часть (сверхэкспрессирован), либо в нижнюю часть (недостаточно экспрессирован), считается, что это связано с фенотипическими различиями.

В методе, который обычно называют стандартным GSEA, аналитический процесс состоит из трех этапов. [1] [2] Общие этапы суммированы ниже:

  1. Рассчитайте показатель обогащения (ES), который представляет собой количество, в котором гены в наборе перепредставлены либо в верхней, либо в нижней части списка. Этот показатель является статистикой типа Колмогорова–Смирнова . [1] [2]
  2. Оцените статистическую значимость ES. Этот расчет выполняется с помощью фенотипического теста перестановки, чтобы получить нулевое распределение для ES. Значение P определяется путем сравнения с нулевым распределением. [1] [2]
    • Расчет значимости таким образом проверяет зависимость набора генов от диагностических/фенотипических меток [1] ​​[2]
  3. Настройте для проверки множественных гипотез, когда большое количество наборов генов анализируется одновременно. Оценки обогащения для каждого набора нормализуются, и рассчитывается частота ложных открытий . [1] [2]

Это можно описать так:

Где - ранг гена, - мощность, обычно принимаемая равной 1 (если бы она была равна 0, это было бы эквивалентно тесту Колмогорова-Смирнова).

Ограничения и предлагаемые альтернативы

МОРЕ

Когда GSEA был впервые предложен в 2003 году, возникли некоторые непосредственные опасения относительно его методологии. Эти критические замечания привели к использованию корреляционно-взвешенного теста Колмогорова-Смирнова , нормализованного ES и расчета частоты ложных открытий, все из которых являются факторами, которые в настоящее время определяют стандартный GSEA. [6] Однако GSEA теперь также подвергается критике за тот факт, что его нулевое распределение является избыточным и слишком сложным, чтобы его стоило рассчитывать, а также за тот факт, что его статистика, подобная статистике Колмогорова-Смирнова, не так чувствительна, как оригинал. [6] В качестве альтернативы был предложен метод, известный как Simpler Enrichment Analysis (SEA). Этот метод предполагает независимость генов и использует более простой подход для расчета t-критерия. Однако считается, что эти предположения на самом деле слишком упрощают, и корреляцию генов нельзя игнорировать. [6]

СГСЭ

Еще одним ограничением анализа обогащения набора генов является то, что результаты сильно зависят от алгоритма, который кластеризует гены, и количества тестируемых кластеров. [7] Спектральное обогащение набора генов (SGSE) — это предлагаемый неконтролируемый тест. Основатели метода утверждают, что это лучший способ найти связи между наборами генов MSigDB и данными микрочипов. Общие шаги включают:

1. Расчет связи между главными компонентами и наборами генов. [7]

2. Использование взвешенного Z-метода для расчета связи между наборами генов и спектральной структурой данных. [7]

Инструменты

GSEA использует сложную статистику, поэтому для выполнения расчетов требуется компьютерная программа. GSEA стала стандартной практикой, и существует множество веб-сайтов и загружаемых программ, которые предоставят наборы данных и выполнят анализ.

МОЕТ

Multi-Ontology Enrichment Tool (MOET) — это веб-инструмент анализа онтологий, который обеспечивает функциональность для нескольких онтологий, включая Disease, GO, Pathway, Phenotype и Chemical entitys (ChEBI) для нескольких видов, включая крысу, мышь, человека, бонобо, белку, собаку, свинью, шиншиллу, голого землекопа и верветку (зеленую мартышку). [8] Он выводит загружаемый график и список статистически перепредставленных терминов в списке генов пользователя с использованием гипергеометрического распределения. MOET также отображает соответствующую поправку Бонферрони и отношение шансов на странице результатов. Он прост в использовании, и результаты предоставляются несколькими щелчками мыши за секунды; не требуется установка программного обеспечения или навыки программирования. Кроме того, MOET обновляется еженедельно, предоставляя пользователю самые последние данные для анализа.

НАСКАР

NASQAR (Nucleic Acid Sequence Analysis Resource) — это веб-платформа с открытым исходным кодом для высокопроизводительного анализа и визуализации данных секвенирования. [9] [10] GSEA можно запустить с помощью пакета clusterProfiler на основе R. [11] NASQAR в настоящее время поддерживает обогащение GO Term и KEGG Pathway всеми организмами, поддерживаемыми базой данных Org.Db. [12]

PlantRegMap

Доступна аннотация генной онтологии (GO) для 165 видов растений и анализ обогащения GO. [ 13 ]

MSigDB

База данных молекулярных сигнатур содержит обширную коллекцию аннотированных наборов генов, которые можно использовать с большинством программ GSEA. [14]

Институт Броуда

Веб -сайт Института Брода сотрудничает с MSigDB и содержит загружаемое программное обеспечение GSEA, а также общее руководство. [15]

ВебГештальт

WebGestalt [16] — это веб-инструментарий для анализа набора генов. Он поддерживает три хорошо зарекомендовавших себя и взаимодополняющих метода анализа обогащения, включая анализ избыточного представительства (ORA), анализ обогащения набора генов (GSEA) и анализ на основе топологии сети (NTA). Анализ может быть выполнен в отношении 12 организмов и 321 251 функциональной категории с использованием 354 идентификаторов генов из различных баз данных и технологических платформ.

Обогатить

Enrichr [17] [18] [19] — это инструмент анализа обогащения набора генов для наборов генов млекопитающих. Он содержит фоновые библиотеки для регуляции транскрипции, путей и взаимодействий белков, онтологии, включая GO и онтологии фенотипов человека и мыши, сигнатуры из клеток, обработанных лекарствами, наборы генов, связанные с заболеваниями человека, и экспрессию генов в различных клетках и тканях. Фоновые библиотеки взяты из более чем 200 ресурсов и содержат более 450 000 аннотированных наборов генов. Инструмент доступен через API и предоставляет различные способы визуализации результатов. [20]

ГенSCF

GeneSCF — это функциональный инструмент обогащения в режиме реального времени с поддержкой нескольких организмов [21] , разработанный для преодоления проблем, связанных с использованием устаревших ресурсов и баз данных. [22] Преимущества использования GeneSCF: анализ в режиме реального времени, пользователям не нужно зависеть от инструментов обогащения для получения обновлений, вычислительным биологам легко интегрировать GeneSCF с их конвейером NGS, он поддерживает несколько организмов, анализ обогащения для списка нескольких генов с использованием нескольких исходных баз данных за один запуск, извлечение или загрузка полных терминов/путей/функций GO с соответствующими генами в виде простого табличного формата в текстовом файле. [23] [24]

ДЭЙВИД

DAVID — это база данных для аннотаций, визуализации и комплексного обнаружения, инструмент биоинформатики , который объединяет информацию из большинства основных биоинформатических источников с целью анализа больших списков генов с высокой пропускной способностью. [25] DAVID выходит за рамки стандартного GSEA с дополнительными функциями, такими как переключение между идентификаторами генов и белков в масштабе всего генома, [25] однако аннотации, используемые DAVID, не обновлялись с октября 2016 года по декабрь 2021 года, [26] что может оказать значительное влияние на практическую интерпретацию результатов. [27] Однако последнее обновление было выполнено в 2021 году [26]

Метаскейп

Metascape — это портал анализа списков генов, ориентированный на биологов. [28] Metascape объединяет анализ обогащения путей, анализ белковых комплексов и метаанализ нескольких списков в один бесшовный рабочий процесс, доступный через значительно упрощенный пользовательский интерфейс. Metascape поддерживает точность анализа, ежемесячно обновляя свои 40 баз знаний. Metascape представляет результаты с помощью простых для интерпретации графиков, электронных таблиц и презентаций качества публикации и находится в свободном доступе. [29]

АмиГО 2

Консорциум Gene Ontology (GO) также разработал свой собственный онлайн-инструмент обогащения терминов GO, [30] позволяющий проводить анализ обогащения, специфичный для видов, по сравнению с полной базой данных, более грубыми слитками GO или пользовательскими ссылками. [31]

БОЛЬШОЙ

Инструмент для обогащения аннотаций геномных регионов (GREAT) — это программное обеспечение, которое использует преимущества регуляторных доменов для лучшей ассоциации терминов онтологии генов с генами. [32] [33] Его основная цель — идентифицировать пути и процессы, которые в значительной степени связаны с активностью регуляции факторов. Этот метод сопоставляет гены с регуляторными регионами с помощью гипергеометрического теста по генам, выводя проксимальные регуляторные домены генов. Он делает это, используя общую долю генома, связанную с данным термином онтологии, как ожидаемую долю входных регионов, связанных с термином случайно. Обогащение рассчитывается по всем регуляторным регионам, и было проведено несколько экспериментов для проверки GREAT, одним из которых был анализ обогащения, выполненный на 8 наборах данных ChIP-seq . [32]

FunRich

Инструмент анализа функционального обогащения (FunRich) [34] в основном используется для функционального обогащения и сетевого анализа данных Omics . [35]

FuncAssociate

Инструмент FuncAssociate позволяет проводить онтологию генов и пользовательский анализ обогащения. [36] Он позволяет вводить упорядоченные наборы, а также файлы взвешенного пространства генов для фона. [37]

ИнтерМайн

Экземпляры InterMine автоматически обеспечивают анализ обогащения [38] для загруженных наборов генов и других биологических объектов.

Пакет ToppGene

ToppGene — это универсальный портал для анализа обогащения списка генов и приоритизации генов-кандидатов на основе функциональных аннотаций и сети белковых взаимодействий. [39] Разработано и поддерживается Отделением биомедицинской информатики Медицинского центра Детской больницы Цинциннати .

QuSAGE

Количественный анализ набора генов (Quantitative Set Analysis for Gene Expression (QuSAGE)) — это вычислительный метод для анализа обогащения набора генов. [40] QuSAGE повышает мощность, учитывая межгенные корреляции и количественно оценивает активность набора генов с помощью полной функции плотности вероятности (PDF). Из этой PDF можно легко извлечь значения P и доверительные интервалы . Сохранение PDF также позволяет проводить апостериорный анализ (например, попарные сравнения активности набора генов) при сохранении статистической прослеживаемости. Применимость QuSAGE была расширена до продольных исследований путем добавления функциональности для общих линейных смешанных моделей. [41] QuSAGE использовался NIH/NIAID для определения базовых транскрипционных сигнатур, которые были связаны с ответами на вакцинацию человека против гриппа . [42] QuSAGE доступен в виде пакета R/ Bioconductor . [43]

Blast2GO

Blast2GO — это биоинформатическая платформа для функциональной аннотации и анализа геномных наборов данных. [44] Этот инструмент позволяет выполнять анализ обогащения генных наборов, [45] помимо других функций.

g:Профилировщик

g:Profiler — это набор инструментов для поиска биологических категорий, обогащенных списками генов, преобразованиями между идентификаторами генов и сопоставлениями с их ортологами. [46] g:Profiler использует Ensembl в качестве основного источника данных и следует их квартальному циклу выпуска, одновременно обновляя другие источники данных. g:Profiler поддерживает около 500 видов и штаммов, включая позвоночных, растения, грибы, насекомых и паразитов.

Приложения

Исследования ассоциаций по всему геному

Однонуклеотидные полиморфизмы , или SNP, представляют собой мутации одного основания, которые могут быть связаны с заболеваниями. Изменение одного основания может повлиять на белок, который является результатом экспрессии этого гена; однако оно также может не иметь никакого эффекта вообще. Исследования ассоциаций по всему геному (GWAS) представляют собой сравнения между здоровыми и больными генотипами, чтобы попытаться найти SNP, которые чрезмерно представлены в геномах заболеваний и могут быть связаны с этим состоянием. До GSEA точность исследований ассоциаций по всему геному была серьезно ограничена большим количеством ложноположительных результатов. [47] Теория о том, что SNP, способствующие заболеванию, как правило, группируются в набор генов, которые все участвуют в одном и том же биологическом пути, является тем, на чем основан метод GSEA-SNP. Такое применение GSEA не только помогает в обнаружении связанных с заболеванием SNP, но и помогает пролить свет на соответствующие пути и механизмы заболеваний. [47]

Спонтанные преждевременные роды

Методы обогащения набора генов привели к открытию новых подозреваемых генов и биологических путей, связанных со спонтанными преждевременными родами . [48] Последовательности экзомов от женщин, которые перенесли SPTB, сравнивались с последовательностями от женщин из проекта 1000 Genome Project с использованием инструмента, который подсчитывал возможные варианты, вызывающие заболевание. Гены с более высокими баллами затем пропускались через различные программы, чтобы сгруппировать их в наборы генов на основе путей и онтологических групп. Это исследование показало, что варианты были значительно сгруппированы в наборы, связанные с несколькими путями, все из которых являются подозреваемыми в SPTB. [48]

Профилирование раковых клеток

Анализ обогащения набора генов может быть использован для понимания изменений, которые претерпевают клетки во время канцерогенеза и метастазирования . В исследовании микрочипы были выполнены на метастазах почечно-клеточной карциномы , первичных почечных опухолях и нормальной почечной ткани, а данные были проанализированы с помощью GSEA. [49] Этот анализ показал значительные изменения экспрессии в генах, участвующих в путях, которые ранее не были связаны с прогрессированием рака почки. Из этого исследования GSEA предоставила потенциальные новые цели для терапии почечно-клеточной карциномы.

Шизофрения

GSEA можно использовать для понимания молекулярных механизмов сложных расстройств. Шизофрения — это в значительной степени наследственное расстройство, но оно также очень сложное, и начало заболевания включает множество генов, взаимодействующих в рамках нескольких путей, а также взаимодействие этих генов с факторами окружающей среды. Например, эпигенетические изменения, такие как метилирование ДНК , зависят от окружающей среды, но также по своей сути зависят от самой ДНК. Метилирование ДНК является наиболее хорошо изученным эпигенетическим изменением и недавно было проанализировано с помощью GSEA в отношении промежуточных фенотипов, связанных с шизофренией. [50] Исследователи ранжировали гены по их корреляции между паттернами метилирования и каждым из фенотипов. Затем они использовали GSEA для поиска обогащения генов, которые, как прогнозируется, будут нацелены на микроРНК при прогрессировании заболевания. [50]

депрессия

GSEA может помочь предоставить молекулярные доказательства связи биологических путей с заболеваниями. Предыдущие исследования показали, что долгосрочные симптомы депрессии коррелируют с изменениями в иммунном ответе и воспалительных путях. [51] Генетические и молекулярные доказательства были направлены на поддержку этого. Исследователи взяли образцы крови у страдающих депрессией и использовали данные по геномной экспрессии вместе с GSEA, чтобы найти различия в экспрессии в наборах генов, связанных с воспалительными путями. Это исследование показало, что те люди, которые были оценены с наиболее тяжелыми симптомами депрессии, также имели значительные различия в экспрессии в этих наборах генов, и этот результат подтверждает гипотезу ассоциации. [51]

Смотрите также

Ссылки

  1. ^ abcdefgh Subramanian A, Tamayo P, Mootha VK, Mukherjee S, Ebert BL, Gillette MA и др. (октябрь 2005 г.). «Анализ обогащения набора генов: основанный на знаниях подход к интерпретации профилей экспрессии по всему геному». Труды Национальной академии наук Соединенных Штатов Америки . 102 (43): 15545–15550. doi : 10.1073/pnas.0506580102 . PMC  1239896. PMID  16199517 .
  2. ^ abcdefg Mootha VK, Lindgren CM, Eriksson KF, Subramanian A, Sihag S, Lehar J, et al. (Июль 2003 г.). "PGC-1alpha-responsive genes, участвующие в окислительном фосфорилировании, координированно подавляются при диабете человека". Nature Genetics . 34 (3): 267–273. doi :10.1038/ng1180. PMID  12808457. S2CID  13940856.
  3. ^ Maleki F, Ovens K, Hogan DJ, Kusalik AJ (2020). «Анализ набора генов: проблемы, возможности и будущие исследования». Frontiers in Genetics . 11 : 654. doi : 10.3389/fgene.2020.00654 . PMC 7339292. PMID  32695141 . 
  4. ^ Liberzon A, Birger C, Thorvaldsdóttir H, Ghandi M, Mesirov JP, Tamayo P (декабрь 2015 г.). «The Molecular Signatures Database (MSigDB) hallmark gene set collection». Cell Systems . 1 (6): 417–425. doi :10.1016/j.cels.2015.12.004. PMC 4707969 . PMID  26771021. 
  5. ^ "База данных молекулярных сигнатур (MSigDB) 3.0 (доступна загрузка PDF)". ResearchGate .
  6. ^ abc Tamayo P, Steinhardt G, Liberzon A, Mesirov JP (февраль 2016 г.). «Ограничения простого анализа обогащения набора генов, предполагающего независимость генов». Статистические методы в медицинских исследованиях . 25 (1): 472–487. arXiv : 1110.4128 . doi : 10.1177/0962280212460441. PMC 3758419. PMID  23070592 . 
  7. ^ abc Frost HR, Li Z, Moore JH (март 2015 г.). "Обогащение спектрального набора генов (SGSE)". BMC Bioinformatics . 16 (1): 70. doi : 10.1186/s12859-015-0490-7 . PMC 4365810. PMID  25879888 . 
  8. ^ Веди М, Налаболу ХС, Лин КВ, Хоффман МДж, Смит ДжР, Броди К и др. (апрель 2022 г.). «MOET: веб-инструмент для обогащения набора генов в базе данных генома крысы для многоонтологического и многовидового анализа». Генетика . 220 (4). doi :10.1093/genetics/iyac005. PMC 8982048 . PMID  35380657. 
  9. ^ Yousif A, Drou N, Rowe J, Khalfan M, Gunsalus KC (июнь 2020 г.). "NASQAR: веб-платформа для высокопроизводительного анализа и визуализации данных секвенирования". BMC Bioinformatics . 21 (1): 267. bioRxiv 10.1101/709980 . doi : 10.1186/s12859-020-03577-4 . PMC 7322916 . PMID  32600310.  
  10. ^ «NASQAR: Ресурс анализа последовательности нуклеиновых кислот».
  11. ^ Yu G, Wang LG, Han Y, He QY (май 2012 г.). «clusterProfiler: пакет R для сравнения биологических тем среди кластеров генов». Omics . 16 (5): 284–287. doi :10.1089/omi.2011.0118. PMC 3339379 . PMID  22455463. 
  12. ^ «Пакеты Org.Db» – через Bioconductor.
  13. ^ Tian F, Yang DC, Meng YQ, Jin J, Gao G (январь 2020 г.). «PlantRegMap: составление функциональных регуляторных карт в растениях». Nucleic Acids Research . 48 (D1): D1104–D1113. doi :10.1093/nar/gkz1020. PMC 7145545. PMID  31701126 . 
  14. ^ Liberzon A (2014). "Описание веб-сайта Molecular Signatures Database (MSigDB)". Транскрипционные сети стволовых клеток . Методы в молекулярной биологии. Т. 1150. Клифтон, Нью-Джерси: Springer. С. 153–160. doi :10.1007/978-1-4939-0512-6_9. ISBN 978-1-4939-0511-9. PMID  24743996.
  15. ^ "GSEA | Учебное пособие для настольных компьютеров". software.broadinstitute.org .
  16. ^ "WebGestalt (набор инструментов для анализа набора генов на основе веб-технологий)". www.webgestalt.org .
  17. ^ Chen EY, Tan CM, Kou Y, Duan Q, Wang Z, Meirelles GV и др. (апрель 2013 г.). "Enrichr: интерактивный и совместный инструмент анализа обогащения списка генов HTML5". BMC Bioinformatics . 14 : 128. doi : 10.1186/1471-2105-14-128 . PMC 3637064. PMID  23586463 . 
  18. ^ Кулешов МВ, Джонс МР, Руйярд А.Д., Фернандес НФ, Дуань Кью, Ван З. и др. (Июль 2016 г.). «Enrichr: обновление веб-сервера комплексного анализа обогащения набора генов 2016 г.». Nucleic Acids Research . 44 (W1): W90–W97. doi :10.1093/nar/gkw377. PMC 4987924 . PMID  27141961. 
  19. ^ Xie Z, Bailey A, Kuleshov MV, Clarke DJ, Evangelista JE, Jenkins SL и др. (март 2021 г.). «Gene Set Knowledge Discovery with Enrichr». Current Protocols . 1 (3): e90. doi :10.1002/cpz1.90. PMC 8152575. PMID 33780170  . 
  20. ^ "Лаборатория Мааян - Биология вычислительных систем - Медицинская школа Икана в Маунт-Синай". labs.icahn.mssm.edu . 19 сентября 2023 г.
  21. ^ Subhash S, Kanduri C (сентябрь 2016 г.). "GeneSCF: инструмент функционального обогащения в реальном времени с поддержкой нескольких организмов". BMC Bioinformatics . 17 (1): 365. doi : 10.1186/s12859-016-1250-z . PMC 5020511. PMID  27618934 . 
  22. ^ Wadi L, Meyer M, Weiser J, Stein LD, Reimand J (август 2016 г.). «Влияние устаревших аннотаций генов на анализ обогащения путей». Nature Methods . 13 (9): 705–706. doi :10.1038/nmeth.3963. PMC 7802636. PMID 27575621.  S2CID 19548133  . 
  23. ^ "GeneSCF::Кластеризация набора генов на основе функциональной аннотации". genescf.kandurilab.org .
  24. ^ «Кластеризация набора генов на основе функциональной аннотации (GeneSCF)». www.biostars.org .
  25. ^ ab Huang DA, Sherman BT, Lempicki RA (2009). «Систематический и интегративный анализ больших списков генов с использованием ресурсов биоинформатики DAVID». Nature Protocols . 4 (1): 44–57. doi :10.1038/nprot.2008.211. PMID  19131956. S2CID  10418677.
  26. ^ ab Информация о выпуске и версии DAVID, Ресурсы биоинформатики DAVID 6.8
  27. ^ Huang DA, Sherman BT, Lempicki RA (1 декабря 2008 г.). «Систематический и интегративный анализ больших списков генов с использованием ресурсов биоинформатики DAVID». Nature Protocols . 4 (1): 44–57. doi :10.1038/nprot.2008.211. PMID  19131956. S2CID  10418677.
  28. ^ Zhou Y, Zhou B, Pache L, Chang M, Khodabakhshi AH, Tanaseichuk O и др. (апрель 2019 г.). «Metascape предоставляет ориентированный на биологов ресурс для анализа наборов данных системного уровня». Nature Communications . 10 (1): 1523. Bibcode :2019NatCo..10.1523Z. doi :10.1038/s41467-019-09234-6. PMC 6447622 . PMID  30944313. 
  29. ^ "Metascape". metascape.org . Получено 20 декабря 2019 .
  30. ^ Консорциум генной онтологии. "AmiGO 2: Добро пожаловать". amigo.geneontology.org .
  31. ^ Blake JA, Christie KR, Dolan ME, Drabkin HJ, Hill DP, Ni L и др. (Консорциум онтологии генов) (январь 2015 г.). «Консорциум онтологии генов: движение вперед». Nucleic Acids Research . 43 (выпуск базы данных): D1049–D1056. doi :10.1093/nar/gku1179. PMC 4383973. PMID  25428369 . 
  32. ^ ab McLean CY, Bristor D, Hiller M, Clarke SL, Schaar BT, Lowe CB и др. (май 2010 г.). «GREAT улучшает функциональную интерпретацию цис-регуляторных регионов». Nature Biotechnology . 28 (5): 495–501. doi :10.1038/nbt.1630. PMC 4840234 . PMID  20436461. 
  33. ^ "GREAT Input: Genomic Regions Enrichment of Annotations Tool". Bejerano Lab . Стэнфордский университет. Архивировано из оригинала 3 декабря 2018 г.
  34. ^ "FunRich :: Скачать". funrich.org .
  35. ^ Pathan M, Keerthikumar S, Ang CS, Gangoda L, Quek CY, Williamson NA и др. (август 2015 г.). «FunRich: автономный инструмент для анализа сетей функционального обогащения и взаимодействия с открытым доступом». Proteomics . 15 (15): 2597–2601. doi :10.1002/pmic.201400515. PMID  25921073. S2CID  28583044.
  36. ^ Berriz GF, King OD, Bryant B, Sander C, Roth FP (декабрь 2003 г.). «Характеристика наборов генов с помощью FuncAssociate». Bioinformatics (Оксфорд, Англия) . 19 (18): 2502–4. doi :10.1093/bioinformatics/btg363. PMID  14668247.
  37. ^ Berriz GF, Beaver JE, Cenik C, Tasan M, Roth FP (ноябрь 2009 г.). «Программное обеспечение следующего поколения для анализа функциональных тенденций». Биоинформатика . 25 (22): 3043–3044. doi :10.1093/bioinformatics/btp498. PMC 2800365. PMID  19717575 . 
  38. ^ «Статистика виджетов обогащения списка — документация InterMine».
  39. ^ Chen J, Bardes EE, Aronow BJ, Jegga AG (июль 2009 г.). «ToppGene Suite для анализа обогащения списка генов и приоритизации генов-кандидатов». Nucleic Acids Research . 37 (выпуск веб-сервера): W305–W311. doi :10.1093/nar/gkp427. PMC 2703978. PMID  19465376 . 
  40. ^ Yaari G, Bolen CR, Thakar J, Kleinstein SH (октябрь 2013 г.). «Количественный анализ набора генов для экспрессии: метод количественной оценки дифференциальной экспрессии набора генов, включая корреляции ген-ген». Nucleic Acids Research . 41 (18): e170. doi :10.1093/nar/gkt660. PMC 3794608. PMID  23921631 . 
  41. ^ Turner JA, Bolen CR, Blankenship DM (август 2015 г.). «Количественный анализ набора генов, обобщенный для повторных измерений, корректировки с учетом вмешивающихся факторов и непрерывных ковариатов». BMC Bioinformatics . 16 : 272. doi : 10.1186/s12859-015-0707-9 . PMC 4551517 . PMID  26316107. 
  42. ^ Avey S, Cheung F, Fermin D, Frelinger J, Gaujoux R, Gottardo R и др. (Группа проекта HIPC-CHI Signatures, Консорциум HIPC-I) (август 2017 г.). «Мультикомортальный анализ выявляет базовые транскрипционные предикторы ответов на вакцинацию против гриппа». Science Immunology . 2 (14): eaal4656. doi :10.1126/sciimmunol.aal4656. PMC 5800877 . PMID  28842433. 
  43. ^ Болен С., Яари Г., Такар Дж., Менг Х., Тернер Дж., Бланкеншип Д. и др. (2017). «qusage: количественный анализ наборов для экспрессии генов». doi : 10.18129/B9.bioc.qusage – через Bioconductor.
  44. ^ Conesa A, Götz S, García-Gómez JM, Terol J, Talón M, Robles M (сентябрь 2005 г.). «Blast2GO: универсальный инструмент для аннотации, визуализации и анализа в исследованиях функциональной геномики». Биоинформатика . 21 (18): 3674–3676. doi : 10.1093/bioinformatics/bti610 . PMID  16081474.
  45. ^ "Рисунок 3: Тепловые карты анализа обогащения набора генов (GSEA) DEG на основе данных РНКсек в ответ на абиотические стрессы". www.nature.com . Получено 05.09.2018 .
  46. ^ Berriz GF, King OD, Bryant B, Sander C, Roth FP (декабрь 2003 г.). «Характеристика наборов генов с помощью FuncAssociate». Биоинформатика . 19 (18). Оксфорд, Англия: 2502–4. doi :10.1093/bioinformatics/btg363. PMID  14668247.
  47. ^ ab Holden M, Deng S, Wojnowski L, Kulle B (декабрь 2008 г.). «GSEA-SNP: применение анализа обогащения набора генов к данным SNP из исследований ассоциаций на уровне генома». Биоинформатика . 24 (23): 2784–2785. doi : 10.1093/bioinformatics/btn516 . PMID  18854360.
  48. ^ ab Manuck TA, Watkins S, Esplin MS, Parry S, Zhang H, Huang H, et al. (2016). "242: Исследование обогащения набора генов вариации материнского экзома при спонтанных преждевременных родах (SPTB)". American Journal of Obstetrics and Gynecology . 214 (1): S142–S143. doi : 10.1016/j.ajog.2015.10.280 .
  49. ^ Maruschke M, Hakenberg OW, Koczan D, Zimmermann W, Stief CG, Buchner A (январь 2014 г.). «Профилирование экспрессии метастатической почечноклеточной карциномы с использованием анализа обогащения набора генов». International Journal of Urology . 21 (1): 46–51. doi : 10.1111/iju.12183 . PMID  23634695. S2CID  33377555.
  50. ^ ab Hass J, Walton E, Wright C, Beyer A, Scholz M, Turner J, et al. (Июнь 2015 г.). «Связи между метилированием ДНК и промежуточными фенотипами, связанными с шизофренией — анализ обогащения набора генов». Progress in Neuro-Psychopharmacology & Biological Psychiatry . 59 : 31–39. doi :10.1016/j.pnpbp.2015.01.006. PMC 4346504 . PMID  25598502. 
  51. ^ ab Elovainio M, Taipale T, Seppälä I, Mononen N, Raitoharju E, Jokela M и др. (декабрь 2015 г.). «Активированные иммунно-воспалительные пути связаны с длительными депрессивными симптомами: данные анализа обогащения набора генов в исследовании молодых финнов». Журнал психиатрических исследований . 71 : 120–125. doi : 10.1016/j.jpsychires.2015.09.017. PMID  26473696.

Дальнейшее чтение

Внешние ссылки