stringtranslate.com

SNP-аннотация

Аннотация полиморфизма одного нуклеотида ( аннотация SNP ) — это процесс прогнозирования эффекта или функции отдельного SNP с использованием инструментов аннотации SNP. В аннотации SNP биологическая информация извлекается, собирается и отображается в четкой форме, доступной для запроса. Функциональная аннотация SNP обычно выполняется на основе доступной информации о последовательностях нуклеиновых кислот и белков . [1]

Введение

Ориентированный граф связей между веб-серверами прогнозирования SNP и их источниками биоинформатики. [2]

Однонуклеотидные полиморфизмы (SNP) играют важную роль в полногеномных исследованиях ассоциаций, поскольку они действуют как первичные биомаркеры . SNP в настоящее время являются маркером выбора из-за их большого количества практически во всех популяциях людей. Местоположение этих биомаркеров может иметь чрезвычайно важное значение с точки зрения прогнозирования функциональной значимости, генетического картирования и популяционной генетики . [3] Каждый SNP представляет собой замену нуклеотидов между двумя людьми в определенном месте. SNP являются наиболее распространенным генетическим вариантом, обнаруживаемым у всех особей: у некоторых видов один SNP каждые 100–300 пар оснований . [4] Поскольку в геноме имеется огромное количество SNP , существует явная необходимость расставить приоритеты SNP в соответствии с их потенциальным эффектом, чтобы ускорить генотипирование и анализ. [5]

Аннотирование большого количества SNP — сложный и сложный процесс, требующий вычислительных методов для обработки такого большого набора данных. Многие доступные инструменты были разработаны для аннотации SNP в различных организмах: некоторые из них оптимизированы для использования с организмами, у которых плотно отобраны образцы SNP (например, люди ), но в настоящее время доступно мало инструментов, которые не являются видоспецифичными или поддерживают немодельные методы. данные организма. Большинство инструментов аннотации SNP обеспечивают прогнозируемые с помощью вычислений предполагаемые вредные эффекты SNP. Эти инструменты проверяют, находится ли SNP в функциональных геномных областях, таких как экзоны, сайты сплайсинга или сайты регуляции транскрипции, и прогнозируют потенциальные соответствующие функциональные эффекты, которые SNP может оказывать, используя различные подходы машинного обучения. Но инструменты и системы, которые отдают приоритет функционально значимым SNP, страдают от нескольких ограничений: во-первых, они исследуют предполагаемые вредные эффекты SNP в отношении одной биологической функции, которые предоставляют лишь частичную информацию о функциональной значимости SNP. Во-вторых, современные системы классифицируют SNP на вредные или нейтральные группы. [6]

Многие алгоритмы аннотации сосредоточены на однонуклеотидных вариантах (SNV), которые считаются более редкими, чем SNP, что определяется частотой их минорных аллелей (MAF). [7] [8] Как следствие, данные обучения для соответствующих методов прогнозирования могут различаться, и, следовательно, следует быть осторожным при выборе подходящего инструмента для конкретной цели. Для целей этой статьи «SNP» будет использоваться для обозначения как SNP, так и SNV, но читатели должны помнить о различиях.

SNP-аннотация

Различные типы аннотаций в геномике

Для аннотации SNP используются многие виды генетической и геномной информации. В зависимости от различных функций, используемых каждым инструментом аннотации, методы аннотации SNP можно условно разделить на следующие категории:

Аннотация на основе генов

Геномная информация от окружающих геномных элементов является одной из наиболее полезных для интерпретации биологической функции наблюдаемого варианта. Информация об известном гене используется в качестве эталона для указания того, находится ли наблюдаемый вариант внутри гена или рядом с ним, а также имеет ли он потенциал нарушить последовательность белка и его функцию. Аннотация на основе генов основана на том факте, что несинонимичные мутации могут изменить последовательность белка и что мутация сайта сплайсинга может нарушить схему сплайсинга транскрипта. [9]

Аннотации, основанные на знаниях

Аннотация базы знаний выполняется на основе информации об атрибутах гена, функции белка и его метаболизме . В аннотациях этого типа больше внимания уделяется генетическим вариациям , которые нарушают домен функции белка, белок-белковое взаимодействие и биологический путь . Некодирующая область генома содержит множество важных регуляторных элементов, включая промотор , энхансер и инсулятор; любые изменения в этой регуляторной области могут изменить функциональность этого белка. [10] Мутация в ДНК может изменить последовательность РНК , а затем повлиять на вторичную структуру РНК , распознавание РНК-связывающего белка и активность связывания миРНК. [11] [12]

Функциональная аннотация

Этот метод главным образом идентифицирует вариантную функцию на основе информации о том, находятся ли вариантные локусы в известной функциональной области, несущей геномные или эпигеномные сигналы. Функции некодирующих вариантов обширны с точки зрения пораженной области генома и участвуют практически во всех процессах регуляции генов от транскрипционного до посттрансляционного уровня [13].

Регуляция транскрипции генов

Процесс регуляции транскрипции генов зависит от многих пространственных и временных факторов в ядре, таких как глобальные или локальные состояния хроматина, расположение нуклеосом, связывание TF, активность энхансера/промотора. Вариант, который изменяет функцию любого из этих биологических процессов, может изменить регуляцию генов и вызвать фенотипические аномалии. [14] Генетические варианты, расположенные в дистальной регуляторной области, могут влиять на мотив связывания ТФ, регуляторов хроматина и других дистальных факторов транскрипции, которые нарушают взаимодействие между энхансером/сайленсером и его геном-мишенью. [15]

Альтернативный сплайсинг

Альтернативный сплайсинг — один из важнейших компонентов, отражающих функциональную сложность генома. Модифицированный сплайсинг оказывает значительное влияние на фенотип, который имеет отношение к заболеванию или метаболизму лекарств. Изменение процесса сплайсинга может быть вызвано модификацией любого компонента механизма сплайсинга, такого как сайты сплайсинга, усилители сплайсинга или глушители. [16] Модификация альтернативного сайта сплайсинга может привести к созданию другой формы белка, которая будет проявлять другую функцию. По оценкам, люди используют около 100 000 различных белков или более, поэтому некоторые гены должны быть способны кодировать гораздо больше, чем один белок. Альтернативный сплайсинг происходит чаще, чем считалось ранее, и его трудно контролировать; гены могут производить десятки тысяч различных транскриптов, что требует новой модели гена для каждого альтернативного сплайсинга.

Процессинг РНК и посттранскрипционная регуляция

Мутации в нетранслируемой области (UTR) влияют на многие посттранскрипционные регуляции . Отличительные структурные особенности необходимы многим молекулам РНК и цис-действующим регуляторным элементам для выполнения эффективных функций во время регуляции генов. SNV могут изменять вторичную структуру молекул РНК, а затем нарушать правильное сворачивание РНК, такое как сворачивание тРНК/мРНК/днРНК и области узнавания связывания микроРНК. [17]

Перевод и посттрансляционные модификации

Однонуклеотидный вариант может также влиять на цис-действующие регуляторные элементы мРНК, ингибируя/способствуя инициации трансляции. Изменение области синонимичных кодонов из-за мутации может повлиять на эффективность трансляции из-за систематических ошибок в использовании кодонов. Элонгация трансляции также может быть замедлена мутациями вдоль линии движения рибосом. На посттрансляционном уровне генетические варианты могут способствовать протеостазу и модификациям аминокислот. Однако механизмы воздействия вариантов в этой области сложны, и существует лишь несколько инструментов для прогнозирования влияния вариантов на модификации, связанные с трансляцией. [18]

Белковая функция

Несинонимичным является вариант экзонов, который изменяет аминокислотную последовательность, кодируемую геном, включая изменения одного основания и индели без сдвига рамки считывания. Была тщательно исследована функция несинонимичных вариантов белка, и было разработано множество алгоритмов для прогнозирования вредоносности и патогенеза однонуклеотидных вариантов (SNV). Классические инструменты биоинформатики, такие как SIFT, Polyphen и MutationTaster , успешно предсказывают функциональные последствия несинонимической замены. [19] [20] [21] [22] Веб-сервер PopViz обеспечивает геноцентричный подход для визуализации показателей прогнозирования мутационного повреждения (CADD, SIFT, PolyPhen-2) или популяционной генетики (частота второстепенных аллелей) в зависимости от положений аминокислот. всех кодирующих вариантов определенного человеческого гена. [23] PopViz также перекрестно связан с базой данных UniProt, где можно найти информацию о белковых доменах, а затем идентифицировать предсказанные вредные варианты, попадающие в эти белковые домены на графике PopViz. [23]

Эволюционная охрана и природный отбор

Подходы сравнительной геномики использовались для прогнозирования функциональных вариантов при предположении, что функциональный генетический локус должен быть консервативен у разных видов на обширном филогенетическом расстоянии. С другой стороны, некоторые адаптивные черты и популяционные различия обусловлены положительным отбором выгодных вариантов, и эти генетические мутации функционально релевантны фенотипам, специфичным для популяции. Функциональное прогнозирование влияния вариантов на различные биологические процессы имеет решающее значение для определения молекулярного механизма заболеваний/признаков и направления экспериментальной проверки. [24]

Список доступных инструментов аннотаций SNP

Для аннотирования огромных объемов доступных данных NGS в настоящее время доступно большое количество инструментов аннотирования SNP. Некоторые из них относятся к конкретным SNP, а другие носят более общий характер. Некоторые из доступных инструментов аннотации SNP: SNPeff, Ensembl Variant Effect Predictor (VEP), ANNOVAR, FATHMM, PhD-SNP, PolyPhen-2, SuSPect, F-SNP, AnnTools, SeattleSeq, SNPit, SCAN, Snap, SNPs&GO, LS-SNP, Snat, TREAT, TRAMS, Maviant, MutationTaster , SNPdat, Snpranker, NGS – SNP, SVA, VARIANT, SIFT, LIST-S2, PhD-SNP и FAST-SNP. Функции и подходы, используемые в инструментах аннотации SNP, перечислены ниже.

Алгоритмы, используемые в инструментах аннотаций

Инструменты аннотаций вариантов используют алгоритмы машинного обучения для прогнозирования вариантов аннотаций. Различные инструменты аннотаций используют разные алгоритмы. Общие алгоритмы включают в себя:

Сравнение вариантов инструментов аннотации

Для вариантной аннотации доступно большое количество инструментов вариантной аннотации. Аннотация, выполненная различными инструментами, не всегда согласуется друг с другом, поскольку определенные правила обработки данных различаются в разных приложениях. Честно говоря, невозможно провести идеальное сравнение имеющихся инструментов. Не все инструменты имеют одинаковые входные и выходные данные и одинаковые функции. Ниже приведена таблица основных инструментов аннотирования и их функциональной области.

[59]

Приложение

Различные аннотации отражают различные аспекты вариантной функции. [60] Одновременное использование нескольких разнообразных функциональных аннотаций может улучшить эффективность анализа ассоциаций редких вариантов в исследованиях секвенирования всего экзома и всего генома . [61] Были разработаны некоторые инструменты, позволяющие проводить функционально обоснованный анализ ассоциаций фенотип-генотип для распространенных и редких вариантов путем включения функциональных аннотаций в когорты в масштабе биобанка. [62] [63] [64] [65]

Выводы

Следующее поколение веб-серверов аннотаций SNP сможет воспользоваться растущим объемом данных в основных ресурсах биоинформатики и использовать интеллектуальные агенты для получения данных из различных источников по мере необходимости. С точки зрения пользователя, более эффективно отправить набор SNP и получить результаты за один шаг, что делает метасерверы наиболее привлекательным выбором. Однако, если инструменты аннотации SNP предоставляют разнородные данные, охватывающие последовательность, структуру, регуляцию, пути и т. д., они также должны обеспечивать основу для интеграции данных в алгоритмы принятия решений и количественные меры достоверности, чтобы пользователи могли оценить, какие данные релевантны, а какие нет. .

Рекомендации

  1. ^ Обур С., Рузе П. (2001). «Аннотация генома». Физиол растений. Биохим . 29 (3–4): 181–193. дои : 10.1016/S0981-9428(01)01242-6.
  2. ^ Карчин Р. (январь 2009 г.). «Инструменты нового поколения для аннотации человеческих SNP». Брифинги по биоинформатике . 10 (1): 35–52. дои : 10.1093/нагрудник/bbn047. ПМЦ 2638621 . ПМИД  19181721. 
  3. ^ Шен Т.Х., Карлсон К.С., Тарчи-Хорнох П. (август 2009 г.). «SNPit: система федеративной интеграции данных для функциональной аннотации SNP». Компьютерные методы и программы в биомедицине . 95 (2): 181–189. дои : 10.1016/j.cmpb.2009.02.010. ПМК 2680224 . ПМИД  19327864. 
  4. ^ NC Oraguzie, EHA Rikkerink, SE Gardiner, HN de Silva (ред.), «Картирование ассоциаций растений», Springer, 2007
  5. ^ Каприотти Э, Нерт Н.Л., Канн М.Г., Бромберг Ю. (июль 2012 г.). «Биоинформатика для интерпретации личного генома». Брифинги по биоинформатике . 13 (4): 495–512. дои : 10.1093/нагрудник/bbr070. ПМЦ 3404395 . ПМИД  22247263. 
  6. ^ П.Х. Ли, Х. Шаткей, «Рейтинг однонуклеотидных полиморфизмов по потенциальным вредным эффектам», Лаборатория вычислительной биологии и машинного обучения, Школа вычислительной техники, Королевский университет, Кингстон, Онтарио, Канада.
  7. ^ «Однонуклеотидный полиморфизм» , Википедия , 12 августа 2019 г. , получено 3 сентября 2019 г.
  8. ^ «Частота минорных аллелей» , Википедия , 12 августа 2019 г. , получено 3 сентября 2019 г.
  9. ^ MJ Ли, Дж. Ван, «Текущая тенденция аннотирования вариаций отдельных нуклеотидов у людей - тематическое исследование SNVrap», Elsevier, 2014, стр. 1–9.
  10. ^ Ван З., Герштейн М., Снайдер М. (январь 2009 г.). «RNA-Seq: революционный инструмент для транскриптомики». Обзоры природы. Генетика . 10 (1): 57–63. дои : 10.1038/nrg2484. ПМЦ 2949280 . ПМИД  19015660. 
  11. ^ Халворсен М., Мартин Дж.С., Бродвей С., Ледерах А. (август 2010 г.). «Мутации, связанные с заболеванием, которые изменяют структурный ансамбль РНК». ПЛОС Генетика . 6 (8): e1001074. дои : 10.1371/journal.pgen.1001074 . ПМЦ 2924325 . ПМИД  20808897. 
  12. ^ Ван Ю, Цюй К., Чжан К.К., Флинн Р.А., Мэнор О, Оуян Z и др. (Январь 2014). «Ландшафт и вариации вторичной структуры РНК в транскриптоме человека». Природа . 505 (7485): 706–709. Бибкод : 2014Natur.505..706W. дои : 10.1038/nature12946. ПМЦ 3973747 . ПМИД  24476892. 
  13. ^ Сауна ZE, Кимчи-Сарфати C (август 2011 г.). «Понимание вклада синонимических мутаций в болезни человека». Обзоры природы. Генетика . 12 (10): 683–691. дои : 10.1038/nrg3051. PMID  21878961. S2CID  8358824.
  14. ^ Ли MJ, Ян Б, Шам ПК, Ван Дж (май 2015 г.). «Изучение функции генетических вариантов в некодирующих геномных регионах: подходы к идентификации регуляторных вариантов человека, влияющих на экспрессию генов». Брифинги по биоинформатике . 16 (3): 393–412. дои : 10.1093/bib/bbu018 . ПМИД  24916300.
  15. ^ Френч Дж.Д., Гуссаини М., Эдвардс С.Л., Мейер К.Б., Михаилиду К., Ахмед С. и др. (Апрель 2013). «Функциональные варианты локуса риска 11q13 рака молочной железы регулируют экспрессию циклина D1 посредством энхансеров дальнего действия». Американский журнал генетики человека . 92 (4): 489–503. дои : 10.1016/j.ajhg.2013.01.002. ПМЦ 3617380 . ПМИД  23540573. 
  16. ^ Фабер К., Глаттинг К.Х., Мюллер П.Дж., Риш А., Хотц-Вагенблатт А. (2011). «Пологеномное предсказание модифицирующих сплайсинг SNP в генах человека с использованием нового конвейера анализа под названием AASsites». БМК Биоинформатика . 12 (Приложение 4): S2. дои : 10.1186/1471-2105-12-s4-s2 . ПМК 3194194 . ПМИД  21992029. 
  17. ^ Кумар В., Вестра Х.Дж., Карьялайнен Дж., Жернакова Д.В., Эско Т., Хрдличкова Б. и др. (2013). «Генетические вариации, связанные с заболеваниями человека, влияют на экспрессию большой межгенной некодирующей РНК». ПЛОС Генетика . 9 (1): e1003201. дои : 10.1371/journal.pgen.1003201 . ПМЦ 3547830 . ПМИД  23341781. 
  18. ^ MJ Ли, Дж. Ван, «Текущая тенденция аннотирования вариаций отдельных нуклеотидов у людей - тематическое исследование SNVrap», Elsevier, 2014, стр. 1–9.
  19. ^ Дж. Ву, Р. Цзян, «Прогнозирование вредного несинонимического однонуклеотидного полиморфизма для заболеваний человека», The Scientific World Journal, 2013, 10 страниц.
  20. ^ Сим Н.Л., Кумар П., Ху Дж., Хеникофф С., Шнайдер Г., Нг ПК (июль 2012 г.). «Веб-сервер SIFT: прогнозирование влияния аминокислотных замен на белки». Исследования нуклеиновых кислот . 40 (проблема с веб-сервером): W452–W457. дои : 10.1093/nar/gks539. ПМЦ 3394338 . ПМИД  22689647. 
  21. ^ Аджубей И.А., Шмидт С., Пешкин Л., Раменский В.Е., Герасимова А., Борк П. и др. (апрель 2010 г.). «Метод и сервер для прогнозирования разрушительных миссенс-мутаций». Природные методы . 7 (4): 248–249. doi : 10.1038/nmeth0410-248. ПМЦ 2855889 . ПМИД  20354512. 
  22. ^ Шварц Дж. М., Рёдельспергер С., Шуэльке М., Зеелов Д. (август 2010 г.). «MutationTaster оценивает болезнетворный потенциал изменений последовательности». Природные методы . 7 (8): 575–576. doi : 10.1038/nmeth0810-575. PMID  20676075. S2CID  26892938.
  23. ^ abc Чжан П., Биджио Б., Рапапорт Ф., Чжан С.Ю., Казанова Дж.Л., Абель Л. и др. (декабрь 2018 г.). «PopViz: веб-сервер для визуализации частот второстепенных аллелей и показателей прогнозирования повреждений генетических вариаций человека». Биоинформатика . 34 (24): 4307–4309. doi : 10.1093/биоинформатика/bty536. ПМК 6289133 . ПМИД  30535305. 
  24. ^ MJ Ли, Дж. Ван, «Текущая тенденция аннотирования вариаций отдельных нуклеотидов у людей - тематическое исследование SNVrap», Elsevier, 2014, стр. 1–9.
  25. ^ Ofoegbu TC, Дэвид А., Келли Л.А., Мезулис С., Ислам С.А., Мерсманн С.Ф. и др. (июнь 2019 г.). «PhyreRisk: динамическое веб-приложение, объединяющее геномику, протеомику и трехмерные структурные данные для интерпретации генетических вариантов человека». Журнал молекулярной биологии . 431 (13): 2460–2466. дои : 10.1016/j.jmb.2019.04.043. ПМК 6597944 . ПМИД  31075275. 
  26. ^ Иттисопонписан С., Ислам С.А., Ханна Т., Алхузими Э., Дэвид А., Штернберг MJ (май 2019 г.). «Могут ли предсказанные трехмерные структуры белка дать надежную информацию о том, связаны ли миссенс-варианты с заболеванием?». Журнал молекулярной биологии . 431 (11): 2197–2212. дои : 10.1016/j.jmb.2019.04.009. ПМК 6544567 . ПМИД  30995449. 
  27. ^ ab Cingolani P, Platts A, Wang LL, Coon M, Nguyen T, Wang L и др. (2012). «Программа для аннотирования и прогнозирования эффектов однонуклеотидных полиморфизмов, SnpEff: SNP в геноме штамма Drosophila melanogaster w1118; iso-2; iso-3». Летать . 6 (2): 80–92. дои : 10.4161/fly.19695. ПМЦ 3679285 . ПМИД  22728672. 
  28. ^ Макларен В., Гил Л., Хант С.Э., Риат Х.С., Ричи Г.Р., Торманн А. и др. (июнь 2016 г.). «Прогноз эффекта варианта ансамбля». Геномная биология . 17 (1): 122. дои : 10.1186/s13059-016-0974-4 . ПМЦ 4893825 . ПМИД  27268795. 
  29. ^ Ван К., Ли М., Хаконарсон Х. (сентябрь 2010 г.). «ANNOVAR: функциональная аннотация генетических вариантов на основе данных высокопроизводительного секвенирования». Исследования нуклеиновых кислот . 38 (16): е164. дои : 10.1093/nar/gkq603. ПМК 2938201 . ПМИД  20601685. 
  30. ^ Джагер М., Ван К., Бауэр С., Смедли Д., Кравиц П., Робинсон П.Н. (май 2014 г.). «Jannovar: Java-библиотека для аннотаций exome». Человеческая мутация . 35 (5): 548–555. дои : 10.1002/humu.22531 . PMID  24677618. S2CID  10822001.
  31. ^ Каприотти Э, Калабрезе Р, Касадио Р (ноябрь 2006 г.). «Прогнозирование возникновения генетических заболеваний человека, связанных с одноточечными мутациями белков, с помощью машин опорных векторов и эволюционной информации». Биоинформатика . 22 (22): 2729–2734. doi : 10.1093/биоинформатика/btl423 . ПМИД  16895930.
  32. ^ Аджубей I, Иордан Д.М., Сюняев С.Р. (январь 2013 г.). «Прогнозирование функционального эффекта миссенс-мутаций человека с использованием PolyPhen-2». Современные протоколы генетики человека . Глава 7: Раздел 7.20. дои : 10.1002/0471142905.hg0720s76. ПМЦ 4480630 . ПМИД  23315928. 
  33. ^ Шварц Дж. М., Рёдельспергер С., Шуэльке М., Зеелов Д. (август 2010 г.). «MutationTaster оценивает болезнетворный потенциал изменений последовательности». Природные методы . 7 (8): 575–576. doi : 10.1038/nmeth0810-575. PMID  20676075. S2CID  26892938.
  34. ^ Йейтс CM, Филипп I, Келли Л.А., Штернберг MJ (июль 2014 г.). «SuSPect: улучшенное предсказание фенотипа варианта одной аминокислоты (SAV) с использованием сетевых функций». Журнал молекулярной биологии . 426 (14): 2692–2701. дои : 10.1016/j.jmb.2014.04.026. ПМЦ 4087249 . ПМИД  24810707. 
  35. ^ Ли П.Х., Шаткай Х. (январь 2008 г.). «F-SNP: предсказанные с помощью вычислений функциональные SNP для исследований ассоциаций заболеваний». Исследования нуклеиновых кислот . 36 (Проблема с базой данных): D820–D824. дои : 10.1093/nar/gkm904. ПМК 2238878 . ПМИД  17986460. 
  36. ^ Макаров В., О'Грейди Т., Кай Г., Лим Дж., Буксбаум Дж.Д., Юн С. (март 2012 г.). «AnnTools: комплексный и универсальный набор инструментов для аннотации геномных вариантов». Биоинформатика . 28 (5): 724–725. doi : 10.1093/биоинформатика/bts032. ПМЦ 3289923 . ПМИД  22257670. 
  37. ^ Шен Т.Х., Карлсон К.С., Тарчи-Хорнох П. (август 2009 г.). «SNPit: система федеративной интеграции данных для функциональной аннотации SNP». Компьютерные методы и программы в биомедицине . 95 (2): 181–189. дои : 10.1016/j.cmpb.2009.02.010. ПМК 2680224 . ПМИД  19327864. 
  38. ^ Гамазон Э.Р., Чжан В., Конкашбаев А., Дуань С., Кистнер Э.О., Николае Д.Л. и др. (январь 2010 г.). «СКАНИРОВАНИЕ: SNP и аннотация номера копии». Биоинформатика . 26 (2): 259–262. doi : 10.1093/биоинформатика/btp644. ПМК 2852202 . ПМИД  19933162. 
  39. ^ Бромберг Ю., Рост Б. (2007). «SNAP: прогнозирование влияния несинонимичных полиморфизмов на функцию». Исследования нуклеиновых кислот . 35 (11): 3823–3835. дои : 10.1093/nar/gkm238. ПМК 1920242 . ПМИД  17526529. 
  40. ^ Калабрезе Р., Каприотти Э., Фариселли П., Мартелли П.Л., Касадио Р. (август 2009 г.). «Функциональные аннотации улучшают прогностическую оценку мутаций в белках, связанных с болезнями человека». Человеческая мутация . 30 (8): 1237–1244. дои : 10.1002/humu.21047 . PMID  19514061. S2CID  33900765.
  41. ^ Карчин Р., Дикханс М., Келли Л., Томас Д.Д., Пипер У., Эсвар Н. и др. (июнь 2005 г.). «LS-SNP: крупномасштабная аннотация кодирования несинонимичных SNP на основе нескольких источников информации». Биоинформатика . 21 (12): 2814–2820. doi : 10.1093/биоинформатика/bti442 . ПМИД  15827081.
  42. ^ Асманн Ю.В., Миддха С., Хоссейн А., Бахети С., Ли Ю., Чай Х.С. и др. (январь 2012 г.). «TREAT: инструмент биоинформатики для вариантов аннотаций и визуализации данных целевого секвенирования и секвенирования экзома». Биоинформатика . 28 (2): 277–278. doi : 10.1093/биоинформатика/btr612. ПМЦ 3259432 . ПМИД  22088845. 
  43. ^ Доран АГ, Криви CJ (февраль 2013 г.). «Snpdat: простое и быстрое аннотирование результатов проектов открытия snp de novo для модельных и немодельных организмов». БМК Биоинформатика . 14:45 . дои : 10.1186/1471-2105-14-45 . ПМЦ 3574845 . ПМИД  23390980. 
  44. ^ Грант-младший, Арантес А.С., Ляо X, Стотхард П. (август 2011 г.). «Углубленная аннотация SNP, возникающая в результате проектов повторного секвенирования с использованием NGS-SNP». Биоинформатика . 27 (16): 23.00–23.01. doi : 10.1093/биоинформатика/btr372. ПМК 3150039 . ПМИД  21697123. 
  45. ^ Ге Д., Руццо Е.К., Шианна К.В., Хе М., Пелак К., Хайнцен Э.Л. и др. (июль 2011 г.). «SVA: программное обеспечение для аннотирования и визуализации секвенированных геномов человека». Биоинформатика . 27 (14): 1998–2000. doi : 10.1093/биоинформатика/btr317. ПМК 3129530 . ПМИД  21624899. 
  46. ^ Медина I, Де Мария А, Бледа М, Салаверт Ф, Алонсо Р, Гонсалес С.И., Допазо Дж (июль 2012 г.). «ВАРИАНТ: командная строка, веб-сервис и веб-интерфейс для быстрой и точной функциональной характеристики вариантов, обнаруженных с помощью секвенирования следующего поколения». Исследования нуклеиновых кислот . 40 (проблема с веб-сервером): W54–W58. дои : 10.1093/nar/gks572. ПМЦ 3394276 . ПМИД  22693211. 
  47. ^ Ng PC, Хеникофф С (июль 2003 г.). «SIFT: прогнозирование изменений аминокислот, влияющих на функцию белка». Исследования нуклеиновых кислот . 31 (13): 3812–3814. дои : 10.1093/nar/gkg509. ПМК 168916 . ПМИД  12824425. 
  48. ^ Малхис Н., Джонс С.Дж., Гспонер Дж. (апрель 2019 г.). «Улучшенные меры эволюционного сохранения, использующие таксономические расстояния». Природные коммуникации . 10 (1): 1556. Бибкод : 2019NatCo..10.1556M. дои : 10.1038/s41467-019-09583-2. ПМК 6450959 . ПМИД  30952844. 
  49. ^ Малхис Н., Джейкобсон М., Джонс С.Дж., Гспонер Дж. (июль 2020 г.). «СПИСОК-S2: сортировка вредных миссенс-мутаций между видами на основе таксономии». Исследования нуклеиновых кислот . 48 (П1): И154–161. дои : 10.1093/nar/gkaa288 . ПМК 7319545 . ПМИД  32352516. 
  50. ^ Юань HY, Чиу JJ, Ценг WH, Лю CH, Лю CK, Линь YJ и др. (июль 2006 г.). «FASTSNP: всегда актуальный и расширяемый сервис для анализа функций SNP и определения приоритетов». Исследования нуклеиновых кислот . 34 (проблема с веб-сервером): W635–W641. дои : 10.1093/nar/gkl236. ПМЦ 1538865 . ПМИД  16845089. 
  51. ^ Ми Х, Го Н, Кеджаривал А, Томас П.Д. (январь 2007 г.). «PANTHER версия 6: данные об эволюции последовательностей и функций белков с расширенным представлением биологических путей». Исследования нуклеиновых кислот . 35 (Проблема с базой данных): D247–D252. doi : 10.1093/nar/gkl869. ПМК 1716723 . ПМИД  17130144. 
  52. ^ Каприотти Э, Альтман РБ, Бромберг Ю (2013). «Коллективное суждение предсказывает однонуклеотидные варианты, связанные с заболеванием». БМК Геномика . 14 (Приложение 3): S2. дои : 10.1186/1471-2164-14-S3-S2 . ПМЦ 3839641 . ПМИД  23819846. 
  53. ^ Ван К., Ли М., Хаконарсон Х. (сентябрь 2010 г.). «ANNOVAR: функциональная аннотация генетических вариантов на основе данных высокопроизводительного секвенирования». Исследования нуклеиновых кислот . 38 (16): е164. дои : 10.1093/nar/gkq603. ПМК 2938201 . ПМИД  20601685. 
  54. ^ "чарите/янновар". Гитхаб . Проверено 25 сентября 2016 г.
  55. ^ Макларен В., Гил Л., Хант С.Э., Риат Х.С., Ричи Г.Р., Торманн А. и др. (июнь 2016 г.). «Прогноз эффекта варианта ансамбля». Геномная биология . 17 (1): 122. дои : 10.1186/s13059-016-0974-4 . ПМЦ 4893825 . ПМИД  27268795. 
  56. ^ Макаров В., О'Грейди Т., Кай Г., Лим Дж., Буксбаум Дж.Д., Юн С. (март 2012 г.). «AnnTools: комплексный и универсальный набор инструментов для аннотации геномных вариантов». Биоинформатика . 28 (5): 724–725. doi : 10.1093/биоинформатика/bts032. ПМЦ 3289923 . ПМИД  22257670. 
  57. ^ «Входной файл списка вариантов для аннотации» . SeattleSeq Аннотация 151 .
  58. ^ Медина I, Де Мария А, Бледа М, Салаверт Ф, Алонсо Р, Гонсалес С.И., Допазо Дж (июль 2012 г.). «ВАРИАНТ: командная строка, веб-сервис и веб-интерфейс для быстрой и точной функциональной характеристики вариантов, обнаруженных с помощью секвенирования следующего поколения». Исследования нуклеиновых кислот . 40 (проблема с веб-сервером): W54–W58. дои : 10.1093/nar/gks572. ПМЦ 3394276 . ПМИД  22693211. 
  59. ^ Пабингер С., Дандер А., Фишер М., Снайдер Р., Сперк М., Ефремова М. и др. (март 2014 г.). «Обзор инструментов для вариантного анализа данных секвенирования генома следующего поколения». Брифинги по биоинформатике . 15 (2): 256–278. дои : 10.1093/нагрудник/bbs086. ПМК 3956068 . ПМИД  23341494. 
  60. ^ Ли П.Х., Ли С., Ли Икс, Ви Б., Двиведи Т., Дейли М. (январь 2018 г.). «Принципы и методы in silico определения приоритетов некодирующих регуляторных вариантов». Генетика человека . 137 (1): 15–30. дои : 10.1007/s00439-017-1861-0. ПМЦ 5892192 . ПМИД  29288389. 
  61. ^ Ли X, Ли Z, Чжоу Х, Гейнор С.М., Лю Ю, Чен Х и др. (сентябрь 2020 г.). «Динамическое включение нескольких функциональных аннотаций in silico расширяет возможности анализа ассоциаций редких вариантов в крупных исследованиях полногеномного секвенирования в масштабе». Природная генетика . 52 (9): 969–983. дои : 10.1038/s41588-020-0676-4. ПМЦ 7483769 . ПМИД  32839606. 
  62. ^ Ватанабе К., Таскесен Э., ван Боховен А., Постума Д. (ноябрь 2017 г.). «Функциональное картирование и аннотация генетических ассоциаций с FUMA». Природные коммуникации . 8 (1): 1826. doi : 10.1038/s41467-017-01261-5 . ПМК 5705698 . ПМИД  29184056. 
  63. ^ Ли З, Ли Х, Чжоу Х, Гейнор С.М., Сельварадж М.С., Арапоглу Т и др. (декабрь 2022 г.). «Система обнаружения некодирующих ассоциаций редких вариантов в крупномасштабных исследованиях полногеномного секвенирования». Природные методы . 19 (12): 1599–1611. дои : 10.1038/s41592-022-01640-x. ПМЦ 10008172 . PMID  36303018. S2CID  243873361. 
  64. ^ «STAARpipeline: универсальный инструмент редкого варианта для данных полногеномного секвенирования в масштабе биобанка» . Природные методы . 19 (12): 1532–1533. Декабрь 2022 г. doi : 10.1038/s41592-022-01641-w. PMID  36316564. S2CID  253246835.
  65. ^ Ли, Сихао; Быстрее, Корбин; Чжоу, Хуфэн; Гейнор, Шейла М.; Лю, Яову; Чен, Хан; Сельварадж, Маргарет Сунита; Сан, Райан; Дей, Рунак; Арнетт, Донна К.; Беляк, Лоуренс Ф.; Бис, Джошуа К.; Бланджеро, Джон; Бурвинкль, Эрик; Боуден, Дональд В.; Броуди, Дженнифер А.; Кейд, Брайан Э.; Корреа, Адольфо; Капплс, Л. Адриенн; Карран, Джоан Э.; де Врис, Поль С.; Дуггирала, Равиндранат; Фридман, Барри И.; Геринг, Харальд Х.Х.; Го, Сюцин; Хесслер, Джеффри; Кальяни, Рита Р.; Куперберг, Чарльз; Крал, Брайан Г.; Ланге, Лесли А.; Маничайкул, Ани; Мартин, Лиза В.; МакГарви, Стивен Т.; Митчелл, Брэкстон Д.; Монтассер, Мэй Э.; Моррисон, Аланна С.; Насери, Таке; О'Коннелл, Джеффри Р.; Палмер, Николетт Д.; Пейзер, Патрисия А.; Псати, Брюс М.; Раффилд, Лаура М.; Редлайн, Сьюзен; Райнер, Александр П.; Реупена, Муагутутиа Сефуива; Райс, Кеннет М.; Рич, Стивен С.; Ситлани, Коллин М.; Смит, Дженнифер А.; Тейлор, Кент Д.; Васан, Рамачандран С.; Уиллер, Кристен Дж.; Уилсон, Джеймс Г.; Янек, Лиза Р.; Чжао, Вэй; Консорциум NHLBI Trans-Omics for Precision Medicine (TOPMed); Рабочая группа TOPMed по липидам; Роттер, Джером И.; Натараджан, Прадип; Пелосо, Джина М.; Ли, Жилин; Линь, Сихун (январь 2023 г.). «Мощный, масштабируемый и ресурсоэффективный метаанализ ассоциаций редких вариантов в крупных исследованиях полногеномного секвенирования». Природная генетика . 55 (1): 154–164. дои : 10.1038/s41588-022-01225-6. ПМЦ 10084891 . PMID  36564505. S2CID  255084231.