stringtranslate.com

Коллекция базы данных BioCyc

Коллекция баз данных BioCyc представляет собой набор баз данных путей/геномов, специфичных для организмов (PGDB), которые содержат справочную информацию о геномах и метаболических путях для тысяч организмов. [1] По состоянию на июль 2023 года в BioCyc насчитывалось более 20 040 баз данных. [2] SRI International , [3] базирующаяся в Менло-Парке, Калифорния, поддерживает семейство баз данных BioCyc.

Категории баз данных

На основе ручного курирования семейство баз данных BioCyc делится на 3 уровня:

Уровень 1: Базы данных, которые прошли по крайней мере один год ручного курирования на основе литературы. В настоящее время в уровне 1 есть семь баз данных. Из семи, MetaCyc является основной базой данных, которая содержит почти 2500 метаболических путей многих организмов. [1] [4] Другая важная база данных уровня 1 — HumanCyc, которая содержит около 300 метаболических путей, обнаруженных у людей. [5] Остальные пять баз данных включают EcoCyc ( E. coli ), [6] AraCyc ( Arabidopsis thaliana ), YeastCyc ( Saccharomyces cerevisiae ), LeishCyc ( Leishmania major Friedlin ) и TrypanoCyc ( Trypanosoma brucei ).

Уровень 2: Базы данных, которые были предсказаны вычислительным путем, но получили умеренное ручное курирование (большинство с курированием в течение 1–4 месяцев). Базы данных уровня 2 доступны для ручного курирования учеными, которые интересуются любым конкретным организмом. Базы данных уровня 2 в настоящее время содержат 43 различные базы данных организмов.

Уровень 3: Базы данных, которые были вычислительно предсказаны PathoLogic и не подвергались ручному курированию. Как и в случае с уровнем 2, базы данных уровня 3 также доступны для курирования заинтересованными учеными.

Программные инструменты

Онтологический ресурс содержит множество программных инструментов для поиска, визуализации, сравнения и анализа информации о геноме и путях. Он включает браузер генома и браузеры для метаболических и регуляторных сетей . Веб-сайт также включает инструменты для рисования крупномасштабных («омических») наборов данных на метаболических и регуляторных сетях и на геноме.

Использование в исследованиях

Поскольку семейство баз данных BioCyc включает в себя длинный список баз данных, специфичных для организмов, а также данные на различных системных уровнях в живой системе, использование в исследованиях было в широком диапазоне контекстов. Здесь выделены два исследования, которые показывают два различных варианта использования, одно в масштабе генома, а другое для идентификации определенных SNP ( однонуклеотидных полиморфизмов ) в пределах генома.

AlgaGEM

AlgaGEM — это модель метаболической сети в масштабе генома для компартментализированной клетки водоросли, разработанная Гомесом де Оливейрой Даль'Молином и др. [7] на основе генома Chlamydomonas reinhardtii . Она содержит 866 уникальных ORF, 1862 метаболита, 2499 записей ген-фермент-реакция-ассоциация и 1725 уникальных реакций. Одной из баз данных Pathway, используемых для реконструкции, является MetaCyc.

SNP

Исследование Шимула Чоудхури и др. [8] показало, что связь между материнскими SNP и метаболитами, участвующими в путях гомоцистеина, фолата и транссульфурации, различается в случаях врожденных пороков сердца (ВПС) по сравнению с контрольной группой. Исследование использовало HumanCyc для выбора генов-кандидатов и SNP.

Ссылки

  1. ^ ab Caspi, R.; Altman, T.; Dreher, K.; Fulcher, CA; Subhraveti, P.; Keseler, IM; Kothari, A.; Krummenacker, M.; Latendresse, M.; Mueller, LA; Ong, Q.; Paley, S.; Pujar, A.; Shearer, AG; Travers, M.; Weerasinghe, D.; Zhang, P.; Karp, PD (2011). «База данных метаболических путей и ферментов Meta Cyc и коллекция баз данных путей/геномов Bio Cyc». Nucleic Acids Research . 40 (выпуск базы данных): D742–53. doi :10.1093/nar/gkr1014. PMC  3245006. PMID  22102576 .
  2. ^ "BioCyc Pathway/Genome Database Collection". biocyc.org . Получено 2023-07-31 .
  3. ^ Домашняя страница SRI International
  4. ^ Карп, Питер Д.; Каспи, Рон (2011). «Обзор метаболических баз данных, подчеркивающих семейство Meta Cyc». Архивы токсикологии . 85 (9): 1015–33. doi :10.1007/s00204-011-0705-2. PMC 3352032. PMID  21523460 . 
  5. ^ Ромеро, Педро; Вагг, Джонатан; Грин, Мишель Л.; Кайзер, Дейл; Крумменакер, Маркус; Карп, Питер Д. (2004). «Вычислительное прогнозирование метаболических путей человека на основе полного генома человека». Genome Biology . 6 (1): R2. doi : 10.1186/gb-2004-6-1-r2 . PMC 549063. PMID  15642094 . 
  6. ^ Кеселер, И.М.; Кольядо-Видес, Дж.; Сантос-Завалета, А.; Перальта-Гил, М.; Гама-Кастро, С.; Мунис-Раскадо, Л.; Бонавидес-Мартинес, К.; Палей, С.; Крумменакер, М.; Альтман, Т.; Кайпа, П.; Сполдинг, А.; Пачеко, Дж.; Латендресс, М.; Фулчер, К.; Саркер, М.; Ширер, АГ; Макки, А.; Полсен, И.; Гунсалус, РП; Карп, П.Д. (2010). «Eco Cyc: Полная база данных биологии Escherichia coli». Исследования нуклеиновых кислот . 39 (Проблема с базой данных): D583–90. дои : 10.1093/nar/gkq1143. PMC 3013716. PMID  21097882 . 
  7. ^ Даль'Молин, К. Г.; Куек, Л. Э.; Палфрейман, Р. В.; Нильсен, Л. К. (2011). «AlgaGEM — метаболическая реконструкция водорослей в масштабе генома на основе генома Chlamydomonas reinhardtii». BMC Genomics . 12 (Suppl 4): S5. doi : 10.1186/1471-2164-12-S4-S5 . PMC 3287588. PMID  22369158 . 
  8. ^ Chowdhury, S; Hobbs, CA; MacLeod, SL; Cleves, MA; Melnyk, S; James, SJ; Hu, P; Erickson, SW (2012). «Связи между материнскими генотипами и метаболитами, вовлеченными в врожденные пороки сердца». Молекулярная генетика и метаболизм . 107 (3): 596–604. doi :10.1016/j.ymgme.2012.09.022. PMC 3523122. PMID  23059056 .