stringtranslate.com

КЕГГ

KEGG ( Киотская энциклопедия генов и геномов ) представляет собой собрание баз данных, посвященных геномам , биологическим путям , болезням , лекарствам и химическим веществам . KEGG используется для исследований и обучения в области биоинформатики , включая анализ данных в области геномики , метагеномики , метаболомики и других омических исследований, моделирования и симуляции в системной биологии , а также трансляционных исследований при разработке лекарств .

Проект базы данных KEGG был инициирован в 1995 году Минору Канехисой , профессором Института химических исследований Киотского университета , в рамках действующей тогда японской программы генома человека . [1] [2] Предвидя потребность в компьютеризированном ресурсе, который можно было бы использовать для биологической интерпретации данных о последовательностях генома , он начал разработку базы данных KEGG PATHWAY. Это коллекция нарисованных вручную карт путей KEGG, отражающих экспериментальные знания о метаболизме и различных других функциях клетки и организма . Каждая карта путей содержит сеть молекулярных взаимодействий и реакций и предназначена для связи генов в геноме с генными продуктами (в основном белками ) на этом пути. Это позволило провести анализ под названием «Картирование путей KEGG», в ходе которого содержание генов в геноме сравнивается с базой данных KEGG PATHWAY, чтобы определить, какие пути и связанные с ними функции могут быть закодированы в геноме.

По словам разработчиков, KEGG — это «компьютерное представление» биологической системы . [3] Он объединяет строительные блоки и схемы соединений системы, а точнее, генетические строительные блоки генов и белков, химические строительные блоки малых молекул и реакций, а также схемы соединений молекулярных взаимодействий и реакционных сетей. Эта концепция реализована в следующих базах данных KEGG, которые разделены на системную, геномную, химическую и медицинскую информацию. [4]

Базы данных

Информация о системе

База данных KEGG PATHWAY, база данных электрических схем, является ядром ресурса KEGG. Это коллекция карт путей, объединяющая множество объектов, включая гены, белки, РНК, химические соединения, гликаны и химические реакции, а также гены болезней и мишени лекарств, которые хранятся в виде отдельных записей в других базах данных KEGG. Карты маршрутов разделены на следующие разделы:

В разделе «Метаболизм» помимо обычных карт метаболических путей представлены эстетически нарисованные глобальные карты, показывающие общую картину обмена веществ. Глобальные карты низкого разрешения можно использовать, например, для сравнения метаболических способностей различных организмов в геномных исследованиях и различных образцов окружающей среды в метагеномных исследованиях. Напротив, модули KEGG в базе данных KEGG MODULE представляют собой локализованные схемы соединений с более высоким разрешением, представляющие более узкие функциональные единицы в карте путей, такие как подпути, консервативные среди определенных групп организмов и молекулярных комплексов. Модули KEGG определяются как характерные наборы генов, которые можно связать с конкретными метаболическими способностями и другими фенотипическими особенностями, чтобы их можно было использовать для автоматической интерпретации данных генома и метагенома.

Еще одна база данных, дополняющая KEGG PATHWAY, — это база данных KEGG BRITE. Это база данных онтологий , содержащая иерархические классификации различных объектов, включая гены, белки, организмы, болезни, лекарства и химические соединения. В то время как KEGG PATHWAY ограничивается молекулярными взаимодействиями и реакциями этих объектов, KEGG BRITE включает в себя множество различных типов отношений.

Геномная информация

Через несколько месяцев после начала проекта KEGG в 1995 году был опубликован первый отчет о полностью секвенированном бактериальном геноме. [5] С тех пор все опубликованные полные геномы аккумулируются в KEGG как эукариотов , так и прокариотов . База данных KEGG GENES содержит информацию на уровне генов/белков, а база данных KEGG GENOME содержит информацию об этих геномах на уровне организма. База данных KEGG GENES состоит из наборов генов для полных геномов, и генам в каждом наборе даны аннотации в форме установления соответствий схемам соединений карт путей KEGG, модулей KEGG и иерархий BRITE.

Эти соответствия производятся с использованием концепции ортологов . Карты путей KEGG составлены на основе экспериментальных данных на конкретных организмах, но они предназначены для применимости и к другим организмам, поскольку разные организмы, такие как человек и мышь, часто имеют одинаковые пути, состоящие из функционально идентичных генов, называемых ортологичными генами или ортологи. Все гены в базе данных KEGG GENES группируются в такие ортологи в базе данных KEGG ORTHOLOGY (KO). Поскольку узлам (генным продуктам) карт путей KEGG, а также модулям KEGG и иерархиям BRITE присваиваются идентификаторы KO, соответствия устанавливаются после того, как гены в геноме аннотируются идентификаторами KO с помощью процедуры аннотации генома в KEGG. [4]

Химическая информация

Карты метаболических путей KEGG составлены так, чтобы представить двойные аспекты метаболической сети: геномную сеть того, как закодированные в геноме ферменты соединяются, чтобы катализировать последовательные реакции, и химическую сеть того, как химические структуры субстратов и продуктов трансформируются этими реакциями. [6] Набор генов ферментов в геноме будет идентифицировать сети взаимоотношений ферментов при наложении на карты путей KEGG, которые, в свою очередь, характеризуют сети трансформации химической структуры, позволяя интерпретировать потенциалы биосинтеза и биодеградации организма. Альтернативно, набор метаболитов , идентифицированных в метаболоме, приведет к пониманию ферментативных путей и задействованных ферментных генов.

Базы данных в категории химической информации, которые вместе называются KEGG LIGAND, организованы путем сбора знаний о химической сети. В начале проекта KEGG KEGG LIGAND состоял из трех баз данных: KEGG COMPOUND для химических соединений, KEGG REACTION для химических реакций и KEGG ENZYME для реакций по номенклатуре ферментов. [7] В настоящее время существуют дополнительные базы данных: KEGG GLYCAN для гликанов [8] и две вспомогательные базы данных реакций, называемые RPAIR (выравнивание пар реагентов) и RCLASS (класс реакции). [9] СОЕДИНЕНИЕ КЕГО также было расширено и теперь содержит различные соединения, такие как ксенобиотики , в дополнение к метаболитам.

Информация о здоровье

В KEGG болезни рассматриваются как нарушенные состояния биологической системы, вызванные возмущающими факторами генетических факторов и факторов окружающей среды, а лекарства рассматриваются как различные типы возмущающих факторов. [10] База данных KEGG PATHWAY включает не только нормальные, но и нарушенные состояния биологических систем. Однако для большинства заболеваний невозможно составить карты путей развития заболеваний, поскольку молекулярные механизмы недостаточно изучены. Альтернативный подход используется в базе данных KEGG DISEASE, которая просто каталогизирует известные генетические факторы и факторы окружающей среды заболеваний. Эти каталоги могут в конечном итоге привести к созданию более полных электрических схем заболеваний.

База данных KEGG DRUG содержит активные ингредиенты одобренных препаратов в Японии, США и Европе. Они различаются химическими структурами и/или химическими компонентами и связаны с молекулами- мишенями , метаболизирующими ферментами и другой информацией о сети молекулярных взаимодействий в картах путей KEGG и иерархиях BRITE. Это позволяет проводить комплексный анализ взаимодействия лекарств с геномной информацией. Необработанные лекарственные средства и другие вещества, полезные для здоровья, не входящие в категорию одобренных лекарств, хранятся в базе данных KEGG ENVIRON. Базы данных категории медицинской информации называются KEGG MEDICUS и включают в себя также вкладыши ко всем лекарствам, продаваемым в Японии.

Модель подписки

В июле 2011 года KEGG представила модель подписки для загрузки по FTP из-за значительного сокращения государственного финансирования. KEGG по-прежнему доступен бесплатно через свой веб-сайт, но модель подписки вызвала дискуссии об устойчивости баз данных биоинформатики. [11] [12]

Смотрите также

Рекомендации

  1. ^ Канехиса М., Гото С. (2000). «KEGG: Киотская энциклопедия генов и геномов». Нуклеиновые кислоты Рез . 28 (1): 27–30. дои : 10.1093/нар/28.1.27. ПМЦ 102409 . ПМИД  10592173. 
  2. ^ Канехиса М (1997). «База данных для постгеномного анализа». Тенденции Жене . 13 (9): 375–6. дои : 10.1016/S0168-9525(97)01223-7. ПМИД  9287494.
  3. ^ Канехиса М., Гото С., Хаттори М., Аоки-Киношита К.Ф., Ито М., Кавасима С., Катаяма Т., Араки М., Хиракава М. (2006). «От геномики к химической геномике: новые разработки в KEGG». Нуклеиновые кислоты Рез . 34 (Проблема с базой данных): D354–7. дои : 10.1093/nar/gkj102. ПМЦ 1347464 . ПМИД  16381885. 
  4. ^ аб Канехиса М, Гото С, Сато Ю, Кавасима М, Фурумичи М, Танабэ М (2014). «Данные, информация, знания и принципы: вернемся к метаболизму в KEGG». Нуклеиновые кислоты Рез . 42 (Проблема с базой данных): D199–205. дои : 10.1093/нар/gkt1076. ПМЦ 3965122 . ПМИД  24214961. 
  5. ^ Флейшманн Р.Д., Адамс М.Д., Уайт О., Клейтон Р.А., Киркнесс Э.Ф., Керлаваж А.Р., Балт С.Дж., Томб Дж.Ф., Догерти Б.А., Меррик Дж.М. и др. (1995). «Полногеномное случайное секвенирование и сборка Haemophilus influenzae Rd». Наука . 269 ​​(5223): 496–512. Бибкод : 1995Sci...269..496F. дои : 10.1126/science.7542800. PMID  7542800. S2CID  10423613.
  6. ^ Канехиса М (2013). «Химическая и геномная эволюция сетей реакций, катализируемых ферментами». ФЭБС Летт . 587 (17): 2731–7. doi :10.1016/j.febslet.2013.06.026. hdl : 2433/178762 . PMID  23816707. S2CID  40074657.
  7. ^ Гото С., Нисиока Т., Канехиса М. (1999). «База данных LIGAND по ферментам, соединениям и реакциям». Нуклеиновые кислоты Рез . 27 (1): 377–9. дои : 10.1093/нар/27.1.377. ПМК 148189 . ПМИД  9847234. 
  8. ^ Хашимото К., Гото С., Кавано С., Аоки-Киношита К.Ф., Уэда Н., Хамадзима М., Кавасаки Т., Канехиса М. (2006). «KEGG как ресурс информатики гликома». Гликобиология . 16 (5): 63р–70р. дои : 10.1093/гликоб/cwj010 . ПМИД  16014746.
  9. ^ Муто А, Котера М, Токимацу Т, Накагава З, Гото С, Канехиса М (2013). «Модульная архитектура метаболических путей, выявленная консервативными последовательностями реакций». Модель J Chem Inf . 53 (3): 613–22. дои : 10.1021/ci3005379. ПМЦ 3632090 . ПМИД  23384306. 
  10. ^ Канехиса М., Гото С., Фурумичи М., Танабэ М., Хиракава М. (2010). «KEGG для представления и анализа молекулярных сетей, связанных с болезнями и лекарствами». Нуклеиновые кислоты Рез . 38 (Проблема с базой данных): D355–60. дои : 10.1093/nar/gkp896. ПМК 2808910 . ПМИД  19880382. 
  11. ^ Гальперин М.Ю., Фернандес-Суарес XM (2012). «Выпуск базы данных исследований нуклеиновых кислот 2012 года и онлайн-коллекция баз данных по молекулярной биологии». Нуклеиновые кислоты Рез . 40 (Проблема с базой данных): D1–8. дои : 10.1093/nar/gkr1196. ПМК 3245068 . ПМИД  22144685. 
  12. ^ Хайден, EC (2013). «Популярная база данных растений, взимающая с пользователей плату» . Природа . дои : 10.1038/nature.2013.13642. S2CID  211729309.

Внешние ссылки