Open Biological and Biomedical Ontologies ( OBO ) Foundry — это группа людей, которые создают и поддерживают онтологии , связанные с науками о жизни . [1] OBO Foundry устанавливает набор принципов для разработки онтологий для создания набора совместимых справочных онтологий в биомедицинской области. В настоящее время существует более сотни онтологий, которые следуют принципам OBO Foundry .
Усилия OBO Foundry облегчают интеграцию биомедицинских результатов и проведение анализа в биоинформатике . Это достигается путем предоставления структурированной ссылки на термины различных областей исследований и их взаимосвязей (например, фенотип в мышиной модели и связанный с ним фенотип в данио-рерио ). [2]
Инициатива Foundry направлена на улучшение интеграции данных в области естественных наук. Одним из подходов к интеграции является аннотирование данных из разных источников с использованием контролируемых словарей . В идеале такие контролируемые словари принимают форму онтологий , которые поддерживают логическое рассуждение над данными, аннотированными с использованием терминов в словаре.
Формализация концепций в биомедицинской области особенно известна благодаря работе Консорциума онтологии генов , части OBO Foundry. Это привело к разработке определенных предлагаемых принципов надлежащей практики в разработке онтологий, которые в настоящее время внедряются в практику в рамках консорциума Открытых биомедицинских онтологий через его инициативу OBO Foundry. Онтологии OBO являются частью ресурсов Национального центра биомедицинской онтологии , где они образуют центральный компонент Биопортала NCBO.
Открытые биологические и биомедицинские онтологии (OBO; ранее Open Biomedical Ontologies) — это попытка создать онтологии ( контролируемые словари ) для использования в биологических и медицинских областях. Подмножество исходных онтологий OBO дало начало OBO Foundry, которая руководит усилиями OBO с 2007 года. [1]
Создание OBO в 2001 году во многом было вдохновлено усилиями проекта Gene Ontology . [3] OBO является частью ресурсов Национального центра биомедицинской онтологии США (NCBIO) и центральным элементом BioPortal NCBO. Это инициатива, возглавляемая OBO Foundry.
OBO Foundry открыт для участия любых заинтересованных лиц. Онтологии, которые намерены официально стать частью OBO Foundry, должны придерживаться принципов OBO и пройти ряд проверок, проводимых членами, когда «координаторы Foundry выступают в качестве аналогов редакторов журналов». [1] Существуют онтологии, которые следуют принципам OBO, но официально не являются частью OBO, например, онтология Reagent Application Ontology от eagle -i . [4] и онтология Animals in Context Ontology. [5]
Интеграция в OBO теории жесткости OntoClean была предложена как шаг к стандартизации онтологий кандидатов. Такая интеграция облегчит разработку программного обеспечения для автоматической проверки кандидатов. [6]
Сообщество OBO Foundry также занимается разработкой инструментов для облегчения создания и поддержки онтологий. Большинство разработчиков онтологий в OBO используют редактор онтологий Protégé и язык веб-онтологий (OWL) для создания онтологий. Для облегчения управления онтологиями из командной строки в формате, совместимом с Protégé и OWL, OBO Foundry разработал инструмент ROBOT (ROBOT — это инструмент OBO). ROBOT объединяет функции для рутинных задач в разработке онтологий, имеет открытый исходный код и может использоваться либо через командную строку, либо как библиотека для любого языка на виртуальной машине Java . [7]
Другим инструментом, связанным с усилиями OBO, является OBO-Edit , [8] редактор онтологий и резонер, финансируемый Gene Ontology Consortium . Существуют также плагины для OBO-Edit, которые облегчают разработку онтологий, такие как полуавтоматический генератор онтологий DOG4DAG. [9]
Формат файла OBO — это ориентированный на биологию язык для построения онтологий. Он основан на принципах Web Ontology Language (OWL) .
В результате совместных усилий были созданы стандартные общие отображения для безпотерьных преобразований в обе стороны между форматом Open Biomedical Ontologies (OBO) и OWL. [10] [11] Исследование содержит методическое изучение каждой из конструкций OBO и многослойного пирога для OBO, аналогичного стеку Semantic Web. [12]
Первоначальный набор онтологий OBO Foundry состоял из зрелых онтологий (таких как Gene Ontology , GO, и Foundational Model of Anatomy , FMAO), путем слияния ранее существовавших онтологий (например, Cell Ontology, [13] CL, сформированной из различных специализированных онтологий, [14] [15] и связанных частей GO и FMAO) и путем разработки новых онтологий на основе ее принципов. [16]
Первоначальный набор онтологий также включал в себя онтологию анатомии зебровой рыбы [17] (часть информационной сети зебровой рыбы ), онтологию CheBI , онтологию болезней , онтологию растений , онтологию последовательностей , онтологию биомедицинских исследований и онтологию белков . [16]
Количество онтологий в OBO выросло до порядка сотен, и они собраны в списке онтологий OBO Foundry .
Ряд различных онтологий OBO Foundry также были интегрированы в граф знаний Wikidata . [18] [19] Это привело к интеграции структурированных онтологий OBO с данными из других баз данных, не относящихся к OBO. Например, интеграция онтологии заболеваний человека [20] в Wikidata позволила установить ее связь с описанием клеточных линий из ресурса Cellosaurus . [21] Одной из целей интеграции OBO Foundry в Wikidata было снижение барьеров для неонтологов при внесении вклада в онтологии и их использовании. Wikidata, возможно, проще для понимания и использования, чем традиционные модели онтологий (которые требуют высокой степени специальных знаний). [22]
Краткое изложение принципов OBO Foundry [23] для разработки онтологии наук о жизни, совместимой с OBO :
Онтологии находятся в открытом доступе и должны быть выпущены либо под лицензией CC-BY 3.0 , либо под лицензией общественного достояния ( CC0 ). [24] Открытость онтологий позволила, например, импортировать термины из Gene Ontology (одной из онтологий, которая следует принципам OBO) в проект Wikidata . [25]
Онтологии должны быть доступны на общем формальном языке . На практике это означает, что онтологии, которые являются частью литейного производства OBO, должны описывать элементы, не используя форматы OWL/ OWL2 или OBO, используя синтаксис RDF/XML для максимальной совместимости. [26]
Термины должны быть уникальными в пространстве OBO, что означает, что каждый элемент имеет уникальный префикс онтологии (например, CHEBI , GO , PRO ) и локальный числовой идентификатор в пределах онтологии. [27] Выбор числового идентификатора был сделан для улучшения обслуживания и развития ресурсов. [28] Для участия в OBO Foundry онтологии должны быть ортогональными, а концепции, которые они моделируют, должны быть уникальными в пределах OBO, поэтому каждая концепция имеет один унифицированный идентификатор ресурса (URI). Таким образом, новые онтологии должны повторно использовать работу, проделанную в других усилиях. [28]
Несмотря на идеал уникальности терминов и интероперабельности, на практике это трудно реализовать, что приводит к дублированию терминов. Кроме того, некоторые онтологии не используют термины повторно или даже используют их повторно ненадлежащим образом. [29]
Онтологии развиваются со временем, совершенствуя концепции и описания в соответствии с достижениями в знаниях их конкретных областей. [30] Для того чтобы гарантировать, что новые версии обновляются, но инструменты, использующие старые версии онтологий, по-прежнему функционируют, OBO применяет систему систем управления версиями , при этом каждая версия онтологии получает уникальный идентификатор либо в формате даты, либо в системе нумерации, а также метаданные dags. [31]
Онтологии должны иметь четко определенную область действия (область, которую они должны охватывать). [32]
Онтологии должны иметь текстовые определения для каждого элемента в удобном для восприятия человеком виде. Это означает, что помимо буквенно-цифровой идентификации для каждого элемента, они должны быть описаны на естественном языке логическими утверждениями, следуя аристотелевской логике , способом, который является уникальным в пределах онтологии. [33]
Онтологии должны использовать отношения между элементами из онтологии отношений (RO) . Это гарантирует, что различные онтологии могут быть легко интегрированы, что особенно важно для логического вывода . [34]
Relation Ontology (RO) — это онтология, разработанная для представления отношений между различными биомедицинскими концепциями. [35] Она строго описывает такие отношения, как «part_of», «located_in» и «preceded_by», которые повторно используются многими онтологиями OBO Foundry.
Онтологии OBO должны быть тщательно документированы. Часто это делается через репозитории GitHub для каждой конкретной онтологии (см. Список онтологий OBO Foundry ). [36]
Онтологии должны быть полезны для множества разных людей, а разработчики онтологий должны документировать доказательства использования. Этот критерий важен для процесса обзора. Примеры использования включают ссылки на термины других онтологий, использование в семантических веб- проектах, использование в аннотациях или других исследовательских приложениях. [37]
Онтологии должны быть разработаны таким образом, чтобы обеспечить возможность сотрудничества с другими членами OBO Foundry. [38]
Онтологии должны иметь одного человека, ответственного за онтологию, который будет посредником во взаимодействии с сообществом. [39]
Соглашения об именовании для онтологий OBO направлены на то, чтобы сделать первичные метки однозначными и уникальными внутри онтологии (и, желательно, внутри OBO). Метки и синонимы должны быть написаны на английском языке, избегая использования подчеркиваний и camel case . [40] В OBO отсутствует механизм многоязыковой поддержки, в отличие от Wikidata , который допускает метки в разных системах. Система именования в OBO основана на серии опросов по каталогизации соглашений об именовании текущих онтологий, а также на выявлении проблем, связанных с этими соглашениями. [41]
Онтологии должны обновляться в соответствии с изменениями в научном консенсусе . OBO Foundry определяет научный консенсус как «множественные публикации независимых лабораторий в течение года, пришедшие к одному и тому же выводу, и нет никаких или ограниченных (<10%) особых мнений, опубликованных в тот же период времени». [42]
{{cite conference}}
: CS1 maint: multiple names: authors list (link)