Открытые биологические и биомедицинские онтологии ( OBO ) — это группа людей, занимающихся созданием и поддержкой онтологий , связанных с науками о жизни . [1] OBO Foundry устанавливает набор принципов разработки онтологий для создания набора совместимых эталонных онтологий в биомедицинской области. В настоящее время существует более сотни онтологий, следующих принципам OBO Foundry .
Усилия OBO Foundry облегчают интеграцию биомедицинских результатов и проведение анализа в области биоинформатики . Это достигается путем предложения структурированного справочника по терминам различных областей исследований и их взаимосвязям (например, фенотип в мышиной модели и связанный с ним фенотип у рыбок данио ). [2]
Инициатива Foundry направлена на улучшение интеграции данных в науках о жизни. Одним из подходов к интеграции является аннотирование данных из разных источников с использованием контролируемых словарей . В идеале такие контролируемые словари принимают форму онтологий , которые поддерживают логические рассуждения над данными, аннотированными с использованием терминов словаря.
Формализация концепций в биомедицинской области особенно известна благодаря работе Консорциума генной онтологии , входящего в состав OBO Foundry. Это привело к разработке некоторых предлагаемых принципов хорошей практики разработки онтологий, которые в настоящее время применяются на практике в рамках консорциума открытых биомедицинских онтологий в рамках его инициативы OBO Foundry. Онтологии OBO являются частью ресурсов Национального центра биомедицинской онтологии , где они составляют центральный компонент Биопортала NCBO.
Открытые биологические и биомедицинские онтологии (OBO; ранее открытые биомедицинские онтологии) — это попытка создать онтологии ( контролируемые словари ) для использования в биологических и медицинских областях. Подмножество исходных онтологий OBO положило начало OBO Foundry, которая возглавляет усилия OBO с 2007 года. [1]
Создание OBO в 2001 году во многом было вдохновлено усилиями проекта Gene Ontology . [3] OBO является частью ресурсов Национального центра биомедицинской онтологии США (NCBIO) и центральным элементом биопортала NCBO. Это инициатива OBO Foundry.
Литейная мастерская ОБО открыта для участия всех заинтересованных лиц. Онтологии, которые намереваются официально стать частью OBO Foundry, должны придерживаться принципов OBO и пройти серию проверок, проводимых членами, когда «координаторы Foundry служат аналогами редакторов журналов». [1] Существуют онтологии, которые следуют принципам OBO, но официально не являются частью OBO, например онтология применения реагентов eagle-i . [4] и «Животные в контекстной онтологии». [5]
Интеграция в OBO теории жесткости OntoClean была предложена как шаг к стандартизации возможных онтологий. Эта интеграция облегчит разработку программного обеспечения для автоматической проверки кандидатов. [6]
Сообщество OBO Foundry также занимается разработкой инструментов, облегчающих создание и поддержку онтологий. Большинство разработчиков онтологий в OBO используют редактор онтологий Protégé и язык веб-онтологий (OWL) для построения онтологий. Чтобы облегчить управление онтологиями из командной строки в формате, совместимом с Protégé и OWL, компания OBO Foundry разработала инструмент ROBOT (ROBOT — это инструмент OBO). ROBOT объединяет функции для рутинных задач разработки онтологий, имеет открытый исходный код и может использоваться либо через командную строку, либо в качестве библиотеки для любого языка на виртуальной машине Java . [7]
Другим инструментом, связанным с усилиями OBO, является OBO-Edit , [8] редактор онтологий и рассуждений, финансируемый Консорциумом Gene Ontology . Существуют также плагины для OBO-Edit, которые облегчают разработку онтологий, например полуавтоматический генератор онтологий DOG4DAG. [9]
Формат файла OBO — это биологически ориентированный язык для построения онтологий. Он основан на принципах языка веб-онтологии (OWL) .
Усилиями сообщества были созданы стандартные общие сопоставления для двусторонних преобразований без потерь между форматом открытых биомедицинских онтологий (OBO) и OWL. [10] [11] Исследование содержит методическое рассмотрение каждой из конструкций OBO и слоеного пирога для OBO, аналогичного стеку Semantic Web. [12]
Первоначальный набор онтологий OBO Foundry был составлен из зрелых онтологий (таких как Генная онтология , GO и Фундаментальная модель анатомии , FMAO), путем слияния ранее существовавших онтологий (например: Клеточная онтология, [13] CL, сформированная из различных специализированных онтологий, [14] [15] и связанных частей по GO и FMAO), а также путем разработки новых онтологий, основанных на его принципах. [16]
Исходный набор онтологий также включал анатомическую онтологию данио [17] (часть информационной сети данио ), онтологию CheBI , онтологию заболеваний , онтологию растений , онтологию последовательностей , онтологию для биомедицинских исследований и онтологию белков . [16]
Количество онтологий в OBO выросло до порядка сотни, и они собраны в список онтологий OBO Foundry .
Ряд различных онтологий OBO Foundry также были интегрированы в граф знаний Викиданных . [18] [19] Это привело к интеграции структурированных онтологий OBO с данными из других баз данных, не принадлежащих OBO. Например, интеграция Онтологии заболеваний человека [20] в Викиданные позволила связать ее с описанием клеточных линий из ресурса Cellosaurus . [21] Одной из целей интеграции OBO Foundry с Викиданными было снижение барьеров для неонтологов при внесении вклада и использовании онтологий. Викиданные, возможно, легче понять и использовать, чем традиционные модели онтологий (которые требуют высокой степени специальных знаний). [22]
Краткое изложение основных принципов OBO [23] для разработки онтологии наук о жизни, совместимой с OBO :
Онтологии находятся в открытом доступе и должны быть выпущены либо под лицензией CC-BY 3.0 , либо в свободном доступе ( CC0 ). [24] Открытость онтологий позволила, например, импортировать термины из Онтологии генов (одной из онтологий, следующих принципам OBO) в проект Викиданных . [25]
Онтологии должны быть доступны на общем формальном языке . На практике это означает, что онтологии, входящие в состав OBO, должны описывать элементы в форматах OWL/ OWL2 или OBO , используя синтаксис RDF/XML для максимизации совместимости. [26]
Термины должны быть уникальными в пространстве OBO, то есть каждый элемент имеет уникальный префикс онтологии (например, CHEBI , GO , PRO ) и локальный числовой идентификатор в онтологии. [27] Выбор числового идентификатора был сделан для улучшения обслуживания и развития ресурсов. [28] Чтобы участвовать в OBO Foundry, онтологии должны быть ортогональными, а концепции, которые они моделируют, должны быть уникальными в пределах OBO, поэтому каждая концепция имеет один унифицированный идентификатор ресурса (URI). Таким образом, новые онтологии должны повторно использовать работу, проделанную в других проектах. [28]
Несмотря на идеал уникальности терминов и совместимости, на практике это трудно обеспечить, что приводит к дублированию терминов. Более того, некоторые онтологии не используют повторно термины или даже повторно используют термины ненадлежащим образом. [29]
Онтологии развиваются во времени, совершенствуя концепции и описания в соответствии с достижениями в знаниях их конкретных областей. [30] Чтобы гарантировать, что новые версии обновляются, но инструменты, использующие более старые версии онтологий, по-прежнему функционируют, OBO применяет систему систем управления версиями , при этом каждая версия онтологии получает уникальный идентификатор либо в формате даты, либо в формате даты. или систему нумерации и даги метаданных . [31]
Онтологии должны иметь четко определенную область применения (домен, который они собираются охватить). [32]
Онтологии должны иметь текстовые определения для каждого элемента в удобочитаемой форме. Это означает, что помимо буквенно-цифровой идентификации каждого элемента они должны быть описаны на естественном языке с помощью логических утверждений, следующих аристотелевской логике , уникальным способом в рамках онтологии. [33]
Онтологии должны использовать отношения между элементами из онтологии отношений (RO) . Это гарантирует беспрепятственную интеграцию различных онтологий, что особенно важно для логического вывода . [34]
Онтология отношений (RO) — это онтология , предназначенная для представления отношений между различными биомедицинскими концепциями. [35] Он строго описывает такие отношения, как «part_of», «located_in» и «preceded_by», которые повторно используются во многих онтологиях OBO Foundry.
Онтологии ОВО должны быть тщательно документированы. Часто это делается через репозитории GitHub для каждой конкретной онтологии (см. Список онтологий OBO Foundry ). [36]
Онтологии должны быть полезны для множества разных людей, а разработчики онтологий должны документировать доказательства использования. Этот критерий важен для процесса рассмотрения. Примеры использования включают связывание терминов с другими онтологиями, использование в семантических веб- проектах, использование в аннотациях или других исследовательских приложениях. [37]
Онтологии должны разрабатываться таким образом, чтобы обеспечить возможность сотрудничества с другими членами OBO Foundry. [38]
В онтологиях должен быть один человек, ответственный за онтологию, который будет опосредовать взаимодействие с сообществом. [39]
Соглашения об именах для онтологий OBO направлены на то, чтобы сделать первичные метки однозначными и уникальными внутри онтологии (и предпочтительно внутри OBO). Метки и синонимы следует писать на английском языке, избегая использования символов подчеркивания и верблюжьего регистра . [40] В OBO отсутствует механизм многоязычной поддержки, в отличие от Wikidata , который допускает разметку в разных системах. Система именования в OBO основана на серии исследований по каталогизации соглашений об именах текущих онтологий, а также на выявлении проблем, связанных с этими соглашениями. [41]
Онтологии должны обновляться с учетом изменений в научном консенсусе . OBO Foundry определяет научный консенсус как «множественные публикации независимых лабораторий, сделанные в течение года, пришли к одному и тому же выводу, и несогласные мнения, опубликованные в один и тот же период времени, отсутствуют или ограничены (<10%)». [42]
{{cite conference}}
: CS1 maint: multiple names: authors list (link)