Информатика биоразнообразия — это применение методов информатики к информации о биоразнообразии , такой как таксономия , биогеография или экология . Она определяется как применение технологий информационных технологий к управлению, алгоритмическому исследованию, анализу и интерпретации первичных данных, касающихся жизни, особенно на уровне организации видов. [1] Современные компьютерные технологии могут предоставить новые способы просмотра и анализа существующей информации, а также прогнозирования будущих ситуаций (см. моделирование ниши ). Информатика биоразнообразия — это термин, который был придуман только около 1992 года, но с быстро растущими наборами данных стал полезным в многочисленных исследованиях и приложениях, таких как создание таксономических баз данных или географических информационных систем . Информатика биоразнообразия контрастирует с « биоинформатикой », которая часто используется как синоним компьютерной обработки данных в специализированной области молекулярной биологии .
Информатика биоразнообразия (отличная, но связанная с биоинформатикой) — это применение методов информационных технологий к проблемам организации, доступа, визуализации и анализа первичных данных о биоразнообразии. Первичные данные о биоразнообразии состоят из названий, наблюдений и записей образцов, а также генетических и морфологических данных, связанных с образцом. Информатика биоразнообразия может также иметь дело с управлением информацией из неназванных таксонов, например, полученной путем отбора проб окружающей среды и секвенирования образцов из смешанных полей. Термин «информатика биоразнообразия» также используется для охвата вычислительных проблем, характерных для названий биологических объектов, таких как разработка алгоритмов для работы с вариантами представления идентификаторов, таких как названия видов и полномочия, и множественные схемы классификации, в которых эти объекты могут находиться в соответствии с предпочтениями разных работников в этой области, а также синтаксис и семантика, с помощью которых содержимое таксономических баз данных может быть сделано доступным для машинных запросов и совместимым для целей информатики биоразнообразия...
Можно считать, что информатика биоразнообразия началась с создания первых компьютерных таксономических баз данных в начале 1970-х годов и прогрессировала посредством последующей разработки распределенных поисковых инструментов к концу 1990-х годов, включая Species Analyst из Канзасского университета, Североамериканскую информационную сеть по биоразнообразию NABIN, CONABIO в Мексике, INBio в Коста-Рике и другие, [2] создание Глобального информационного фонда по биоразнообразию в 2001 году и параллельную разработку различных нишевых моделей и других инструментов для работы с оцифрованными данными по биоразнообразию с середины 1980-х годов (например, см. [3] ). В сентябре 2000 года американский журнал Science посвятил специальный выпуск теме «Биоинформатика для биоразнообразия» [4] , журнал Biodiversity Informatics начал издаваться в 2004 году, а несколько международных конференций в 2000-х годах объединили специалистов по информатике биоразнообразия, включая конференцию London e-Biosphere в июне 2009 года. Приложение к журналу BMC Bioinformatics (том 10, приложение 14 [5] ), опубликованное в ноябре 2009 года, также посвящено информатике биоразнообразия.
Согласно переписке, воспроизведенной Уолтером Берендсоном, [6] термин «Информатика биоразнообразия» был придуман Джоном Уайтингом в 1992 году для обозначения деятельности организации, известной как Канадский консорциум по информатике биоразнообразия, группы, занимающейся слиянием базовой информации о биоразнообразии с экологической экономикой и геопространственной информацией в форме GPS и ГИС . Впоследствии, похоже, он утратил какую-либо обязательную связь с миром GPS/ГИС и стал ассоциироваться с компьютерным управлением любыми аспектами информации о биоразнообразии (например, см. [7] ).
Одной из основных целей информатики биоразнообразия является создание полного основного списка в настоящее время признанных видов мира . Эта цель была достигнута в значительной степени благодаря проекту «Каталог жизни» , который перечисляет >2 миллионов видов в своем ежегодном контрольном списке 2022 года. [8] Аналогичная работа для ископаемых таксонов, База данных палеобиологии [9] документирует около 100 000+ названий ископаемых видов из неизвестного общего числа.
Применение системы Линнея биномиальной номенклатуры для видов и униномиальных для родов и более высоких рангов привело ко многим преимуществам, но также и к проблемам с омонимами (одно и то же название используется для нескольких таксонов, либо непреднамеренно, либо законно в нескольких царствах), синонимами (множественные названия для одного и того же таксона), а также вариантными представлениями одного и того же названия из-за орфографических различий, незначительных ошибок в написании, различий в способе цитирования имен авторов и дат и т. д. Кроме того, названия могут меняться со временем из-за меняющихся таксономических мнений (например, правильное родовое размещение вида или повышение подвида до ранга вида или наоборот), а также описание таксона может меняться в соответствии с таксономическими концепциями разных авторов. Одним из предлагаемых решений этой проблемы является использование идентификаторов наук о жизни ( LSID ) для целей межмашинной коммуникации, хотя есть как сторонники, так и противники этого подхода.
Организмы могут быть классифицированы множеством способов (см. главную страницу Биологическая классификация ), что может создать проблемы проектирования для систем информатики биоразнообразия, направленных на включение либо одной, либо нескольких классификаций для удовлетворения потребностей пользователей или для направления их к единой «предпочтительной» системе. Будет ли когда-либо достигнута единая система классификации консенсуса, вероятно, является открытым вопросом, однако Каталог жизни поручил деятельность в этой области [10] , которая была заменена опубликованной системой, предложенной в 2015 году М. Руджеро и его коллегами. [11]
Карты биоразнообразия обеспечивают картографическое представление пространственных данных о биоразнообразии. [12] Эти данные могут использоваться совместно с контрольными списками видов для содействия усилиям по сохранению биоразнообразия . Карты биоразнообразия могут помочь выявить закономерности распределения видов и изменения ареалов. Это может отражать потерю биоразнообразия, деградацию среды обитания или изменения в составе видов . В сочетании с данными о развитии городов карты могут информировать об управлении земельными ресурсами путем моделирования сценариев, которые могут повлиять на биоразнообразие.
Карты биоразнообразия могут быть созданы различными способами: традиционно карты ареалов рисовались вручную на основе литературных отчетов, но все чаще используются крупномасштабные данные, например, из гражданских научных проектов (например, iNaturalist ) и оцифрованных музейных коллекций (например, VertNet). Инструменты ГИС, такие как ArcGIS или пакеты R , такие как dismo, могут специально помочь в моделировании распределения видов (моделировании экологической ниши) и даже предсказать воздействие экологических изменений на биоразнообразие. [13] GBIF , OBIS и IUCN являются крупными веб-хранилищами пространственно-временных данных о видах, которые являются источником многих существующих карт биоразнообразия.
«Первичную» информацию о биоразнообразии можно считать основными данными о распространении и разнообразии видов (или, по сути, любых узнаваемых таксонов), обычно в сочетании с информацией об их распространении в пространстве, времени или и в том, и в другом. Такая информация может быть в форме сохраненных образцов и связанной с ними информации, например, собранной в коллекциях естественной истории музеев и гербариев , или в виде записей наблюдений, например, либо из формальных фаунистических или флористических обследований, проводимых профессиональными биологами и студентами, либо в виде любительских и других запланированных или незапланированных наблюдений, включая те, которые все больше попадают в сферу гражданской науки . Предоставление онлайнового, согласованного цифрового доступа к этой обширной коллекции разрозненных первичных данных является основной функцией информатики биоразнообразия, которая лежит в основе региональных и глобальных сетей данных о биоразнообразии, примерами последних являются OBIS и GBIF .
Как вторичный источник данных о биоразнообразии, соответствующая научная литература может быть проанализирована либо людьми, либо (потенциально) специализированными алгоритмами поиска информации для извлечения соответствующей первичной информации о биоразнообразии, которая в ней сообщается, иногда в агрегированной / сводной форме, но часто как первичные наблюдения в повествовательной или табличной форме. Элементы такой деятельности (такие как извлечение ключевых таксономических идентификаторов, ключевых слов / индексных терминов и т. д.) практиковались в течение многих лет на более высоком уровне выбранными академическими базами данных и поисковыми системами . Однако для максимальной ценности информатики биоразнообразия фактические первичные данные о встречаемости в идеале должны быть извлечены и затем предоставлены в стандартизированной форме или формах; например, проекты Plazi и INOTAXA преобразуют таксономическую литературу в форматы XML , которые затем могут быть прочитаны клиентскими приложениями, первый использует TaxonX-XML [15] , а второй использует формат taXMLit. Библиотека наследия биоразнообразия также добивается значительных успехов в достижении своей цели по оцифровке значительной части таксономической литературы, не защищенной авторским правом, которая затем подвергается оптическому распознаванию символов (OCR), чтобы ее можно было подвергнуть дальнейшей обработке с использованием инструментов информатики биоразнообразия.
Как и другие дисциплины, связанные с данными, информатика биоразнообразия выигрывает от принятия соответствующих стандартов и протоколов для поддержки передачи информации между машинами и взаимодействия информации в рамках своей конкретной области. Примерами соответствующих стандартов являются схема Darwin Core XML для данных о биоразнообразии на основе образцов и наблюдений, разработанная с 1998 года, а также ее расширения, схема передачи таксономических концепций [16] , а также стандарты для структурированных описательных данных [17] и доступа к данным биологической коллекции (ABCD); [18] в то время как протоколы поиска и передачи данных включают DiGIR (сейчас в основном заменен) и TAPIR (протокол доступа TDWG для поиска информации). [19] Многие из этих стандартов и протоколов в настоящее время поддерживаются, а их разработка контролируется Стандартами информации о биоразнообразии (TDWG) .
На конференции e-Biosphere 2009 года в Великобритании [20] были приняты следующие темы, которые свидетельствуют о широком спектре текущих мероприятий в области информатики биоразнообразия и о том, как их можно классифицировать:
Постконференционный семинар ключевых лиц, играющих в настоящее время важную роль в информатике биоразнообразия, также привел к принятию резолюции семинара, в которой, среди прочего, подчеркивалась необходимость создания надежных глобальных реестров для ресурсов, которые являются базовыми для информатики биоразнообразия (например, репозиториев, коллекций); завершения создания прочной таксономической инфраструктуры; и создания онтологий для данных о биоразнообразии. [21]
Глобальный:
Региональные/национальные проекты:
Список более 600 текущих мероприятий, связанных с информатикой о биоразнообразии, можно найти в базе данных TDWG «Проекты по информации о биоразнообразии мира». [22]
{{cite web}}
: CS1 maint: архивная копия как заголовок ( ссылка )