Информатика биоразнообразия

Информатика биоразнообразия — это применение методов информатики к информации о биоразнообразии , такой как таксономия , биогеография или экология . Она определяется как применение технологий информационных технологий к управлению, алгоритмическому исследованию, анализу и интерпретации первичных данных, касающихся жизни, особенно на уровне организации видов. ^[1] Современные компьютерные технологии могут предоставить новые способы просмотра и анализа существующей информации, а также прогнозирования будущих ситуаций (см. моделирование ниши ). Информатика биоразнообразия — это термин, который был придуман только около 1992 года, но с быстро растущими наборами данных стал полезным в многочисленных исследованиях и приложениях, таких как создание таксономических баз данных или географических информационных систем . Информатика биоразнообразия контрастирует с « биоинформатикой », которая часто используется как синоним компьютерной обработки данных в специализированной области молекулярной биологии .

Обзор

Информатика биоразнообразия (отличная, но связанная с биоинформатикой) — это применение методов информационных технологий к проблемам организации, доступа, визуализации и анализа первичных данных о биоразнообразии. Первичные данные о биоразнообразии состоят из названий, наблюдений и записей образцов, а также генетических и морфологических данных, связанных с образцом. Информатика биоразнообразия может также иметь дело с управлением информацией из неназванных таксонов, например, полученной путем отбора проб окружающей среды и секвенирования образцов из смешанных полей. Термин «информатика биоразнообразия» также используется для охвата вычислительных проблем, характерных для названий биологических объектов, таких как разработка алгоритмов для работы с вариантами представления идентификаторов, таких как названия видов и полномочия, и множественные схемы классификации, в которых эти объекты могут находиться в соответствии с предпочтениями разных работников в этой области, а также синтаксис и семантика, с помощью которых содержимое таксономических баз данных может быть сделано доступным для машинных запросов и совместимым для целей информатики биоразнообразия...

История дисциплины

Можно считать, что информатика биоразнообразия началась с создания первых компьютерных таксономических баз данных в начале 1970-х годов и прогрессировала посредством последующей разработки распределенных поисковых инструментов к концу 1990-х годов, включая Species Analyst из Канзасского университета, Североамериканскую информационную сеть по биоразнообразию NABIN, CONABIO в Мексике, INBio в Коста-Рике и другие, ^[2] создание Глобального информационного фонда по биоразнообразию в 2001 году и параллельную разработку различных нишевых моделей и других инструментов для работы с оцифрованными данными по биоразнообразию с середины 1980-х годов (например, см. ^[3] ). В сентябре 2000 года американский журнал Science посвятил специальный выпуск теме «Биоинформатика для биоразнообразия» ^[4] , журнал Biodiversity Informatics начал издаваться в 2004 году, а несколько международных конференций в 2000-х годах объединили специалистов по информатике биоразнообразия, включая конференцию London e-Biosphere в июне 2009 года. Приложение к журналу BMC Bioinformatics (том 10, приложение 14 ^[5] ), опубликованное в ноябре 2009 года, также посвящено информатике биоразнообразия.

История термина

Согласно переписке, воспроизведенной Уолтером Берендсоном, ^[6] термин «Информатика биоразнообразия» был придуман Джоном Уайтингом в 1992 году для обозначения деятельности организации, известной как Канадский консорциум по информатике биоразнообразия, группы, занимающейся слиянием базовой информации о биоразнообразии с экологической экономикой и геопространственной информацией в форме GPS и ГИС . Впоследствии, похоже, он утратил какую-либо обязательную связь с миром GPS/ГИС и стал ассоциироваться с компьютерным управлением любыми аспектами информации о биоразнообразии (например, см. ^[7] ).

Цифровая таксономия (систематика)

Глобальный список всех видов

Одной из основных целей информатики биоразнообразия является создание полного основного списка в настоящее время признанных видов мира . Эта цель была достигнута в значительной степени благодаря проекту «Каталог жизни» , который перечисляет >2 миллионов видов в своем ежегодном контрольном списке 2022 года. ^[8] Аналогичная работа для ископаемых таксонов, База данных палеобиологии ^[9] документирует около 100 000+ названий ископаемых видов из неизвестного общего числа.

Научные названия родов и видов как уникальные идентификаторы

Применение системы Линнея биномиальной номенклатуры для видов и униномиальных для родов и более высоких рангов привело ко многим преимуществам, но также и к проблемам с омонимами (одно и то же название используется для нескольких таксонов, либо непреднамеренно, либо законно в нескольких царствах), синонимами (множественные названия для одного и того же таксона), а также вариантными представлениями одного и того же названия из-за орфографических различий, незначительных ошибок в написании, различий в способе цитирования имен авторов и дат и т. д. Кроме того, названия могут меняться со временем из-за меняющихся таксономических мнений (например, правильное родовое размещение вида или повышение подвида до ранга вида или наоборот), а также описание таксона может меняться в соответствии с таксономическими концепциями разных авторов. Одним из предлагаемых решений этой проблемы является использование идентификаторов наук о жизни ( LSID ) для целей межмашинной коммуникации, хотя есть как сторонники, так и противники этого подхода.

Консенсусная классификация организмов

Организмы могут быть классифицированы множеством способов (см. главную страницу Биологическая классификация ), что может создать проблемы проектирования для систем информатики биоразнообразия, направленных на включение либо одной, либо нескольких классификаций для удовлетворения потребностей пользователей или для направления их к единой «предпочтительной» системе. Будет ли когда-либо достигнута единая система классификации консенсуса, вероятно, является открытым вопросом, однако Каталог жизни поручил деятельность в этой области ^[10] , которая была заменена опубликованной системой, предложенной в 2015 году М. Руджеро и его коллегами. ^[11]

Карты биоразнообразия

Карты биоразнообразия обеспечивают картографическое представление пространственных данных о биоразнообразии. ^[12] Эти данные могут использоваться совместно с контрольными списками видов для содействия усилиям по сохранению биоразнообразия . Карты биоразнообразия могут помочь выявить закономерности распределения видов и изменения ареалов. Это может отражать потерю биоразнообразия, деградацию среды обитания или изменения в составе видов . В сочетании с данными о развитии городов карты могут информировать об управлении земельными ресурсами путем моделирования сценариев, которые могут повлиять на биоразнообразие.

Карты биоразнообразия могут быть созданы различными способами: традиционно карты ареалов рисовались вручную на основе литературных отчетов, но все чаще используются крупномасштабные данные, например, из гражданских научных проектов (например, iNaturalist ) и оцифрованных музейных коллекций (например, VertNet). Инструменты ГИС, такие как ArcGIS или пакеты R , такие как dismo, могут специально помочь в моделировании распределения видов (моделировании экологической ниши) и даже предсказать воздействие экологических изменений на биоразнообразие. ^[13] GBIF , OBIS и IUCN являются крупными веб-хранилищами пространственно-временных данных о видах, которые являются источником многих существующих карт биоразнообразия.

Мобилизация первичной информации о биоразнообразии

«Первичную» информацию о биоразнообразии можно считать основными данными о распространении и разнообразии видов (или, по сути, любых узнаваемых таксонов), обычно в сочетании с информацией об их распространении в пространстве, времени или и в том, и в другом. Такая информация может быть в форме сохраненных образцов и связанной с ними информации, например, собранной в коллекциях естественной истории музеев и гербариев , или в виде записей наблюдений, например, либо из формальных фаунистических или флористических обследований, проводимых профессиональными биологами и студентами, либо в виде любительских и других запланированных или незапланированных наблюдений, включая те, которые все больше попадают в сферу гражданской науки . Предоставление онлайнового, согласованного цифрового доступа к этой обширной коллекции разрозненных первичных данных является основной функцией информатики биоразнообразия, которая лежит в основе региональных и глобальных сетей данных о биоразнообразии, примерами последних являются OBIS и GBIF .

Как вторичный источник данных о биоразнообразии, соответствующая научная литература может быть проанализирована либо людьми, либо (потенциально) специализированными алгоритмами поиска информации для извлечения соответствующей первичной информации о биоразнообразии, которая в ней сообщается, иногда в агрегированной / сводной форме, но часто как первичные наблюдения в повествовательной или табличной форме. Элементы такой деятельности (такие как извлечение ключевых таксономических идентификаторов, ключевых слов / индексных терминов и т. д.) практиковались в течение многих лет на более высоком уровне выбранными академическими базами данных и поисковыми системами . Однако для максимальной ценности информатики биоразнообразия фактические первичные данные о встречаемости в идеале должны быть извлечены и затем предоставлены в стандартизированной форме или формах; например, проекты Plazi и INOTAXA преобразуют таксономическую литературу в форматы XML , которые затем могут быть прочитаны клиентскими приложениями, первый использует TaxonX-XML ^[15] , а второй использует формат taXMLit. Библиотека наследия биоразнообразия также добивается значительных успехов в достижении своей цели по оцифровке значительной части таксономической литературы, не защищенной авторским правом, которая затем подвергается оптическому распознаванию символов (OCR), чтобы ее можно было подвергнуть дальнейшей обработке с использованием инструментов информатики биоразнообразия.

Стандарты и протоколы

Как и другие дисциплины, связанные с данными, информатика биоразнообразия выигрывает от принятия соответствующих стандартов и протоколов для поддержки передачи информации между машинами и взаимодействия информации в рамках своей конкретной области. Примерами соответствующих стандартов являются схема Darwin Core XML для данных о биоразнообразии на основе образцов и наблюдений, разработанная с 1998 года, а также ее расширения, схема передачи таксономических концепций ^[16] , а также стандарты для структурированных описательных данных ^[17] и доступа к данным биологической коллекции (ABCD); ^[18] в то время как протоколы поиска и передачи данных включают DiGIR (сейчас в основном заменен) и TAPIR (протокол доступа TDWG для поиска информации). ^[19] Многие из этих стандартов и протоколов в настоящее время поддерживаются, а их разработка контролируется Стандартами информации о биоразнообразии (TDWG) .

Текущая деятельность

На конференции e-Biosphere 2009 года в Великобритании ^[20] были приняты следующие темы, которые свидетельствуют о широком спектре текущих мероприятий в области информатики биоразнообразия и о том, как их можно классифицировать:

Применение: Охрана природы / Сельское хозяйство / Рыболовство / Промышленность / Лесное хозяйство
Применение: инвазивные чужеродные виды
Применение: систематическая и эволюционная биология
Применение: Системы таксономии и идентификации
Новые инструменты, услуги и стандарты для управления данными и доступа к ним
- Новые инструменты моделирования
- Новые инструменты для интеграции данных
- Новые подходы к инфраструктуре биоразнообразия
- Новые подходы к идентификации видов
- Новые подходы к картированию биоразнообразия
Национальные и региональные базы данных и сети по биоразнообразию

Постконференционный семинар ключевых лиц, играющих в настоящее время важную роль в информатике биоразнообразия, также привел к принятию резолюции семинара, в которой, среди прочего, подчеркивалась необходимость создания надежных глобальных реестров для ресурсов, которые являются базовыми для информатики биоразнообразия (например, репозиториев, коллекций); завершения создания прочной таксономической инфраструктуры; и создания онтологий для данных о биоразнообразии. ^[21]

Примеры проектов

Глобальный:

Глобальный информационный фонд по биоразнообразию (GBIF) и Океаническая биогеографическая информационная система (OBIS) (для морских видов)
Проекты «Виды 2000» , «ИТИС» (Интегрированная таксономическая информационная система) и «Каталог жизни»
Глобальные имена
EOL , проект «Энциклопедия жизни»
Консорциум проекта «Штрихкод жизни»
Проект «Карта жизни»
Проект базы данных рептилий
Проект AmphibiaWeb
Универсальный биологический индексатор и органайзер uBio от Лаборатории морской биологии Вудс-Хоул
Индекс названий организмов (ION) от Clarivate Analytics, предоставляющий доступ к научным названиям таксонов из многочисленных журналов, индексируемых в Zoological Record
Временный регистр морских и неморских объектов (IRMNG)
ZooBank , реестр номенклатурных актов и соответствующей систематической литературы по зоологии
Index Nominum Genericorum — сборник опубликованных родовых названий организмов, охватываемых Международным кодексом ботанической номенклатуры , поддерживаемый Смитсоновским институтом в США.
Международный индекс названий растений
MycoBank , документирующий новые названия и комбинации грибов
Список прокариотических названий, имеющих место в номенклатуре ( LPSN ) — официальный реестр действительных названий бактерий и архей , как это предусмотрено Международным кодексом номенклатуры бактерий.
Проект Библиотеки наследия биоразнообразия — оцифровка литературы по биоразнообразию
Wikispecies , открытый (редактируемый сообществом) сборник таксономической информации, сопутствующий проект Википедии
TaxonConcept.org — проект связанных данных , объединяющий разрозненные базы данных видов
Институт естественных наук. Национальный университет Колумбии. Отдел виртуальных коллекций и информатики биоразнообразия
ANTABIF. Информационный центр по биоразнообразию Антарктики предоставляет бесплатный и открытый доступ к данным по биоразнообразию Антарктики в духе Договора об Антарктике.
Genesys , база данных генетических ресурсов растений, поддерживаемая в национальных, региональных и международных генных банках
VertNet, доступ к данным о первичной встречаемости позвоночных из наборов данных по всему миру.

Региональные/национальные проекты:

Фауна Европы
Атлас живой Австралии
Инфраструктура общеевропейских каталогов видов (PESI)
Симбиота
iDigBio , Интегрированные оцифрованные биоколлекции (США)
проект i4Life
Система информации о биоразнообразии Колумбии
Портал биоразнообразия Индии (IBP)
Портал биоразнообразия Бутана (BBP)
Идентификация и изучение водорослей в западной части Индийского океана (WIKWIO)
LifeWatch предлагается ESFRI как общеевропейская исследовательская (электронная) инфраструктура для поддержки исследований и разработки политики в области биоразнообразия.
Атлас жизни Вермонта

Список более 600 текущих мероприятий, связанных с информатикой о биоразнообразии, можно найти в базе данных TDWG «Проекты по информации о биоразнообразии мира». ^[22]

Смотрите также

Ссылки

^ Soberón, J., & Peterson, AT (2004). Информатика биоразнообразия: Управление и применение первичных данных о биоразнообразии. Philosophical Transactions of the Royal Society B: Biological Sciences, 359(1444), 689–698.
^ Кришталка Л., Хамфри ПС. (2000). «Могут ли музеи естественной истории запечатлеть будущее?». BioScience . 50 (7): 611–617. doi : 10.1641/0006-3568(2000)050[0611:CNHMCT]2.0.CO;2 . hdl : 1808/16508 .
^ Peterson AT, Vieglais D (2001). «Прогнозирование вторжений видов с использованием моделирования экологической ниши: новые подходы биоинформатики к решению насущной проблемы». BioScience . 51 (5): 363–371. doi : 10.1641/0006-3568(2001)051[0363:PSIUEN]2.0.CO;2 .
^ «Биоинформатика для биоразнообразия?». Наука . 289 : 2229–2440. 2000.
^ "Biodiversity Informatics". BMC Bioinformatics . 10 Suppl 14. 2009. Архивировано из оригинала 2010-01-27 . Получено 2009-11-15 .
^ ""Информатика биоразнообразия", Термин" . Получено 2009-08-06 .
^ Bisby FA; et al. (2000). «Тихая революция: информатика биоразнообразия и Интернет». Science . 289 (5488): 2309–2312. Bibcode :2000Sci...289.2309B. doi :10.1126/science.289.5488.2309. PMID 11009408. S2CID 31852825.
^ "Каталог жизни - Ежегодный контрольный список 2016 года: Ежегодный контрольный список 2016 года". www.catalogueoflife.org . Получено 08.09.2021 .
^ "База данных палеобиологии" . Получено 2009-08-06 .
^ "К иерархии управления (классификации) для Каталога жизни. Проект документа для обсуждения д-ра Денниса П. Гордона, май 2009 г.". Архивировано из оригинала 2009-08-08 . Получено 2009-08-06 .
^ Руджеро, MA; Гордон, DP; Оррелл, TM; Бейли, N.; Бургуэн, T.; Бруска, RC; и др. (2015). «Классификация всех живых организмов более высокого уровня». PLOS ONE . 10 (4): e0119248. Bibcode : 2015PLoSO..1019248R. doi : 10.1371/journal.pone.0119248 . PMC 4418965. PMID 25923521 .
^ «Карты биоразнообразия: преобразование данных в визуальные инструменты для осмысленных действий по сохранению биоразнообразия -». 2016-11-30 . Получено 2022-05-05 .
^ Элит, Джейн; Франклин, Джанет (2013), «Моделирование распространения видов», Энциклопедия биоразнообразия , Elsevier, стр. 692–705, doi :10.1016/b978-0-12-384719-5.00318-x, ISBN 978-0-12-384720-1, S2CID 82987545 , получено 2022-05-05
^ Джетц, Уолтер; Макферсон, Яна М.; Гуральник, Роберт П. (2012). «Интеграция знаний о распределении биоразнообразия: к глобальной карте жизни». Тенденции в экологии и эволюции . 27 (3): 151–159. doi : 10.1016/j.tree.2011.09.007 . PMID 22019413.
^ "TaxonX". SourceForge . Получено 2021-09-08 .
^ «Схема переноса таксономических концепций (TCS)». Стандарты информации о биоразнообразии (TDWG).
^ «Структурированные описательные данные». Стандарты информации о биоразнообразии (TDWG).
^ «Доступ к данным биологической коллекции (ABCD)». Стандарты информации о биоразнообразии (TDWG).
^ "GitHub - tdwg/tapir: Протокол доступа TDWG для поиска информации (TAPIR)". GitHub . 16 июня 2020 г. . Получено 08.09.2021 г.
^ "Главная". e-biosphere09.org .
^ "Архивная копия" (PDF) . www.e-biosphere09.org . Архивировано из оригинала (PDF) 26 февраля 2012 г. . Получено 12 января 2022 г. .{{cite web}}: CS1 maint: архивная копия как заголовок ( ссылка )
^ "TDWG: Biodiversity Information Projects of the World". www.tdwg.org . Архивировано из оригинала 14 июля 2009 г. Получено 12 января 2022 г.

Дальнейшее чтение

Рабочая группа Форума Мегасайенс ОЭСР по биологической информатике (1999). Заключительный отчет Рабочей группы Форума Мегасайенс ОЭСР по биологической информатике, январь 1999 г. стр. 1–74. Архивировано из оригинала 2009-03-05 . Получено 2018-03-21 .
Canhos, VP; Souza, S.; Giovanni, R. & Canhos, DAL (2004). «Глобальная информатика биоразнообразия: создание сцены для «нового мира» экологического моделирования». Biodiversity Informatics . 1 : 1–13. doi : 10.17161/bi.v1i0.3 .
Soberón, J. & Peterson, AT (2004). «Информатика биоразнообразия: управление и применение первичных данных о биоразнообразии». Phil. Trans. R. Soc. Lond . B359 (1444): 689–698. doi :10.1098/rstb.2003.1439. PMC 1693343. PMID 15253354 .
Chapman, AD (2005). Uses of Primary Species-Occurrence Data (PDF) . Копенгаген: Глобальный информационный фонд по биоразнообразию. стр. 1–106. Архивировано из оригинала (PDF) 2010-02-16 . Получено 2009-08-12 .
Джонсон, Н. Ф. (2007). «Информатика биоразнообразия». Annual Review of Entomology . 52 : 421–438. doi : 10.1146/annurev.ento.52.110405.091259. PMID 16956323.
Sarkar, IN (2007). «Информатика биоразнообразия: организация и связывание информации по всему спектру жизни». Briefings in Bioinformatics . 8 (5): 347–357. doi : 10.1093/bib/bbm037 . hdl : 1912/1781 . PMID 17704120.
Гуральник, Р. П.; Хилл, А. (2009). «Информатика биоразнообразия: автоматизированные подходы к документированию глобальных моделей и процессов биоразнообразия». Биоинформатика . 25 (4): 421–428. doi : 10.1093/bioinformatics/btn659 . PMID 19129210.

Внешние ссылки

Биоразнообразие Информатика (журнал)