Протокол Open Archives Initiative для сбора метаданных ( OAI-PMH ) — это протокол, разработанный для сбора описаний метаданных записей в архиве, чтобы можно было создавать сервисы с использованием метаданных из многих архивов. Реализация OAI -PMH должна поддерживать представление метаданных в Dublin Core , но может также поддерживать дополнительные представления. [1] [2]
Протокол обычно называют просто протоколом OAI.
OAI-PMH использует XML через HTTP . Версия протокола 2.0 была выпущена в 2002 году; последний раз документ обновлялся в 2015 году. Он имеет лицензию Creative Commons BY-SA.
В конце 1990-х годов Герберт Ван де Сомпель ( Гентский университет ) работал с исследователями и библиотекарями Лос-Аламосской национальной лаборатории (США) и созвал совещание для решения трудностей, связанных с проблемами совместимости серверов электронной печати и цифровых хранилищ . Встреча состоялась в Санта-Фе, штат Нью - Мексико , в октябре 1999 года . репозитории могли идентифицировать и копировать друг с другом интересующие документы. Этот интерфейс/протокол получил название «Конвенция Санта-Фе». [1] [2] [4]
Несколько семинаров были проведены в 2000 году на конференции ACM Digital Libraries, [5] на 1-й совместной конференции ACM/IEEE-CS по цифровым библиотекам [6] [7] и в других местах, чтобы поделиться идеями Конвенции Санта-Фе. [8] На семинарах было обнаружено, что проблемы, с которыми сталкивается сообщество электронной печати, также разделяются библиотеками, музеями, издателями журналов и другими лицами, которым необходимо совместно использовать распределенные ресурсы. Чтобы удовлетворить эти потребности, Коалиция сетевой информации [9] и Федерация цифровых библиотек [10] предоставили финансирование для создания секретариата Инициативы открытых архивов (OAI), которым руководят Герберт Ван де Сомпель и Карл Лагозе. OAI провело встречу в Корнеллском университете ( Итака, Нью-Йорк ) в сентябре 2000 года с целью улучшения интерфейса, разработанного на съезде в Санта-Фе. [11] Спецификации были уточнены по электронной почте.
Версия OAI-PMH 1.0 была представлена публике в январе 2001 года на семинаре в Вашингтоне, округ Колумбия , [12] и еще одном семинаре в феврале в Берлине, Германия . [13] Последующие изменения стандарта XML со стороны W3C потребовали внесения незначительных изменений в OAI-PMH, в результате чего появилась версия 1.1. Текущая версия 2.0 была выпущена в июне 2002 года. Она содержала несколько технических изменений и усовершенствований и не имеет обратной совместимости. [14]
С 2001 года ЦЕРН , а затем в сотрудничестве с Женевским университетом организовал два раза в год семинары OAI, [15] которые со временем стали охватывать большинство аспектов открытой науки . С 2021 года серия семинаров будет называться Женевским семинаром по инновациям в научной коммуникации, а псевдоним OAI отражает ее происхождение. [16]
Некоторые коммерческие поисковые системы используют OAI-PMH для получения дополнительных ресурсов. Первоначально Google включил поддержку OAI-PMH при запуске карт сайта, однако в мае 2008 года решил поддерживать только стандартный формат XML Sitemaps . [17] В 2004 году Yahoo! приобрел контент от OAIster ( Мичиганский университет ), полученный путем сбора метаданных с помощью OAI-PMH. Викимедиа использует репозиторий OAI-PMH для предоставления каналов Википедии и связанных с ней обновлений сайтов для поисковых систем и других задач массового анализа/переиздания. [18] Особенно при работе с тысячами файлов, собираемых каждый день, OAI-PMH может помочь снизить сетевой трафик и использование других ресурсов за счет поэтапного сбора данных. [19] Система поиска метаданных НАСА Mercury использует OAI-PMH для индексации тысяч записей метаданных из главного каталога глобальных изменений (GCMD) каждый день. [20]
Проект mod_oai использует OAI-PMH для предоставления веб-сканерам контента, доступного с веб-серверов Apache .
Позже OAI-PMH был применен для обмена научными данными. [21]
OAI-PMH основан на архитектуре клиент-сервер , в которой «сборщики» запрашивают информацию об обновленных записях из «хранилищ». Запросы данных могут основываться на диапазоне дат и ограничиваться именованными наборами, определенными поставщиком. Поставщики данных обязаны предоставлять метаданные XML в формате Dublin Core , а также могут предоставлять их в других форматах XML.
Ряд программных систем поддерживают OAI-PMH, включая Fedora , EThOS от Британской библиотеки , GNU EPrints от Университета Саутгемптона , Open Journal Systems от Public Knowledge Project , Desire2Learn , DSpace от MIT , HyperJournal от Пизанского университета , Digibib из Digibis, MyCoRe , Koha , Primo, DigiTool, Rosetta и MetaLib из Ex Libris , ArchivalWare из PTFS, DOOR [22] из eLab [23] в Лугано, Швейцария, panFMP из библиотеки данных PANGEA , [24] SimpleDL из Roaring Development и jOAI из Национального центра атмосферных исследований . [25]
Ряд крупных архивов поддерживают протокол, включая arXiv и Сервер документов CERN .
{{cite journal}}
: CS1 maint: дата и год ( ссылка ){{cite book}}
: CS1 maint: дата и год ( ссылка ){{cite book}}
: CS1 maint: дата и год ( ссылка )