Идентификатор цифрового объекта ( DOI ) — это постоянный идентификатор или дескриптор , используемый для уникальной идентификации различных объектов, стандартизированный Международной организацией по стандартизации (ISO). [1] DOI — это реализация системы дескрипторов ; [2] [3] они также вписываются в систему URI ( унифицированный идентификатор ресурса ). Они широко используются для идентификации академической, профессиональной и правительственной информации, такой как журнальные статьи, отчеты об исследованиях, наборы данных и официальные публикации.
Целью DOI является достижение своей цели — информационного объекта, к которому относится DOI. Это достигается путем привязки DOI к метаданным об объекте, например URL-адресу , по которому расположен объект. Таким образом, благодаря своей действенности и совместимости , DOI отличается от номеров ISBN или ISRC , которые являются только идентификаторами. Система DOI использует модель контента индексов для представления метаданных.
DOI документа остается фиксированным на протяжении всего срока его существования, тогда как его местоположение и другие метаданные могут меняться. Обращение к онлайн-документу по его DOI должно обеспечить более стабильную ссылку, чем прямое использование его URL-адреса. Но если его URL-адрес изменится, издатель должен обновить метаданные DOI, чтобы сохранить ссылку на URL-адрес. [4] [5] [6] Издатель несет ответственность за обновление базы данных DOI. Если они этого не сделают, DOI преобразуется в неработающую ссылку , в результате чего DOI станет бесполезным. [7]
Разработчиком и администратором системы DOI является Международный фонд DOI (IDF), который ввел ее в 2000 году. [8] Организации, соответствующие договорным обязательствам системы DOI и готовые заплатить за то, чтобы стать членом системы, могут DOI. [9] Система DOI реализуется через федерацию регистрационных агентств, координируемую IDF. [10] К концу апреля 2011 года более 50 миллионов имен DOI были присвоены примерно 4000 организациями, [11] а к апрелю 2013 года это число выросло до 85 миллионов имен DOI, присвоенных 9500 организациями.
DOI — это тип дескриптора системы дескрипторов, который принимает форму строки символов , разделенной на две части: префикс и суффикс, разделенные косой чертой.
prefix/suffix
Префикс идентифицирует владельца регистрации идентификатора, а суффикс выбирается владельцем регистрации и идентифицирует конкретный объект, связанный с этим DOI. В этих строках разрешено большинство допустимых символов Юникода , которые интерпретируются без учета регистра . Префикс обычно имеет вид 10.NNNN
, где NNNN
— число, большее или равное 1000
, предел которого зависит только от общего количества зарегистрировавшихся. [12] [13] Префикс может быть дополнительно разделен точками, например 10.NNNN.N
. [14]
Например, в имени DOI 10.1000/182
есть префикс 10.1000
и суффикс 182
. Часть префикса «10» отличает дескриптор как часть пространства имен DOI, в отличие от какого-либо другого пространства имен системы дескрипторов, [A] , а символы 1000
в префиксе идентифицируют регистранта; в этом случае регистрантом является сам Международный фонд DOI. 182
— это суффикс или идентификатор элемента, идентифицирующий один объект (в данном случае, последнюю версию Справочника DOI ).
Имена DOI могут идентифицировать творческие произведения (такие как тексты, изображения, аудио- или видеоматериалы и программное обеспечение) как в электронной, так и в физической форме, исполнения и абстрактные произведения [15] , такие как лицензии, стороны сделки и т. д.
Имена могут относиться к объектам с разным уровнем детализации: таким образом, имена DOI могут идентифицировать журнал, отдельный выпуск журнала, отдельную статью в журнале или отдельную таблицу в этой статье. Выбор уровня детализации остается за правопреемником, но в системе DOI он должен быть объявлен как часть метаданных, связанных с именем DOI, с использованием словаря данных, основанного на модели содержимого индексов .
В официальном справочнике DOI прямо указано, что DOI должны отображаться на экранах и в печати в формате doi:10.1000/182
. [16]
Вопреки Справочнику DOI , CrossRef , крупное агентство по регистрации DOI, рекомендует отображать URL-адрес (например, https://doi.org/10.1000/182
) вместо официально указанного формата (например, doi:10.1000/182
) [17] [18] Этот URL-адрес является постоянным (существует договор, который обеспечивает сохранение в домене DOI.ORG), поэтому это PURL — предоставляющий местоположение прокси-сервера HTTP , который будет перенаправлять веб-доступ к правильному расположению связанного элемента в Интернете. [9] [19]
Рекомендация CrossRef в первую очередь основана на предположении, что DOI отображается без гиперссылки на соответствующий URL-адрес — аргумент заключается в том, что без гиперссылки не так просто скопировать и вставить полный URL-адрес, чтобы фактически открыть страницу. для DOI, поэтому должен отображаться весь URL-адрес, позволяя людям, просматривающим страницу, содержащую DOI, вручную скопировать и вставить URL-адрес в новое окно/вкладку своего браузера, чтобы перейти на соответствующую страницу для документ, который представляет DOI. [20]
Поскольку DOI — это пространство имен в системе дескрипторов , семантически правильно представлять его как URI info:doi/10.1000/182
.
Основное содержание системы DOI в настоящее время включает в себя:
В службе публикаций OECD iLibrary Организации экономического сотрудничества и развития каждая таблица или график в публикации ОЭСР отображается с именем DOI, которое ведет к файлу Excel с данными, лежащим в основе таблиц и графиков. Планируется дальнейшее развитие подобных сервисов. [22]
Другие реестры включают Crossref и многоязычное Европейское агентство регистрации DOI (mEDRA) . [23] С 2015 года на RFC можно ссылаться как . [24]doi:10.17487/rfc...
IDF разработала систему DOI, обеспечивающую форму постоянной идентификации , в которой каждое имя DOI постоянно и однозначно идентифицирует объект, с которым оно связано (хотя при смене издателя журнала иногда все DOI будут изменены, при этом старые DOI больше не работают). Он также связывает метаданные с объектами, позволяя предоставлять пользователям соответствующую информацию об объектах и их отношениях. В состав этих метаданных включены сетевые действия, которые позволяют сопоставлять имена DOI с веб-локациями, где можно найти описываемые ими объекты. Для достижения своих целей система DOI объединяет систему дескрипторов и модель контента индексов с социальной инфраструктурой.
Система дескрипторов гарантирует, что имя DOI объекта не основано на каких-либо изменяемых атрибутах объекта, таких как его физическое местоположение или право собственности, что атрибуты объекта закодированы в его метаданных, а не в его имени DOI, и что нет двум объектам присвоено одно и то же имя DOI. Поскольку имена DOI представляют собой короткие строки символов, они удобочитаемы, могут копироваться и вставляться как текст и соответствуют спецификации URI . Механизм разрешения имен DOI действует «за кулисами», поэтому пользователи взаимодействуют с ним так же, как с любым другим веб-сервисом; Он построен на открытой архитектуре , включает в себя механизмы доверия и спроектирован так, чтобы работать надежно и гибко, поэтому его можно адаптировать к меняющимся требованиям и новым приложениям системы DOI. [25] Разрешение имен DOI может использоваться с OpenURL для выбора наиболее подходящего из нескольких местоположений для данного объекта в соответствии с местоположением пользователя, делающего запрос. [26] Однако, несмотря на эту возможность, система DOI вызвала критику со стороны библиотекарей за то, что она направляла пользователей к платным копиям документов, которые можно было бы получить без дополнительной платы из альтернативных мест. [27]
Модель содержимого индексов , используемая в системе DOI, связывает метаданные с объектами. Небольшое ядро общих метаданных используется всеми именами DOI и может быть дополнительно расширено другими соответствующими данными, которые могут быть общедоступными или ограниченными. Зарегистрированные лица могут обновлять метаданные для своих имен DOI в любое время, например, при изменении информации о публикации или при перемещении объекта на другой URL-адрес.
Международный фонд DOI (IDF) курирует интеграцию этих технологий и работу системы через техническую и социальную инфраструктуру. Социальная инфраструктура федерации независимых регистрационных агентств, предлагающих услуги DOI, была смоделирована на основе существующего успешного федеративного внедрения таких идентификаторов, как GS1 и ISBN .
Имя DOI отличается от широко используемых интернет-указателей на материалы, таких как унифицированный указатель ресурсов (URL), тем, что оно идентифицирует сам объект как первоклассную сущность , а не конкретное место, где объект находится в определенное время. . Он реализует концепцию Uniform Resource Identifier ( Uniform Resource Name ) и добавляет к ней модель данных и социальную инфраструктуру. [28]
Имя DOI также отличается от стандартных реестров идентификаторов, таких как ISBN , ISRC и т. д. Цель реестра идентификаторов — управлять заданной коллекцией идентификаторов, тогда как основная цель системы DOI — сделать коллекцию идентификаторов действенной и совместимые, где эта коллекция может включать идентификаторы из многих других контролируемых коллекций. [29]
Система DOI предлагает постоянное, семантически интероперабельное разрешение связанных текущих данных и лучше всего подходит для материалов, которые будут использоваться в услугах, находящихся вне прямого контроля выдающего правопреемника (например, публичное цитирование или управление ценным контентом). Он использует управляемый реестр (обеспечивающий социальную и техническую инфраструктуру). Он не предполагает какой-либо конкретной бизнес-модели для предоставления идентификаторов или услуг и позволяет другим существующим службам ссылаться на него определенными способами. Было предложено несколько подходов к обеспечению постоянного хранения идентификаторов. Сравнение подходов с постоянными идентификаторами затруднено, поскольку не все они делают одно и то же. Неточное наименование набора схем «идентификаторами» не означает, что их можно легко сравнивать. Другие «системы идентификации» могут использовать технологии с низкими барьерами для входа, обеспечивая простой в использовании механизм маркировки, который позволяет любому создать новый экземпляр (примеры включают постоянный унифицированный указатель ресурсов (PURL), URL-адреса, глобальные уникальные идентификаторы (GUID) и т. д.), но может отсутствовать часть функциональности схемы, контролируемой реестром, и обычно в контролируемой схеме отсутствуют сопутствующие метаданные. В системе DOI нет такого подхода, и ее не следует напрямую сравнивать с такими схемами идентификаторов. Были разработаны различные приложения с использованием таких технологий с дополнительными функциями, которые соответствуют некоторым функциям, предлагаемым системой DOI для конкретных секторов (например, ARK ).
Имя DOI не зависит от местоположения объекта и, таким образом, похоже на универсальное имя ресурса (URN) или PURL, но отличается от обычного URL-адреса. URL-адреса часто используются в качестве альтернативных идентификаторов документов в Интернете, хотя один и тот же документ в двух разных местах имеет два URL-адреса. Напротив, постоянные идентификаторы, такие как имена DOI, идентифицируют объекты как объекты первого класса: два экземпляра одного и того же объекта будут иметь одно и то же имя DOI.
Разрешение имен DOI обеспечивается посредством системы Handle , разработанной Корпорацией национальных исследовательских инициатив , и доступно бесплатно любому пользователю, встретившему имя DOI. Разрешение перенаправляет пользователя от имени DOI к одной или нескольким частям типизированных данных: URL-адресам, представляющим экземпляры объекта, службам, таким как электронная почта, или одному или нескольким элементам метаданных. Для системы дескрипторов имя DOI является дескриптором, поэтому ему присвоен набор значений, и его можно рассматривать как запись, состоящую из группы полей. Каждое значение дескриптора должно иметь тип данных, указанный в его <type>
поле, который определяет синтаксис и семантику его данных. Хотя DOI постоянно и уникально идентифицирует объект, которому он назначен, разрешение DOI может быть непостоянным из-за технических и административных проблем.
Чтобы разрешить имя DOI, его можно ввести в преобразователь DOI, например doi.org.
Другой подход, который позволяет избежать ввода или вырезания и вставки в преобразователь, заключается в включении DOI в документ в виде URL-адреса, который использует преобразователь в качестве HTTP-прокси, например https://doi.org/
(предпочтительно) [30] или http://dx.doi.org/
, оба из которых поддерживают HTTPS. . Например, DOI 10.1000/182
можно включить в ссылку или гиперссылку как https://doi.org/10.1000/182
. Этот подход позволяет пользователям нажимать на DOI как на обычную гиперссылку . Действительно, как упоминалось ранее, именно так CrossRef рекомендует всегда представлять DOI (предпочитая HTTPS вместо HTTP), чтобы, если их вырезать и вставлять в другие документы, электронные письма и т. д., они были действенными.
Другие преобразователи DOI и HTTP-прокси включают Handle System и PANGEA . В начале 2016 года http://doai.io запустил новый класс альтернативных преобразователей DOI. Этот сервис необычен тем, что он пытается найти версию названия, не защищенную платным доступом (часто заархивированную автором ), и перенаправляет пользователя на нее, а не на версию издателя . [31] [32] С тех пор были созданы другие преобразователи DOI с открытым доступом, в частности https://oadoi.org/ в октябре 2016 года [33] (позже Unpaywall ). В то время как традиционные преобразователи DOI полагаются исключительно на систему дескрипторов, альтернативные преобразователи DOI сначала обращаются к ресурсам открытого доступа, таким как BASE (Bielefeld Academic Search Engine). [31] [33]
Альтернативой HTTP-прокси является использование одного из множества надстроек и плагинов для браузеров , избегая тем самым преобразования DOI в URL-адреса, [34] которые зависят от доменных имен и могут быть изменены, но при этом позволяя рассматривать DOI как обычную гиперссылку. Недостатком этого подхода для издателей является то, что, по крайней мере в настоящее время, большинство пользователей будут сталкиваться с DOI в браузере, программе для чтения почты или другом программном обеспечении, в котором не установлен ни один из этих плагинов.
Международный фонд DOI ( IDF ), некоммерческая организация, созданная в 1998 году, является органом управления системой DOI. [35] Он защищает все права интеллектуальной собственности , относящиеся к системе DOI, управляет общими операционными функциями и поддерживает развитие и продвижение системы DOI. IDF гарантирует, что любые улучшения, внесенные в систему DOI (включая создание, обслуживание, регистрацию, разрешение и разработку политики имен DOI), доступны любому лицу, зарегистрировавшему DOI. Это также не позволяет третьим лицам налагать дополнительные лицензионные требования, помимо требований IDF, к пользователям системы DOI.
IDF контролируется Советом, избираемым членами Фонда, с назначенным управляющим агентом, который отвечает за координацию и планирование его деятельности. Членство открыто для всех организаций, заинтересованных в электронных публикациях и связанных с ними технологиях. IDF проводит ежегодные открытые встречи по темам DOI и связанным с ними вопросам.
Регистрационные агентства, назначенные IDF, предоставляют услуги владельцам регистрации DOI: они выделяют префиксы DOI, регистрируют имена DOI и предоставляют необходимую инфраструктуру, позволяющую владельцам регистрации объявлять и поддерживать метаданные и государственные данные. Ожидается, что регистрационные агентства также будут активно способствовать широкому внедрению системы DOI, сотрудничать с IDF в разработке системы DOI в целом и предоставлять услуги от имени своего конкретного сообщества пользователей. Список действующих RA поддерживается Международным фондом DOI. IDF признан одним из федеративных регистраторов системы дескрипторов Фондом DONA (членом правления которого является IDF) и отвечает за присвоение префиксов системы дескрипторов под префиксом верхнего уровня 10
. [36]
Регистрационные агентства обычно взимают плату за присвоение нового имени DOI; часть этих сборов используется для поддержки ЦАХАЛа. В целом система DOI через IDF работает на некоммерческой основе возмещения затрат.
Система DOI — это международный стандарт, разработанный Международной организацией по стандартизации в ее техническом комитете по идентификации и описанию TC46/SC9. [37] Проект международного стандарта ISO/DIS 26324 « Информация и документация – Система цифровой идентификации объектов» соответствует требованиям ISO для утверждения. Соответствующая рабочая группа ISO позже представила в ISO отредактированную версию для распространения в виде бюллетеня для голосования FDIS (Окончательный проект международного стандарта), [38] который был одобрен 100% голосовавших в бюллетене, завершившемся 15 ноября 2010 года. [ 39 ] окончательный вариант стандарта был опубликован 23 апреля 2012 г. [1]
DOI — это зарегистрированный URI в соответствии со схемой info URI , определенной IETF RFC 4452. info:doi/ — это пространство имен infoURI для цифровых идентификаторов объектов. [40]
Синтаксис DOI — это стандарт NISO , впервые стандартизированный в 2000 году, синтаксис ANSI/NISO Z39.84-2005 для цифрового идентификатора объекта. [41]
Сопровождающие системы DOI намеренно не зарегистрировали пространство имен DOI для URN , заявив, что:
Архитектура URN предполагает использование службы обнаружения разрешений (RDS) на основе DNS для поиска службы, соответствующей данной схеме URN. Однако в настоящее время не существует таких широко распространенных схем RDS... DOI не регистрируется как пространство имен URN, несмотря на выполнение всех функциональных требований, поскольку регистрация URN, по-видимому, не дает никаких преимуществ системе DOI. Требуется дополнительный уровень администрирования для определения DOI как пространства имен URN (строка,
urn:doi:10.1000/1
а не более простой вариантdoi:10.1000/1
) и дополнительный шаг ненужного перенаправления для доступа к службе разрешения, что уже достигается либо через http-прокси, либо через собственное разрешение. Если механизмы RDS, поддерживающие спецификации URN, станут широко доступными, DOI будет зарегистрирован как URN.- Международный фонд DOI, Информационный бюллетень: Спецификации системы DOI и интернет-идентификаторов.
Если предположить, что издатели выполняют свою работу по поддержанию баз данных, эти централизованные ссылки, в отличие от текущих веб-ссылок, никогда не должны устаревать или выходить из строя.
Все префиксы DOI начинаются с «10», чтобы отличить DOI от других реализаций системы дескрипторов, за которыми следует четырехзначное число или строка (при необходимости префикс может быть длиннее).
Более 18 000 префиксов имен DOI в системе DOI.
При желании код регистранта можно дополнительно разделить на подэлементы для удобства администрирования. Каждому подэлементу кода регистранта должна предшествовать точка.