Кодированное архивное описание ( EAD ) — это стандарт кодирования описательной информации, касающейся архивных записей. [1]
Архивные записи отличаются от элементов в библиотечной коллекции, поскольку они уникальны, обычно не опубликованы и недоступны в других местах, а также поскольку они существуют как часть коллекции, которая их объединяет. [2] По этим причинам архивное описание включает иерархический и прогрессивный анализ, который подчеркивает интеллектуальную структуру и содержание коллекции и не всегда распространяется на уровень отдельных элементов внутри нее. [3]
После развития технологий в середине-конце 1980-х годов, которые позволили осуществлять описательное кодирование машиночитаемых результатов, стало возможным рассмотреть разработку цифровых средств поиска для архивов. [1] Работа над стандартом кодирования для архивного описания началась в 1992 году в Калифорнийском университете в Беркли , а в 1998 году была выпущена первая версия EAD. [4] Вторая версия была выпущена в 2002 году, а последняя версия, EAD3, была выпущена в августе 2015 года. [5] Общество американских архивистов и Библиотека Конгресса несут совместную ответственность за поддержание и развитие EAD. [6]
В настоящее время EAD используется архивами, библиотеками, музеями, национальными библиотеками и историческими обществами по всему миру. [1] Благодаря стандартизированной системе кодирования описаний архивных поисковых средств EAD позволяет пользователям находить первоисточники, которые географически удалены. [7] На самом высоком уровне поисковое средство EAD включает в себя контрольную информацию об описании, а также описание самой коллекции. [8] EAD3 был пересмотрен в 2018 году для решения проблем, связанных с простотой доступа к архивным описаниям и его способностью взаимодействовать с другими системами. [5] [9]
Архивы по своей природе отличаются от библиотек. В то время как библиотеки содержат отдельные элементы, такие как книги и журналы, которые существуют в нескольких идентичных копиях, архивы содержат записи, которые являются как уникальными, так и взаимосвязанными. [10] Архивы представляют деятельность человека, семьи или организации, которая создается и накапливается естественным образом в ходе их обычной деятельности. [10] Таким образом, в отличие от элементов в библиотеке, все элементы в архивной коллекции имеют связь. [2] Весь массив записей организации, семьи или отдельного лица был создан и накоплен как побочный продукт существования организации или отдельного лица и, следовательно, имеет общее происхождение, которое архивисты называют его происхождением ; происхождение относится как к происхождению элемента или коллекции, так и к его хранению и владению. [11] Архивисты называют весь массив или записи отдельного лица или организации его фондом ; таким образом, фонд является концептуальным целым, которое отражает процесс производства или накопления записей, которые имеют общую функцию или деятельность и демонстрируют естественное единство. [11] Фонд может содержать от одного элемента до миллионов элементов и может быть представлен в любой форме, включая рукописи, диаграммы, чертежи, карты, аудио-, видео- или электронные записи. [ 10]
Поскольку опубликованные материалы существенно и фундаментально отличаются от коллекций взаимосвязанных и уникальных материалов, найденных в архивах, существуют значительные различия в библиографическом и архивном описании. [10] Библиографическое описание представляет собой отдельный опубликованный элемент, основано на физическом элементе и выведено из него, и, таким образом, считается уровнем элемента. [3] Архивное описание, напротив, представляет собой коллекцию или фонд, часто содержащий отдельные элементы различных носителей, имеющие общее происхождение или провенанс. [12] Таким образом, описание архивных материалов включает в себя сложный иерархический и прогрессивный анализ. [3] Оно начинается с описания целого, затем переходит к подкомпонентам; описание часто не распространяется на уровень элемента. [13] Таким образом, архивное описание фокусируется на интеллектуальной структуре и содержании коллекции, а не на ее физических характеристиках. [14]
Справочное пособие — это инструмент, который помогает пользователям находить материалы в архиве с помощью описания его содержимого. [11] Большинство справочных пособий предоставляют схожие типы информации, включая, как минимум, название, связывающее справочное пособие с создателем коллекции; краткое изложение материала, содержащегося в справочном пособии; предысторию и контекст коллекции, включая основные задействованные фигуры; и информацию о хранении коллекции, а также о любых условиях или ограничениях, касающихся ее использования. [15]
Уникальная природа архивных записей и географическое распределение отдельных коллекций представляли собой проблему для тех, кто хотел найти их и получить к ним доступ на протяжении более 150 лет. [7] Однако с появлением международных сетевых вычислений и онлайн-каталогов появилась возможность сделать архивные коллекции доступными для поиска в Интернете. [13]
EAD возник на ежегодном собрании Общества американских архивистов в Новом Орлеане в 1993 году и возглавлялся Дэниелом Питти в Калифорнийском университете в Беркли . [16] Целью проекта было создание стандарта данных для описания архивов, аналогичного стандартам MARC для описания библиографических материалов. Первоначальная версия EAD 1.0 была выпущена осенью 1998 года. [17] Такой стандарт позволяет архивам , музеям , библиотекам и хранилищам рукописей перечислять и описывать свои фонды таким образом, чтобы их можно было считывать машинами и, следовательно, было бы легко искать, поддерживать и обменивать. [18] С момента его создания многие архивы и специальные коллекции приняли его.
В дополнение к работе по разработке и обслуживанию, проделанной Обществом американских архивистов и Библиотекой Конгресса, Группа исследовательских библиотек (RLG) разработала и опубликовала набор руководств по внедрению «Лучшей практики» [19] для EAD, в котором изложены обязательные, рекомендуемые и необязательные элементы и атрибуты. RLG также предоставила своего рода клиринговый центр для поисковых средств в формате EAD, известный как ArchiveGrid . Библиотеки-участники предоставляют RLG URL для своих поисковых средств; RLG автоматически собирает данные из поисковых средств, индексирует их и предоставляет интерфейс поиска для индекса, таким образом давая исследователям возможность выполнять поиск в коллекциях нескольких сотен учреждений с помощью одного запроса. RLG также разработала «Карту отчетов RLG» [20] — автоматизированную программу проверки качества, которая будет анализировать экземпляр EAD и сообщать о любых областях, где он отклоняется от руководств по передовой практике.
Технический подкомитет SAA по кодированному архивному описанию, включающий международное представительство, приступил к пересмотру стандарта EAD в 2010 году. [21] Последняя версия, EAD3, была выпущена в августе 2015 года. [22]
Ряд хранилищ в Соединенных Штатах , Канаде , Великобритании , Франции , Австралии и других странах приняли и внедрили EAD с разным уровнем технической сложности. Одним из самых амбициозных начинаний является Онлайн-архив Калифорнии , объединенный каталог из более чем 5000 поисковых средств EAD, охватывающих рукописи и изображения из учреждений по всему штату. Французская национальная библиотека Франсуа Миттерана публикует более 90 000 поисковых средств EAD, охватывающих архивы и рукописи. [ необходима цитата ]
XML-схема стандарта EAD определяет элементы, которые будут использоваться для описания коллекции рукописей, а также расположение этих элементов (например, какие элементы являются обязательными или какие разрешены внутри каких других элементов). Набор тегов EAD содержит 146 элементов и используется как для описания коллекции в целом, так и для кодирования подробного многоуровневого перечня коллекции. Многие элементы EAD были или могут быть сопоставлены со стандартами контента (такими как DACS и ISAD(G) ) и другими структурными стандартами (такими как MARC или Dublin Core ), что повышает гибкость и совместимость данных. [23]
EAD 1.0 был определением типа документа SGML (DTD). EAD 2002, второе воплощение EAD, было завершено в декабре 2002 года и стало доступно как XML DTD. Последняя версия EAD, EAD3, доступна как в виде XML-схемы и DTD. [24]
Примечание: примеры в этом разделе относятся к схеме EAD2 и могут быть недействительны для схемы EAD3.
Примечание: в текущей версии EAD3 1.0 элемент eadheader был заменен элементом control. [25]
Первый раздел справочного пособия, закодированного в EAD, — это eadheader
. Этот раздел содержит title
и необязательную subtitle
коллекцию и подробную информацию о самом справочном пособии: кто его создал, когда он был создан, его историю изменений , язык, на котором написано справочное пособие, и т. д. eadheader
Сам по себе имеет ряд обязательных атрибутов, которые соответствуют различным стандартам ISO , таким как ISO 3166-1 для кодов стран и ISO 8601 для форматов дат.
И eadheader
его дочерние элементы могут быть сопоставлены с другими стандартами для простого обмена информацией. Они часто сопоставлены с элементами Dublin Core, такими как Создатель, Автор, Язык. Например, в приведенном ниже отрывке атрибут relatedencoding="DC"
элемента eadheader
указывает, что дочерние элементы будут сопоставлены с Dublin Core; дочерний элемент <author encodinganalog="Creator">
указывает, что элемент EAD <author>
сопоставлен с элементом Dublin Core <creator>
.
Пример eadheader
:
<eadheader auditor= "internal" countryencoding= "iso3166-1" dateencoding= "iso8601" langencoding= "iso639-2b" relatedencoding= "DC" repositoryencoding= "iso15511" scriptencoding= "iso15924" > <eadid countrycode= "us" identifier= "bachrach_lf" mainagencycode= "NSyU" > bachrach_lf </eadid> <filedesc> <titlestmt> < titleproper encodinganalog= "Заголовок" > Документы Луи Фабиана Бахраха </titleproper> <subtitle> Опись его документов в Университете Бланка </subtitle> < author encodinganalog= "Создатель" > Мэри Смит </author> </titlestmt> <publicationstmt> <publisher encodinganalog= "Издатель" > Университет Бланка </publisher> <date encodinganalog= "Дата" normal= "1981" > 1981 </date> </publicationstmt> </filedesc> <profiledesc> <creation> Джон Джонс <datenormal = "2006-09-13" > 13 сентября 2006 </date> </creation> <langusage> <languagecodinganalog = "Язык" langcode= "eng" > Английский </language> </langusage> </profiledesc> </eadheader>
Раздел archdesc
содержит описание самого материала коллекции. Во-первых, описательная идентификация или did
элемент содержит описание коллекции в целом, включая создателя (который может быть отдельным лицом или организацией), размер (обычно указывается в линейных футах), даты включительно, язык(и) и краткое или краткое описание. Как и в случае с eadheader
вышеизложенным, элементы могут быть сопоставлены с соответствующими стандартами; элементы в этом разделе обычно сопоставлены с элементами MARC. Например, в отрывке ниже атрибут relatedencoding="MARC21"
элемента archdesc
указывает, что дочерние элементы будут сопоставлены с MARC21; дочерний элемент <unittitle encodinganalog="245$a" label="Title: ">
указывает, что unittitle
элемент сопоставлен с полем MARC 245, подполем a.
Пример:
<archdesc level= " collection " type= "inventory" relatedencoding= "MARC21" > <did> <head> Обзор коллекции </head> <repository encodinganalog= "852$a" label= "Репозиторий: " > Университет Бланка </repository> <origination label= " Создатель: " > <persname encodinganalog= "100" > Брайтман, Сэмюэл К. (Сэмюэл Чарльз), 1911-1992 </persname> </origination> <unittitle encodinganalog= "245$a" label= "Название: " > Документы Сэмюэля К. Брайтмана </unittitle> <unitdate encodinganalog= "245$f" normal= "1932/1992" type= "inclusive" label= "Даты включительно: " > 1932-1992 </unitdate> <physdesc encodinganalog= "300$a" label = "Количество: " > <extent> 6 погонных футов. </extent> </physdesc> <abstract encodinganalog= "520$a" label= "Аннотация: " > Статьи американского журналиста , включая некоторые военные корреспонденции, политические и политические юмористические сочинения, а также образовательные материалы для взрослых </abstract> <unitid encodinganalog= "099" label= "Идентификация: " countrycode= "us" repositorycode= "NSyU" > 2458163 </unitid> <langmaterial label= "Язык: " encodinganalog= "546" > <language langcode= "eng" > Английский </language> </langmaterial> </did> </archdesc>
Далее могут следовать несколько дополнительных описательных элементов, did
включая:
bioghist
- биографическое описание человека или организацииscopecontent
- подробное повествовательное описание коллекционного материалаrelatedmaterial
- описание предметов, которые хранилище приобрело отдельно, но которые связаны с этой коллекцией и о которых исследователь может захотеть знатьseparatedmaterial
- предметы, которые хранилище приобрело как часть этой коллекции, но которые были отделены от нее, возможно, для особой обработки, хранения или каталогизацииcontrolaccess
- список предметных рубрик или ключевых слов для коллекции, обычно взятый из авторитетного источника, такого как предметные рубрики Библиотеки Конгресса или Тезаурус по искусству и архитектуреaccessrestrict
и userestrict
- заявление относительно любых ограничений на материал в коллекцииarrangement
- способ расположения материалов в коллекцииВторой и обычно самый большой раздел — это archdesc
, dsc
который содержит полный перечень коллекции, разбитый на все меньшие интеллектуальные части. EAD предлагает два варианта: c
элемент, который может быть вложен в себя до неограниченного уровня, и набор пронумерованных элементов-контейнеров, c01
через c12
которые может быть вложен только численно (т. е. a c01
может содержать только c02
; a c02
может содержать только c03
и т. д.). Обратите внимание, что элементы c
и c0#
относятся к интеллектуальным подразделениям материала; фактический физический контейнер указывается с помощью элемента container
. Перечень может быть настолько подробным, насколько это необходимо. В примере ниже показан перечень до уровня папки.
Пример инвентаризации:
<dsc type= "combined" ><head> Инвентарь </head> <c01> <did> <unittitle> Переписка </unittitle> </did> <c02> <did> <unittitle> Адамс, Марта </unittitle> <unitdate normal= "1962/1967" > 1962-1967 </unitdate> <container type= "box" > 1 </container> <container type= "folder" > 1 </container> </did> </c02> <c02> <did> <unittitle> Барнетт, Ричард </unittitle> <unitdate normal= "1965" > 1965 </unitdate> <container type= "box" > 1 </container> <container type= "folder" > 2 </container> </did> </c02> ...и т. д. </c01> <c01> <did> <unittitle> Сочинения </unittitle> </did> <c02> <did> <unittitle> Короткие рассказы </unittitle> <unitdate normal= "1959/1979" > 1959-1979 </unitdate> <container type= "box" > 5 </container> <container type= "folder" > 1-9 </container> </did> </c02> </c01> </dsc>
Были проведены некоторые исследования о том, как цитировать файлы EAD с переменной гранулярностью. В частности, Бунеман и Сильвелло [26] предложили систему на основе правил для автоматического создания фрагментов цитат, которые будут использоваться в качестве ссылок при цитировании XML-данных; исследование случая основано на EAD. Кроме того, Сильвелло [27] предложил структуру, которая, обучаясь на примерах, автоматически создает ссылки на разном уровне грубости для XML-файлов. Эта структура была протестирована на коллекции файлов EAD Библиотеки Конгресса.
Исследование пользователей [28], анализирующее модели взаимодействия пользователя с поисковыми средствами, показало, что «[они] сосредоточены на правилах описания, а не на облегчении доступа и использования материалов, которые они перечисляют и описывают», и что у многих пользователей архивов возникают серьезные проблемы с использованием поисковых средств. Обычные и частые модели взаимодействия пользователя с поисковыми средствами являются навигационными, и поэтому они требуют просмотра архивной иерархии, чтобы понять архивные данные. [29]
Некоторые критики утверждают, что EAD ограничивает взаимодействие исследователей, поскольку некоторые операции либо невозможны, либо неэффективны. [30] Например, проблематично:
Кроме того, EAD допускает несколько степеней свободы в практике тегирования, что может оказаться проблематичным при автоматической обработке файлов EAD, поскольку сложно заранее знать, как учреждение будет использовать иерархические элементы. Было подчеркнуто, что только файлы EAD, соответствующие строгим рекомендациям по передовой практике, могут быть общедоступными и доступными для поиска. [35]