PRONOM ( Public Record Office и Nôm 喃) [1] — это веб -технический реестр для поддержки услуг по цифровому сохранению , разработанный Национальным архивом Соединенного Королевства . PRONOM был первым и на сегодняшний день остается единственным действующим публичным реестром форматов файлов в мире, [2] [3] хотя репозиторий «Magic File» File Command выполнял эту роль в менее официальном качестве в течение двух десятилетий. Другие проекты по разработке технических реестров, включая Реестр информации о представлении Центра цифрового курирования Великобритании и проект Глобального реестра цифровых форматов в Гарвардском университете , в настоящее время находятся в стадии реализации.
Истоки PRONOM лежат в требовании иметь доступ к надежной технической информации об электронных записях, хранящихся в Национальном архиве. По определению, электронные записи не являются изначально читаемыми человеком - форматы файлов кодируют информацию в форму, которая может быть обработана и сделана понятной только очень специфическими технологическими средами. Поэтому доступность этой информации крайне уязвима для технологического устаревания . Техническая информация о структуре этих форматов файлов, а также программных и аппаратных средах, необходимых для их поддержки, является предпосылкой для любого режима цифрового сохранения. [4] PRONOM был разработан для предоставления этой функции, изначально как внутренний ресурс для сотрудников Национального архива, а впоследствии как публичный веб-ресурс.
Первая версия PRONOM была разработана отделом цифрового сохранения Национального архива под руководством Дэвида Райана в марте 2002 года. PRONOM 2 был выпущен в декабре 2002 года и обеспечил поддержку разработки многоязычных версий реестра. Веб-подключение PRONOM (PRONOM 3) в феврале 2004 года стало отправной точкой для развития PRONOM как основного онлайн-ресурса для международного сообщества цифрового сохранения. [5] [6]
PRONOM 4, выпущенный в октябре 2005 года, включает в себя существенную переработку базовой модели данных, что позволяет собирать подробную техническую информацию о форматах файлов и поддерживать будущую совместимость с другими планируемыми системами реестров, а также выпуск программного обеспечения DROID для автоматической идентификации форматов файлов.
Последняя версия PRONOM 5 была относительно небольшим обновлением для поддержки улучшений DROID и была выпущена в 2006 году. Гораздо более существенное обновление запланировано на 2007 год, которое будет включать в себя представление основных функций PRONOM через интерфейсы веб-сервисов . Эта работа является частью программы Seamless Flow, направленной на то, чтобы Национальный архив мог получать и управлять будущими правительственными записями в электронных форматах.
В 2007 году Национальный архив получил премию Digital Preservation Award, спонсируемую Digital Preservation Coalition , за свою работу над PRONOM и DROID. [7]
Проект Global Digital Format Registry , начатый в Гарварде в 2005 году, в конечном итоге был объединен с PRONOM в совместный проект Unified Digital Format Registry . Однако в 2012 году UDFR был законсервирован, что привело к тому, что Калифорнийская цифровая библиотека в конечном итоге удалила доступ к своему узлу в 2016 году и рекомендовала использовать PRONOM.
Основной технический реестр поддерживает ряд конкретных услуг:
Реестр PRONOM предоставляет поисковую веб-базу данных технической информации о форматах файлов, программных инструментах, необходимых для доступа к ним, и технических средах, необходимых для доступа к ним. Пользователи могут искать форматы и программное обеспечение, используя различные критерии, такие как имя формата или программного обеспечения и расширение файла . PRONOM также содержит информацию о периодах поддержки программных продуктов, и также может быть запрошен на этой основе. В дополнение к просмотру на экране, информацию реестра можно экспортировать в форматах XML , CSV и форматах, удобных для печати. Веб-сайт PRONOM позволяет пользователям отправлять новую информацию для включения в PRONOM.
Постоянный уникальный идентификатор PRONOM (PUID) — это расширяемая схема постоянных, уникальных и однозначных идентификаторов для записей в реестре PRONOM. Такие идентификаторы имеют основополагающее значение для обмена и управления цифровыми объектами, позволяя человеческим или автоматизированным агентам пользователей однозначно идентифицировать и делиться этой идентификацией информации о представлении, необходимой для поддержки доступа к объекту. Это является достоинством как присущей уникальности идентификатора, так и его привязки к определенному описанию информации о представлении в реестре, таком как PRONOM.
В настоящее время схема PUID ограничена одним конкретным классом информации представления: форматом , в котором закодирован цифровой объект. Форматы считались особым приоритетом для такой схемы, поскольку ни одна существующая универсально применимая система не обеспечивает этого. Магические числа Unix и форки данных Macintosh предоставляют часть этой функциональности, но то же самое не относится к средам DOS или Microsoft Windows . Трехсимвольное расширение файла не является ни стандартизированным, ни уникальным и по-разному интерпретируется различными средами. Аналогично, схема типа IANA MIME не обеспечивает достаточной детализации или покрытия для удовлетворения требований к уникальным идентификаторам. Схема PUID была разработана с единственной целью — предоставления таких идентификаторов.
Схема была принята в качестве рекомендуемой схемы кодирования для описания форматов файлов в последней версии Стандарта метаданных электронного правительства Великобритании . [8] Схема разработана с возможностью расширения и может быть расширена в будущем для включения других классов информации о представлении в PRONOM, таких как методы сжатия , схемы кодирования символов и операционные системы .
PUID могут быть выражены как Uniform Resource Identifiers с использованием info:pronom/
пространства имен, сведения о котором доступны в реестре info URI. Ни схема PUID, ни ее выражение как info URI не поддерживают какой-либо встроенный механизм разыменования, т. е. PUID не разрешается в Uniform Resource Locator . Однако Национальный архив планирует разработать ряд сервисов для раскрытия содержимого реестра PRONOM, включая сервис разрешения для PUID.
DROID (Digital Record Object Identification) — это программный инструмент, разработанный Национальным архивом для выполнения автоматизированной пакетной идентификации форматов файлов. Это один из запланированных рядов инструментов, использующих PRONOM для предоставления определенных услуг по цифровому сохранению. DROID использует внутренние (последовательность байтов) и внешние (расширение файла) подписи для идентификации и сообщения о конкретных версиях формата файла цифровых файлов. Эти подписи хранятся в файле подписей XML, созданном на основе информации, записанной в техническом реестре PRONOM. Новые и обновленные подписи регулярно добавляются в PRONOM, и DROID можно настроить для автоматической загрузки обновленных файлов подписей с веб-сайта PRONOM через веб-службы .
DROID позволяет выбирать файлы и папки из файловой системы для идентификации. После запуска процесса идентификации результаты могут быть выведены в форматах XML , CSV или в формате, удобном для печати.
DROID — это платформенно-независимый инструмент Java . Он включает в себя документированный, публичный API и может быть вызван как из графического интерфейса , так и из командной строки .
Предлагаемые будущие услуги включают оценку риска формата и планирование сохранения, а также автоматизированную генерацию путей миграции для преобразования между форматами. [9]