Веб -архив Великобритании — это консорциум из шести библиотек обязательного экземпляра Великобритании , целью которого является сбор всех веб-сайтов Великобритании не реже одного раза в год. [1]
В 2005 году Британская библиотека , Национальный архив , Wellcome Trust , Национальная библиотека Шотландии , Национальная библиотека Уэльса и JISC сформировали Консорциум веб-архивирования Великобритании — проект по архивированию веб-сайтов. [3]
UKWAC архивировал избранные веб-сайты по лицензии или разрешению, используя программное обеспечение PANDAS , разработанное Национальной библиотекой Австралии . В ходе проекта его члены собирали сайты, соответствующие их интересам; библиотека Wellcome собирала медицинские сайты , сайты национальных библиотек, которые отражают жизнь в современном Уэльсе или Шотландии. Британская библиотека работала с широкой политикой сбора сайтов, имеющих культурное, историческое и политическое значение для Великобритании. [4]
Консорциум прекратил свое существование в 2010 году. Рабочая группа по архивированию и сохранению взяла на себя координирующую роль UKWAC в области веб-архивирования в Великобритании. Коалиция по цифровому сохранению принимает рабочую группу. [5]
Архив проводит ежегодный просмотр доменов .uk и других географических доменов верхнего уровня Великобритании, таких как .scot , .cymru или .london .
Сканирование архивируется в общей инфраструктуре, называемой Системой цифровой библиотеки . Члены общественности могут номинировать сайты для сохранения там через веб-сайт UKWA. Весь веб-архив доступен зарегистрированным читателям в помещениях библиотеки; и там, где было дано разрешение или могут быть выполнены условия лицензии, копии также доступны через веб-сайт. [6]
Архив собирает сайты, связанные с событиями, коллекции зданий — в них сохранились письменные и визуальные свидетельства стихийных бедствий, избирательные кампании с 2005 года и блогосфера Великобритании для исследований, а также более сотни других. [7]
Веб-архив Великобритании содержит коллекцию всех веб -сайтов .uk , которые были заархивированы Архивом Интернета до конца марта 2013 года. [8] SHINE — это веб-интерфейс , который можно использовать для создания повторяющихся списков результатов исторических страниц .uk. Тенденции , или вхождения ключевых слов в набор данных на страницах .uk за это время, используют соответствие , чтобы показать ключевые слова в контексте. [9]
Memento — это название предыдущих версий веб-страниц , придуманное Memento Project . Интерфейс UK Web Archive Memento позволяет находить Mementos в веб-архивах . [10] Интерфейс можно использовать для поиска Memento по его дате в таблице снимков или для просмотра того, как часто сайт появляется в публичных веб-архивах.
Исследование сети как отражения общества помогло развить доступ к архиву. [11] Библиотеки разработали руководства по навыкам исследования, необходимым для использования веб-архивов. Они включают использование больших данных для выявления закономерностей или тенденций, [12] или написание ссылок на архивные копии веб-сайтов. [13]
GLAM Workbench — это проект, который рассматривает, как исследователи могут использовать данные, сохраненные галереями, библиотеками, архивами и музеями. [14] Он включает в себя коллекцию блокнотов Jupyter , которые опираются на данные Mementos и индексов. [15] Блокноты сочетают описание и редактируемый код, чтобы помочь исследователям находить доказательства в веб-архивах.