stringtranslate.com

Веб-архив Великобритании

Веб -архив Великобритании — это консорциум из шести библиотек обязательного экземпляра Великобритании , целью которого является сбор всех веб-сайтов Великобритании не реже одного раза в год. [1]

История

В 2005 году Британская библиотека , Национальный архив , Wellcome Trust , Национальная библиотека Шотландии , Национальная библиотека Уэльса и JISC сформировали Консорциум веб-архивирования Великобритании — проект по архивированию веб-сайтов. [3]

UKWAC архивировал избранные веб-сайты по лицензии или разрешению, используя программное обеспечение PANDAS , разработанное Национальной библиотекой Австралии . В ходе проекта его члены собирали сайты, соответствующие их интересам; библиотека Wellcome собирала медицинские сайты , сайты национальных библиотек, которые отражают жизнь в современном Уэльсе или Шотландии. Британская библиотека работала с широкой политикой сбора сайтов, имеющих культурное, историческое и политическое значение для Великобритании. [4]

Консорциум прекратил свое существование в 2010 году. Рабочая группа по архивированию и сохранению взяла на себя координирующую роль UKWAC в области веб-архивирования в Великобритании. Коалиция по цифровому сохранению принимает рабочую группу. [5]

Веб-архивирование

Архив проводит ежегодный просмотр доменов .uk и других географических доменов верхнего уровня Великобритании, таких как .scot , .cymru или .london .

График, показывающий небольшую часть сканирования веб-сайта UK Web Archive. Каждый кружок — это отдельный веб-сайт, а каждая линия — это ссылка, по которой переходили между веб-сайтами. Размер кружка показывает, сколько страниц было посещено с этого сайта, а ширина линии — это количество переходов по ссылкам.
График, показывающий небольшую часть сканирования . Каждый кружок — это отдельный веб-сайт, а каждая линия — это ссылка, по которой переходили между веб-сайтами. Размер кружка показывает, сколько страниц было посещено с этого сайта, а ширина линии — количество ссылок, по которым переходили. Сканирование UKWA: один час за одну минуту

Сканирование архивируется в общей инфраструктуре, называемой Системой цифровой библиотеки . Члены общественности могут номинировать сайты для сохранения там через веб-сайт UKWA. Весь веб-архив доступен зарегистрированным читателям в помещениях библиотеки; и там, где было дано разрешение или могут быть выполнены условия лицензии, копии также доступны через веб-сайт. [6]

Архив собирает сайты, связанные с событиями, коллекции зданий — в них сохранились письменные и визуальные свидетельства стихийных бедствий, избирательные кампании с 2005 года и блогосфера Великобритании для исследований, а также более сотни других. [7]

СВЕТИТЬ

График, показывающий процент набора данных, в котором встречаются фразы «ошибка тысячелетия» или «проблема 2000 года», в период с 1996 по 2013 год. Обе тенденции достигают максимума в 1999 году, после чего следует спад, имеющий примерно одинаковую форму.
График SHINE, показывающий, как часто различные фразы для « проблемы 2000 года » появлялись в период с 1996 по 2013 год на архивных веб-страницах .uk.

Веб-архив Великобритании содержит коллекцию всех веб -сайтов .uk , которые были заархивированы Архивом Интернета до конца марта 2013 года. [8] SHINE — это веб-интерфейс , который можно использовать для создания повторяющихся списков результатов исторических страниц .uk. Тенденции , или вхождения ключевых слов в набор данных на страницах .uk за это время, используют соответствие , чтобы показать ключевые слова в контексте. [9]

Памятные вещи

Memento — это название предыдущих версий веб-страниц , придуманное Memento Project . Интерфейс UK Web Archive Memento позволяет находить Mementos в веб-архивах . [10] Интерфейс можно использовать для поиска Memento по его дате в таблице снимков или для просмотра того, как часто сайт появляется в публичных веб-архивах.

Исследование архива

Исследование сети как отражения общества помогло развить доступ к архиву. [11] Библиотеки разработали руководства по навыкам исследования, необходимым для использования веб-архивов. Они включают использование больших данных для выявления закономерностей или тенденций, [12] или написание ссылок на архивные копии веб-сайтов. [13]

Верстак GLAM

GLAM Workbench — это проект, который рассматривает, как исследователи могут использовать данные, сохраненные галереями, библиотеками, архивами и музеями. [14] Он включает в себя коллекцию блокнотов Jupyter , которые опираются на данные Mementos и индексов. [15] Блокноты сочетают описание и редактируемый код, чтобы помочь исследователям находить доказательства в веб-архивах.

Смотрите также

Ссылки

  1. ^ "UKWA Home". www.webarchive.org.uk . Получено 2020-10-13 .
  2. ^ "Правила библиотек обязательного экземпляра (непечатные произведения) 2013 г.". laws.gov.uk . Получено 21 февраля 2022 г. .
  3. ^ "15 лет британского веб-архива - Ранние годы - блог британского веб-архива". blogs.bl.uk . Архивировано из оригинала 8 марта 2020 года . Получено 2020-10-13 .
  4. ^ "UK Web Archiving Consortium: Evaluation Report". Digital Preservation Coalition . Апрель 2006 г. Архивировано из оригинала 9 января 2017 г. Получено 17 марта 2014 г.
  5. ^ "Рабочая группа по веб-архивированию и сохранению - Коалиция по цифровому сохранению". www.dpconline.org . Архивировано из оригинала 31 июля 2020 г. Получено 13 октября 2020 г.
  6. ^ "Что такое UK Web Archive?". UK Web Archive. Архивировано из оригинала 5 декабря 2019 года . Получено 17 марта 2014 года .
  7. ^ "15 лет UKWA - Оглядываясь назад на наши первые коллекции - блог UK Web Archive". blogs.bl.uk . Архивировано из оригинала 29 июля 2020 г. Получено 2020-10-19 .
  8. ^ www.webarchive.org.uk. "JISC UK Web Domain Dataset (1996-2013)". data.webarchive.org.uk . Получено 2020-10-16 .
  9. ^ "Результаты тренда 1996-2013 для "больших данных" :: SHINE". www.webarchive.org.uk . Получено 2020-10-13 .
  10. ^ "Mementos - Архивная история www.webarchive.org.uk". Mementos - Поиск исторических архивов по всему миру . Получено 2020-10-09 .
  11. ^ Блейни, Джонатан (19 апреля 2016 г.). «Доступно больше исследований проектов». Big UK Domain Data for the Arts and Humanities . Архивировано из оригинала 16 февраля 2017 г. Получено 2020-10-09 .
  12. ^ Макналли, Анна. «LibGuides: Поиск и использование цифровых архивов во время COVID-19: веб-архивы». libguides.westminster.ac.uk . Получено 14 октября 2020 г.
  13. ^ Томас, Сьюзен. "Oxford LibGuides: Веб-архивы: Главная". ox.libguides.com . Получено 14 октября 2020 г.
  14. ^ "Добро пожаловать в верстак GLAM - верстак GLAM". glam-workbench.github.io . Получено 13.10.2020 .
  15. ^ Шерратт, Тим; Джексон, Эндрю (2020-06-15). "GLAM-Workbench/web-archives". Zenodo . Bibcode : 2020zndo...3894079S. doi : 10.5281/zenodo.3894079.
  16. Команда, National Records of Scotland Web (31.05.2013). "NRS Web Continuity Service". National Records of Scotland . Архивировано из оригинала 18 января 2020 года . Получено 13.10.2020 .
  17. ^ "Поиск в веб-архиве PRONI". nidirect . 2015-12-09. Архивировано из оригинала 27 августа 2020 г. Получено 2020-10-13 .
  18. ^ "MirrorWeb - Веб-архив парламента Великобритании". webarchive.parliament.uk . Получено 13 октября 2020 г.

Внешние ссылки