Организация веб-архивирования
Фонд памяти Интернета (ранее Европейский архивный фонд ) был некоммерческим фондом , целью которого было архивирование контента Всемирной паутины . Он размещал проекты и исследования, которые включали сохранение и защиту цифрового медиаконтента в различных формах для формирования цифровой библиотеки культурного контента. По состоянию на август 2018 года он не функционирует.
История
Некоммерческая организация European Archive Foundation была зарегистрирована в 2004 году в Амстердаме . [1]
В объявлении на открытии Cross Media Week в Амстердаме в сентябре 2006 года была процитирована цитата Брюстера Кале , основателя Internet Archive . [2]
Жюльен Масанес был его первым директором. [3]
Работая из Амстердама и Парижа , организация заявила, что будет делать общедоступные коллекции общественного достояния и веб-архивы. Масанес, ранее работавший в Bibliothèque nationale de France , в 2007 году отредактировал книгу о веб-архивировании . [4]
Парижская организация называется Internet Memory Research, которая управляет службой, известной как ArchiveTheNet. [5]
В декабре 2010 года Фонд изменил свое название на Фонд памяти Интернета, чтобы выразить свою цель сохранения интернет-контента для нынешнего и будущих поколений. [6]
У фонда было много партнеров, включая культурные учреждения и научно-исследовательские институты, которые сотрудничали в его проектах веб-архивирования. Среди этих партнеров были Национальный архив Великобритании , [7] Институт Макса Планка , Берлинский технический университет , Университет Саутгемптона и Институт горного дела и телекоммуникаций . Фонд также был членом Международного консорциума по сохранению информации в Интернете . [8]
Исследовать
Фонд участвовал в исследовательских проектах по улучшению технологий веб-сканирования , извлечения данных , текстового анализа и сохранения для поддержки роста и использования веб-архивов. Их проекты финансировались Европейской комиссией через Седьмую исследовательскую рамочную программу .
- Проект Scalable Preservation Environments (SCAPE, проект № 270137) действовал с февраля 2011 года по июль 2014 года. [9] Он разрабатывал масштабируемую платформу сохранения с открытым исходным кодом.
- Масштабный кросс-языковой анализ тенденций и обобщение потоков медиа в реальном времени (TrendMiner, проект № 287863) проводился с ноября 2011 года по октябрь 2014 года. [10] Целью проекта была разработка инструментов для анализа социальных сетей, особенно на нескольких языках.
- Проект «Собери все архивы в память сообщества» (ARCOMEM, проект № 270239) проводился с января 2011 года по декабрь 2013 года. [11] В рамках проекта изучалось сохранение недолговечной веб-информации, например, той, которая используется на сайтах социальных сетей .
- Исследование «Веб-архивирование в Европе» было проведено в декабре 2010 года. Оно оценивало состояние проектов веб-архивирования в различных европейских учреждениях. [12]
- Продольный анализ данных веб-архива (LAWA, проект № 258105) проводился с сентября 2010 года по август 2013 года. [13] В рамках проекта проводились эксперименты с крупномасштабной аналитикой данных для использования в проекте будущих исследований и экспериментов в Интернете .
- LivingKnowledge (проект № 231126) продолжался с февраля 2009 года по январь 2012 года. [14] Целью было улучшение навигации и поиска в больших мультимодальных наборах данных.
- Живые веб-архивы (LiWA, проект № 216267) действовали с февраля 2008 года по январь 2011 года . [15] LiWA разработала методы и инструменты веб-архивирования, направленные на создание более точного, «живого» архива сети. [16] [17]
Коллекции
Аудио и видео
Прежде чем сосредоточиться на веб-архивировании, Европейский архивный фонд собрал одну из крупнейших бесплатных онлайн-коллекций классической музыки (более 800 произведений — от Моцарта до Дворжака), а также информационные фильмы британского правительства, созданные в сотрудничестве с Нидерландским институтом звука и изображения и Национальным архивом Великобритании.
Избирательный веб-коллектор
Фонд заархивировал снимок веб-сайтов институтов ЕС, сделанный в сотрудничестве с Историческим архивом Европейского Союза, расположенным в Италии, архив политических веб-сайтов 25 государств-членов ЕС [18] , захваченных во время европейских конституционных дебатов, а также архивы (среди прочих):
Веб-краулер, используемый в проекте, был Heritrix версии 3. Heritrix генерирует ресурсы, хранящиеся в стандартизированном формате архивного «контейнера», файле ARC (.arc). Файл ARC был расширен до формата файла Web ARChive (.warc), который был утвержден в качестве международного стандарта в июне 2009 года (текущая редакция ISO 28500:2017). [20]
Смотрите также
Ссылки
- ^ Миа Консальво; Чарльз Эсс, ред. (2011). Справочник по интернет-исследованиям . John Wiley & Sons. стр. 31. ISBN 9781444342383.
- ^ Масанес, Хулиан (28 сентября 2006 г.). «Официальный запуск Европейского архивного фонда» (пресс-релиз) .
- ^ "Официальный запуск Европейского архивного фонда". Пресс-релиз . 28 сентября 2006 г. Получено 7 октября 2013 г.
- ^ Julien Masanès, ed. (2007). Веб-архивирование . Springer. ISBN 9783540463320.
- ^ "À propos: Internet Memory". Веб-сайт ArchiveThe.net . Получено 7 октября 2013 г.(на французском)
- ^ "Internet Memory Foundation". Международный консорциум по сохранению информации в Интернете. Архивировано из оригинала 9 апреля 2014 года . Получено 8 апреля 2014 года .
- ^ Диана Мейнард ; Марк А. Гринвуд (16 мая 2012 г.). "Масштабная семантическая аннотация, индексирование и поиск в Национальном архиве" (PDF) . Международная конференция по языковым ресурсам и оценке .
- ^ Участники (Международный консорциум по сохранению информации в Интернете)
- ^ "Масштабируемые среды сохранения". Веб-сайт Community Research and Development Information Service . Европейский союз . Получено 7 октября 2013 г.
- ^ "Масштабный, кросс-языковой анализ тенденций и суммирование потоков медиа в реальном времени". Служба информации о научных исследованиях и разработках сообщества . Европейский союз . Получено 25 апреля 2016 г.
- ^ "ARchive COmmunities MEMories". Веб-сайт службы информации о научных исследованиях и разработках в сообществе . Европейский союз . Получено 7 октября 2013 г.
- ^ "Веб-архивирование в Европе: исследование, проведенное Фондом памяти Интернета, 2010 г." (PDF) . 22 марта 2011 г. Получено 8 апреля 2014 г.
- ^ "Longitudinal Analytics of Web Archive data". Веб-сайт Community Research and Development Information Service . Европейский союз . Получено 7 октября 2013 г.
- ^ "LivingKnowledge Facts, Opinions and Bias in Time". Веб-сайт Community Research and Development Information Service . Европейский союз . Получено 7 октября 2013 г.
- ^ "Living Web Archives". Веб-сайт Community Research and Development Information Service . Европейский союз . Получено 7 октября 2013 г.
- ^ "Отчет о "Технологиях для живых веб-архивов"" (PDF) . Отчет о поставке . 10 февраля 2011 г. . Получено 7 октября 2013 г. .
- ^ Димитар Денев; Артурас Мажейка; Марк Спаниол; Герхард Вайкум (апрель 2011 г.). «Структура SHARC для обеспечения качества данных в веб-архивировании». Международный журнал по очень большим базам данных . 20 (2). Springer-Verlag: 183–207. doi :10.1007/s00778-011-0219-9. S2CID 18258396.
- ^ "Исторические архивы пилотируют архивирование веб-сайтов институтов ЕС". EUI Historical Archives of the European Union . Получено 18 августа 2021 г.
- ^ Адриан Браун (2006). Архивирование веб-сайтов: практическое руководство для специалистов по управлению информацией . Facet Publishing. С. 17–18. ISBN 9781856045537.
- ^ «ИСО 28500:2017».
Внешние ссылки
- Живое Знание
- LAWA, продольный анализ данных веб-архива
- ARCOMEM, Европейские архивы, музеи и библиотеки в эпоху социальных сетей
- SCAPE, масштабируемая среда сохранения
- LiWA, Живые веб-архивы