Интернет -архив — американская некоммерческая цифровая библиотека, основанная 10 мая 1996 года под председательством защитника свободной информации Брюстера Кале . [1] [2] [4] Он обеспечивает бесплатный доступ к коллекциям оцифрованных материалов, включая веб-сайты, программные приложения, музыку, аудиовизуальные и печатные материалы. Архив также выступает за свободный и открытый Интернет. По состоянию на 4 февраля 2024 года [update]Интернет-архив содержит более 44 миллионов печатных материалов, 10,6 миллиона видео, 1 миллион программ, 15 миллионов аудиофайлов, 4,8 миллиона изображений, 255 000 концертов и более 835 миллиардов веб-страниц в Wayback Machine . [5] Его миссия – обеспечить «универсальный доступ ко всем знаниям». [1]
Интернет-архив позволяет общественности загружать и скачивать цифровые материалы в свой кластер данных, но основная часть данных собирается автоматически веб-сканерами , которые работают над сохранением как можно большей части общедоступной сети. Ее веб-архив Wayback Machine содержит сотни миллиардов веб-снимков. [6] [7] Архив также курирует многочисленные проекты по оцифровке книг, что в совокупности является одним из крупнейших в мире проектов по оцифровке книг.
Брюстер Кале основал Archive в мае 1996 года, примерно в то же время, когда он основал коммерческую компанию Alexa Internet, занимающуюся сканированием веб-страниц . [8] [9] В октябре того же года Интернет-архив начал архивировать и сохранять Всемирную паутину в больших объемах, [10] хотя самая ранняя известная страница была сохранена 10 мая 1996 года в 14:42. . [11] [12] [13] [14] Архивный контент впервые стал доступен широкой публике в 2001 году, когда была разработана Wayback Machine .
В конце 1999 года Архив расширил свои коллекции за пределы веб-архива, начиная с Архивов Прелингера . Теперь Интернет-архив включает в себя тексты, аудио, движущиеся изображения и программное обеспечение. Здесь размещен ряд других проектов: Архив изображений НАСА , служба сканирования по контрактам Archive-It, а также редактируемый вики-каталог библиотеки и сайт с информацией о книгах Open Library . Вскоре после этого Архив начал предоставлять специализированные услуги, связанные с потребностями доступа к информации для людей с ограниченными возможностями воспринимать печатную информацию; общедоступные книги были доступны в защищенном формате цифровой доступной информационной системы (DAISY). [15]
По данным сайта : [16]
Большинство обществ придают большое значение сохранению артефактов своей культуры и наследия. Без таких артефактов у цивилизации нет памяти и механизма, позволяющего учиться на своих успехах и неудачах. Наша культура сейчас производит все больше и больше артефактов в цифровой форме. Миссия Архива — помочь сохранить эти артефакты и создать интернет-библиотеку для исследователей, историков и ученых.
В августе 2012 года Archive объявил [17] , что он добавил BitTorrent к своим возможностям загрузки файлов для более чем 1,3 миллиона существующих файлов, а также для всех вновь загруженных файлов. [18] [19] Этот метод является самым быстрым способом загрузки мультимедиа из Архива, поскольку файлы подаются из двух центров обработки данных Архива, в дополнение к другим торрент-клиентам, которые загрузили и продолжают обслуживать файлы. [18] [20] 6 ноября 2013 года штаб-квартира Интернет-архива в районе Ричмонд Сан-Франциско загорелась, [21] уничтожила оборудование и повредила несколько близлежащих квартир. [22] По данным Архива, он потерял пристройку, в которой располагался один из 30 сканирующих центров; камеры, освещение и сканирующее оборудование стоимостью сотни тысяч долларов; и «возможно, 20 коробок книг и фильмов, некоторые из которых незаменимы, большинство уже оцифровано, а некоторые можно заменить». [23] Некоммерческая организация «Архив» запросила пожертвования для покрытия ущерба на сумму около 600 000 долларов. [24]
Бета-версия сайта была запущена в ноябре 2014 года, а устаревший макет был удален в марте 2016 года. [25] [26]
В ноябре 2016 года Кале объявил, что Интернет-архив создает Интернет-архив Канады, копию Архива, которая будет базироваться где-то в Канаде . Это объявление получило широкое освещение из-за того, что подразумевалось, что решение о создании резервного архива в чужой стране было принято в связи с предстоящим президентством Дональда Трампа . [27] [28] [29] Кале сказал:
9 ноября в Америке мы проснулись и увидели новую администрацию, обещающую радикальные перемены. Это было твердым напоминанием о том, что такие учреждения, как наше, построенные на долгосрочную перспективу, должны быть готовы к переменам. Для нас это означает сохранение наших культурных материалов в безопасности, конфиденциальности и постоянном доступе. Это означает подготовку к Сети, которая может столкнуться с более серьезными ограничениями. Это означает обслуживание клиентов в мире, в котором государственный надзор не исчезнет; действительно, похоже, что он увеличится. На протяжении всей истории библиотеки боролись с ужасными нарушениями конфиденциальности, когда людей задерживали просто за то, что они прочитали. В Интернет-архиве мы боремся за защиту конфиденциальности наших читателей в цифровом мире. [27]
Начиная с 2017 года OCLC и Интернет-архив сотрудничают, чтобы сделать записи архива оцифрованных книг доступными в WorldCat . [30]
С 2018 года резиденция изобразительного искусства Интернет-архива, организованная Амиром Сабером Исфахани и Эндрю МакКлинтоком, помогает художникам получить доступ к более чем 48 петабайтам оцифрованных материалов Архива [31] . В течение годовой резиденции художники создают массу работ, кульминацией которых становится выставка. Мы надеемся соединить цифровую историю с искусством и создать что-то, что будущие поколения смогут оценить онлайн или оффлайн. [32] Предыдущие художники, проживавшие в резиденции, включают Тарават Талепасанд , Уитни Линн и Дженни Оделл . [33]
Интернет-архив приобретает большую часть материалов за счет пожертвований, [34] таких как сотни тысяч дисков со скоростью вращения 78 об/мин из Бостонской публичной библиотеки в 2017 году, [35] пожертвование 250 000 книг от Университета Трента в 2018 году, [36] и вся коллекция Библиотека колледжа Мэригроув в 2020 году после закрытия. [37] Затем все материалы оцифровываются и сохраняются в цифровом хранилище, в то время как цифровая копия возвращается первоначальному владельцу, а копия Интернет-архива, если она не находится в общественном достоянии, предоставляется посетителям по всему миру по одному под контролируемым цифровым доступом . кредитования (CDL) теория доктрины первой продажи . [38]
The Archive — это некоммерческая организация, действующая в США по статье 501(c)(3) . В 2019 году годовой бюджет компании составлял 36 миллионов долларов, полученный за счет доходов от услуг сканирования веб-страниц, различных партнерств, грантов, пожертвований и Фонда Кале-Остин . [39] Интернет-архив также управляет периодическими кампаниями по финансированию. Например, кампания в декабре 2019 года имела цель собрать пожертвования на сумму 6 миллионов долларов. [40]
Штаб-квартира Архива находится в Сан-Франциско, Калифорния . С 1996 по 2009 год ее штаб-квартира располагалась в Президио Сан-Франциско , бывшей военной базе США. С 2009 года ее штаб-квартира находится по адресу 300 Funston Avenue в Сан-Франциско , в бывшей церкви христианской науки . Когда-то большая часть его сотрудников работала в центрах сканирования книг ; По состоянию на 2019 год сканирование осуществляют 100 платных операторов по всему миру. [41] Архив также имеет центры обработки данных в трех калифорнийских городах: Сан-Франциско, Редвуд-Сити и Ричмонде . Чтобы снизить риск потери данных, Архив создает копии частей своей коллекции в более отдаленных местах, включая Александринскую библиотеку [42] [43] в Египте и объект в Амстердаме . [44]
Архив является членом Международного консорциума по сохранению Интернета [45] и был официально признан библиотекой штата Калифорния в 2007 году. [46] [47]
Интернет-архив воспользовался популярным использованием термина « Машина WABAC » из фрагмента мультфильма «Приключения Рокки и Буллвинкла» (в частности, « Невероятная история Пибоди ») и использует название «Wayback Machine» для своего сервиса, который позволяет архивировать Всемирная паутина для поиска и доступа. [48] Эта услуга позволяет пользователям просматривать некоторые из заархивированных веб-страниц. Wayback Machine была создана в результате совместных усилий Alexa Internet (принадлежащей Amazon.com ) и Internet Archive, когда был создан трехмерный индекс, позволяющий просматривать архивированный веб-контент. [49] Сотни миллиардов веб-сайтов и связанных с ними данных (изображений, исходного кода, документов и т. д.) сохраняются в базе данных. Эту службу можно использовать для просмотра того, как выглядели предыдущие версии веб-сайтов, для получения исходного исходного кода с веб-сайтов, которые больше не доступны напрямую, или для посещения веб-сайтов, которые больше не существуют. Не все веб-сайты доступны, поскольку многие владельцы веб-сайтов предпочитают исключать свои сайты. Как и все сайты, основанные на данных веб-сканеров, Интернет-архив пропускает большие области сети по ряду других причин. Газета 2004 года обнаружила международную предвзятость в освещении событий, но сочла их «непреднамеренными». [50]
Функция архивирования «Сохранить страницу сейчас» стала доступна в октябре 2013 года [51] и доступна в правом нижнем углу главной страницы Wayback Machine. [52] После ввода и сохранения целевого URL-адреса веб-страница станет частью Wayback Machine. [51] Через Интернет-адрес web.archive.org [53] пользователи могут загружать на Wayback Machine большое количество разнообразного контента, включая форматы файлов PDF и сжатия данных . Wayback Machine создает постоянный локальный URL-адрес загружаемого контента, доступный в Интернете, даже если он не указан при поиске на официальном сайте https://archive.org.
В октябре 2016 года было объявлено, что способ подсчета веб-страниц будет изменен, что приведет к уменьшению отображаемого количества заархивированных страниц. Встроенные объекты, такие как изображения, видео, таблицы стилей и сценарии JavaScript, больше не считаются «веб-страницами», тогда как документы HTML, PDF и обычные текстовые документы продолжают учитываться. [54]
В сентябре 2020 года Интернет-архив объявил о партнерстве с Cloudflare для автоматического индексирования веб-сайтов, обслуживаемых через его сервисы «Всегда онлайн». [77]
Archive-It [78] — это служба подписки на веб-архивирование, созданная в начале 2006 года, которая позволяет учреждениям и частным лицам создавать и сохранять коллекции цифрового контента, а также создавать цифровые архивы. Archive-It позволяет пользователю настраивать захват или исключение веб-контента, который он хочет сохранить по соображениям культурного наследия. С помощью веб-приложения партнеры Archive-It могут собирать, каталогизировать, управлять, просматривать, искать и просматривать свои архивные коллекции. [79]
Что касается доступности, заархивированные веб-сайты доступны для полнотекстового поиска в течение семи дней после захвата. [80] Содержимое, собранное с помощью Archive-It, захватывается и сохраняется в виде файла WARC . Основная и резервная копии хранятся в центрах обработки данных Интернет-архива. Копия файла WARC может быть передана подписавшимся партнерским учреждениям для геоизбыточного сохранения и хранения в соответствии с их передовыми стандартами. [81] Периодически данные, собранные с помощью Archive-It, индексируются в общий архив Интернет-архива.
По состоянию на март 2014 года [update]у Archive-It было более 275 партнерских учреждений в 46 штатах США и 16 странах, которые захватили более 7,4 миллиарда URL-адресов из более чем 2444 общедоступных коллекций. Партнерами Archive-It являются библиотеки университетов и колледжей, государственные архивы, федеральные учреждения, музеи, юридические библиотеки и культурные организации, в том числе Организация электронной литературы , Государственные архивы и библиотеки Северной Каролины, Стэнфордский университет , Колумбийский университет , Американский университет в Каире , Джорджтаун. Юридическая библиотека и многие другие.
В сентябре 2020 года Интернет-архив объявил о новой инициативе по архивированию и сохранению академических журналов в открытом доступе под названием Internet Archive Scholar . [82] [83] [84] Его индекс полнотекстового поиска включает более 25 миллионов исследовательских статей и других научных документов, хранящихся в Интернет-архиве. Коллекция включает в себя оцифрованные копии журналов восемнадцатого века, материалы последних конференций в открытом доступе и препринты, полученные из Всемирной паутины.
В 2021 году Интернет-архив анонсировал первоначальную версию General Index , общедоступного индекса коллекции из 107 миллионов статей в научных журналах . [85] [86]
Сканирование, выполняемое Интернет-архивом, финансируется библиотеками и фондами. [87] По состоянию на ноябрь 2008 года [update], когда насчитывалось около 1 миллиона текстов, вся коллекция превышала 0,5 петабайта и включала в себя необработанные изображения с камеры, обрезанные и искаженные изображения, PDF-файлы и необработанные данные оптического распознавания символов . [88]
По состоянию на июль 2013 года [update]Интернет-архив управлял 33 центрами сканирования в пяти странах, оцифровывая около 1000 книг в день, что в общей сложности составляло более 2 миллионов книг, а общая коллекция составляла 4,4 миллиона книг, включая материалы, оцифрованные другими и переданные в Интернет-архив; в то время пользователи выполняли более 15 миллионов загрузок в месяц. [89]
Материал, оцифрованный другими, включает более 300 000 книг, которые были внесены в коллекцию примерно в период с 2006 по 2008 год Microsoft в рамках проекта Live Search Books , который также включал финансовую поддержку и оборудование для сканирования, переданное непосредственно в дар Интернет-архиву. [90] 23 мая 2008 года Microsoft объявила, что завершает проект Live Book Search и больше не будет сканировать книги, пожертвовав оставшееся сканирующее оборудование своим бывшим партнерам. [90]
Примерно в октябре 2007 года пользователи Архива начали загружать общедоступные книги из Поиска книг Google . [91] По состоянию на ноябрь 2013 года [update]в коллекции Архива насчитывалось более 900 000 книг, оцифрованных Google; [92] Книги идентичны копиям, найденным в Google, за исключением отсутствия водяных знаков Google, и доступны для неограниченного использования и загрузки. [a] Брюстер Кале сообщил в 2013 году, что эту работу по архивированию координировал Аарон Шварц , который с «группой друзей» загружал общедоступные книги из Google достаточно медленно и с достаточного количества компьютеров, чтобы оставаться в рамках ограничений Google. Они сделали это, чтобы обеспечить публичный доступ к общественному достоянию . Архив гарантировал, что эти предметы были атрибутированы и связаны с Google, который никогда не жаловался, в то время как библиотеки «ворчали». По мнению Кале, это пример «гения» Шварца в работе над тем, что может принести наибольшую пользу обществу для миллионов людей. [93]
Помимо книг, Архив предлагает бесплатный и анонимный публичный доступ к более чем четырем миллионам судебных заключений, юридических записок или вещественных доказательств, загруженных из системы электронных документов PACER федеральных судов США через плагин веб-браузера RECAP . Эти документы хранились за защитой доступа федерального суда. К 2013 году в Архиве к ним получили доступ более шести миллионов человек. [93]
Веб-приложение BookReader от Archive , [94] встроенное в его веб-сайт, имеет такие функции, как одностраничный, двухстраничный режимы и режимы миниатюр ; полноэкранный режим; масштабирование страниц изображений высокого разрешения ; и анимацию переворачивания страниц . [94] [95]
Открытая библиотека — еще один проект Интернет-архива. Целью проекта является создание веб-страницы для каждой когда-либо опубликованной книги: в нем хранится 25 миллионов каталожных записей об изданиях. Она также стремится стать публичной библиотекой, доступной через Интернет: она содержит полные тексты примерно 1 600 000 книг, являющихся общественным достоянием (из более чем пяти миллионов из основной коллекции текстов), а также печатные книги и книги, защищенные авторскими правами. [96] многие из которых полностью читабельны, доступны для скачивания [97] [98] и доступны для полнотекстового поиска ; [99] он предлагает двухнедельную аренду электронных книг в рамках своей контролируемой программы цифрового кредитования для более чем 647 784 книг, не являющихся общественным достоянием, в партнерстве с более чем 1000 библиотечными партнерами из шести стран [89] [100] после бесплатной регистрации. на вебсайте. Open Library — это бесплатный программный проект с открытым исходным кодом , исходный код которого свободно доступен на GitHub .
Открытая библиотека сталкивается с возражениями со стороны некоторых авторов и Общества авторов , которые считают, что проект распространяет книги без разрешения и, таким образом, нарушает законы об авторском праве, [101] а четыре крупных издательства возбудили иск о нарушении авторских прав против Интернет-архива в Июнь 2020 года, чтобы остановить проект «Открытая библиотека». [102]
Многие крупные институциональные спонсоры помогли Интернет-архиву предоставить миллионы отсканированных публикаций (текстовых элементов). [103] Некоторые спонсоры, которые оцифровали большое количество текстов, включают Библиотеку Робартса Университета Торонто , Библиотеки Университета Альберты , Университет Оттавы , Библиотеку Конгресса , библиотеки-члены Бостонского библиотечного консорциума , Бостонскую публичную библиотеку , Библиотека Принстонской духовной семинарии и многие другие. [104]
В 2017 году MIT Press разрешила Интернет-архиву оцифровывать и предоставлять книги из резервного списка прессы [105] при финансовой поддержке Фонда Аркадия . [106] [107] Год спустя Интернет-архив получил дополнительное финансирование от Фонда Аркадии, чтобы пригласить некоторые другие университетские издательства к сотрудничеству с Интернет-архивом для оцифровки книг, проект под названием «Разблокировка университетских издательских книг». [108] [109]
Библиотека Конгресса создала множество идентификаторов системы управления , которые указывали на бесплатные оцифрованные книги в Интернет-архиве. [110] Интернет-архив и Открытая библиотека указаны на веб-сайте Библиотеки Конгресса как источник электронных книг. [111]
Помимо веб-архивов, Интернет-архив хранит обширные коллекции цифровых медиафайлов, которые, по подтверждению пользователя, находятся в общественном достоянии в США или лицензируются по лицензии, допускающей повторное распространение, например, по лицензиям Creative Commons . Мультимедиа организованы в коллекции по типам медиа (движущиеся изображения, аудио, текст и т. д.) и в подколлекции по различным критериям. Каждая из основных коллекций включает в себя подколлекцию «Сообщество» (ранее называвшуюся «Открытый исходный код»), в которой хранятся общие вклады общественности.
Аудиоархив — это аудиоархив , включающий музыку, аудиокниги , новостные передачи, старые радиопередачи , подкасты и множество других аудиофайлов. По состоянию на январь 2023 года в коллекции [update]насчитывается более 15 000 000 бесплатных цифровых записей . Подколлекции включают аудиокниги и стихи, подкасты, неанглоязычные аудиозаписи и многое другое. [112] Звуковые коллекции курирует Б. Джордж , директор АРХива современной музыки . [113]
Помимо стандартного аудиоплеера HTML5 доступен Winamp , напоминающий Webamp .
Проект по сохранению записей любительских радиопередач при финансовой поддержке фонда «Цифровая радиолюбительская связь». [114] [115]
Подколлекция Live Music Archive включает более 170 000 записей концертов независимых музыкантов, а также более авторитетных артистов и музыкальных ансамблей с разрешительными правилами записи своих концертов, таких как Grateful Dead и, с недавних пор, The Smashing Pumpkins . Кроме того, Джордан Зевон разрешил Интернет-архиву разместить полную коллекцию концертных записей своего отца Уоррена Зевона . Коллекция Zevon охватывает период с 1976 по 2001 год и содержит 126 концертов, в том числе 1137 песен. [116]
Целью проекта Great 78 является оцифровка 250 000 синглов со скоростью вращения 78 об/мин (500 000 песен) периода между 1880 и 1960 годами, подаренных различными коллекционерами и учреждениями. Он был разработан в сотрудничестве с Архивом современной музыки и компанией George Blood Audio, ответственной за оцифровку звука. [113]
В архиве есть коллекция свободно распространяемой музыки, которая транслируется и доступна для скачивания через службу Netlabels . Музыка в этой коллекции обычно находится в каталогах виртуальных звукозаписывающих компаний по лицензии Creative Commons. [117] [118]
Эта коллекция содержит более 3,5 миллионов предметов. [119] Архив обложки , Метрополитен-музей — изображения галереи, изображения НАСА, архив Flickr Occupy Wall Street и карты Геологической службы США — это некоторые подколлекции коллекции изображений.
Архив обложки — это совместный проект Internet Archive и MusicBrainz , цель которого — размещать изображения обложек в Интернете. По состоянию на апрель 2021 года [update]эта коллекция насчитывает более 1 400 000 предметов. [120]
Изображения этой коллекции взяты из Метрополитен-музея . Эта коллекция содержит более 140 000 предметов. [121]
Архив изображений НАСА был создан в соответствии с Соглашением о космосе между Интернет-архивом и НАСА, чтобы обеспечить публичный доступ к коллекциям изображений, видео и аудио НАСА в едином ресурсе с возможностью поиска. Команда IA NASA Images тесно сотрудничала со всеми центрами НАСА, чтобы продолжать пополнять постоянно растущую коллекцию. [122] Сайт nasaimages.org был запущен в июле 2008 года и на момент окончания хостинга в 2012 году насчитывал более 100 000 элементов.
Эта коллекция содержит фотографии Flickr, лицензированные Creative Commons , связанные с движением Occupy Wall Street . Эта коллекция содержит более 15 000 предметов. [123]
Эта коллекция содержит более 59 000 элементов из Libre Map Project . [124]
Одной из частей видеоархива Интернет-архива является Архив Машинимы. В этом небольшом разделе размещено множество видеороликов о Машиниме. Машинима — это форма цифрового искусства, в которой компьютерные игры , игровые движки или программные движки используются в режиме «песочницы» для создания кинофильмов, воссоздания пьес или даже публикации презентаций или основных докладов. В архиве собраны фильмы Machinima от интернет-издателей, таких как Rooster Teeth и Machinima.com , а также независимых продюсеров. Подколлекция представляет собой совместную работу Интернет-архива, исследовательского проекта How They Got Game в Стэнфордском университете, Академии искусств и наук машинимы и Machinima.com. [125]
Эта коллекция содержит около 160 000 микрофильмированных предметов из различных библиотек, включая библиотеки Чикагского университета , Университета Иллинойса в Урбане-Шампейне , Университета Альберты , Публичной библиотеки округа Аллен и Национальной службы технической информации . [126] [127]
В Интернет-архиве хранится около 3863 художественных фильмов. [128] Кроме того, коллекция движущихся изображений Интернет-архива включает в себя: кинохронику , классические мультфильмы , про- и антивоенную пропаганду , коллекцию Video Cellar, коллекцию Скипа Эльшеймера «AV Geeks», ранние телепередачи и эфемерные материалы из архивов Прелингера , такие как как рекламные , образовательные и промышленные фильмы, так и любительские и домашние киноколлекции.
Подкатегории этой коллекции включают:
Открытые образовательные ресурсы — это цифровая коллекция на archive.org. Эта коллекция содержит сотни бесплатных курсов, видеолекций и дополнительных материалов из университетов США и Китая . Авторами этого сборника являются Университет ArsDigita , Фонд Хьюлетта , Массачусетский технологический институт , Институт Монтерея и Университет Наропы . [131]
В сентябре 2012 года Интернет-архив запустил службу поиска и заимствования теленовостей для поиска национальных новостных программ США. [132] Сервис основан на расшифровках субтитров и позволяет пользователям искать и транслировать 30-секундные видеоклипы. На момент запуска сервис содержал «350 000 новостных программ, собранных за 3 года из национальных сетей и станций США в Сан-Франциско и Вашингтоне» [133] . По словам Кале, сервис был вдохновлен Архивом телевизионных новостей Вандербильта , аналогичной библиотекой телевизионных новостей. сетевые новостные программы. [134] В отличие от Vanderbilt, который ограничивает доступ к потоковому видео лицам, связанным с подпиской на колледжи и университеты, TV News Search & Borrow предоставляет открытый доступ к своим потоковым видеоклипам. В 2013 году Архив получил в дар дополнительное пожертвование в виде «приблизительно 40 000 хорошо организованных лент» из поместья женщины из Филадельфии Мэрион Стоукс . Стоукс «более 35 лет записывала телевизионные новости в Филадельфии и Бостоне на свои машины VHS и Betamax ». [135]
Коллекция Бруклинского музея содержит около 3000 предметов из Бруклинского музея . [136] В декабре 2020 года в архив была передана кинотека Лилиан Майкельсон . [137]
Выражая резкую реакцию на идею о том, что книги просто выбрасывают, и вдохновленный Всемирным семенным хранилищем Шпицбергена , Кале теперь предполагает собирать по одному экземпляру каждой когда-либо опубликованной книги. «Мы не добьемся этого, но это наша цель», - сказал он. Наряду с книгами Кале планирует хранить старые серверы Интернет-архива, которые были заменены в 2010 году. [138]
Интернет-архив имеет «самую большую в мире коллекцию исторического программного обеспечения», охватывающую 50-летнюю компьютерную историю в терабайтах компьютерных журналов и журналов, книг, условно-бесплатных дисков, FTP-сайтов, видеоигр и т. д. Интернет-архив создал архив того, что он называет «старинным программным обеспечением», как способ их сохранения. [139] Проект выступал за исключение из Закона США об авторском праве в цифровую эпоху , позволяющее им обходить защиту от копирования , которую Бюро авторских прав США утвердило в 2003 году сроком на три года. [140] Архив не предлагает программное обеспечение для загрузки, поскольку исключение предусмотрено исключительно «в целях сохранения или архивного воспроизведения опубликованных цифровых произведений библиотекой или архивом». [141] Библиотека Конгресса продлила освобождение от налога в 2006 году, а в 2009 году продлила его на неопределенный срок в ожидании дальнейшего принятия правил. [142] Библиотека подтвердила это исключение как «Окончательное правило» без срока действия в 2010 году. [143] В 2013 году Интернет-архив начал предоставлять избранные видеоигры, в которые можно играть в браузере через MESS , например игру ET для Atari 2600 . Инопланетянин . [144] С 23 декабря 2014 года Интернет-архив представляет через браузерную эмуляцию DOSBox тысячи игр для DOS /ПК [145] [146] [147] [148] «только для стипендиальных и исследовательских целей». [149] [150] [151] В ноябре 2020 года компания Archive представила новый эмулятор Adobe Flash под названием Ruffle и начала архивировать Flash-анимацию и игры в преддверии окончания срока службы плагина Flash 31 декабря 2020 года. все компьютерные системы. [152]
Разработан комбинированный аппаратно-программный комплекс, реализующий безопасный метод оцифровки контента. [153] [154]
С 2012 по ноябрь 2015 года Интернет-архив управлял Федеральным кредитным союзом Интернет-архива, федеральным кредитным союзом , базирующимся в Нью-Брансуике, штат Нью-Джерси , с целью предоставления доступа людям с низким и средним уровнем дохода. За время своего недолгого существования IAFCU испытывала серьезные конфликты с Национальной администрацией кредитных союзов , что серьезно ограничивало кредитный портфель IAFCU и вызывало опасения по поводу обслуживания биткойн- фирм. На момент роспуска он состоял из 395 членов и стоил 2,5 миллиона долларов. [155] [156]
С 2019 года [157] Интернет-архив организует мероприятие под названием «Децентрализованный веб-лагерь» (DWeb Camp). Это ежегодный лагерь, который объединяет разнообразное глобальное сообщество участников в естественной обстановке. Целью лагеря является решение реальных проблем, с которыми сталкивается Интернет, и совместное создание децентрализованных технологий для улучшения Интернета. Он направлен на содействие сотрудничеству, обучению и развлечениям, одновременно продвигая принципы доверия, человеческой активности, взаимного уважения и экологической осведомленности. [158]
30 сентября 2021 года , в рамках празднования своего 25-летия, Internet Archive запустил «Wayforward Machine», сатирический вымышленный веб-сайт , покрытый всплывающими окнами с просьбой предоставить личную информацию. Сайт был предназначен для изображения вымышленной антиутопической временной шкалы реальных событий, ведущих к такому будущему, таких как отмена раздела 230 Кодекса США в 2022 году и введение рекламных имплантатов в 2041 году. [159] [160]
В Большом зале Интернет-архива представлена коллекция из более чем 100 керамических фигурок , представляющих сотрудников Интернет-архива, а также сотая статуя, увековечивающая Аарона Шварца . Эта коллекция, вдохновленная статуями сианьских воинов в Китае , была заказана Брюстером Кале, создана Нуалой Кридом и по состоянию на 2014 год продолжается. [161]
Резиденция изобразительного искусства Интернет-архива, [162] организованная Амиром Сабером Исфахани, призвана связать начинающих художников и художников среднего звена с миллионами коллекций Архива и показать, что возможно, когда открытый доступ к информации пересекается с искусством. В течение этой годичной резидентуры избранные художники создают массу работ, которые отражают коллекции Архива и используют их в своей собственной практике. [163]
8 мая 2008 года выяснилось, что Интернет-архив успешно оспорил письмо ФБР по национальной безопасности с просьбой предоставить журналы неизвестного пользователя. [167] [168]
28 ноября 2016 года выяснилось, что второе письмо ФБР о национальной безопасности было успешно оспорено, в котором содержалась просьба предоставить журналы другого неизвестного пользователя. [169]
18 января 2012 года Интернет-архив отключил свой веб-сайт на 12 часов в знак протеста против законопроектов «Остановить онлайн-пиратство» и « Закона о защите интеллектуальной собственности» , двух законодательных актов Конгресса США , которые, по их утверждениям, «негативно повлияют на экосистему». веб-публикаций, что привело к появлению Интернет-архива». Это произошло в связи с отключением английской Википедии , а также многочисленными другими протестами в Интернете. [170]
Интернет-архив является членом Альянса открытой книги , который является одним из наиболее ярых критиков соглашения Google Book Settlement . Архив выступает за альтернативный проект цифровой библиотеки. [171]
В ноябре 2005 года бесплатные загрузки концертов Grateful Dead были удалены с сайта из-за, по всей видимости, разногласий между некоторыми бывшими участниками группы. Согласно статье в The New York Times, Джон Перри Барлоу назвал Боба Вейра , Микки Харта и Билла Кройцмана инициаторами перемен . [172] Фил Леш , один из основателей группы, прокомментировал изменение 30 ноября 2005 года, разместив на своем личном веб-сайте:
До моего сведения дошло, что все шоу Grateful Dead были удалены с Archive.org прямо перед Днем Благодарения . Я не участвовал в этом процессе принятия решений, и меня не уведомили о прекращении шоу. Я чувствую, что эта музыка — наследие Grateful Dead, и надеюсь, что так или иначе вся она будет доступна тем, кто этого хочет. [173]
Сообщение на форуме от 30 ноября Брюстера Кале резюмировало компромисс, достигнутый участниками группы. Записи аудитории можно было загружать или транслировать, но записи деки должны были быть доступны только для потоковой передачи. С тех пор концерты были добавлены повторно. [174]
В феврале 2016 года пользователи Интернет-архива начали архивировать цифровые копии Nintendo Power , официального журнала Nintendo , посвященного их играм и продуктам, который выходил с 1988 по 2012 год. Были собраны первые 140 выпусков, прежде чем Nintendo удалила архив в августе. 8 декабря 2016 г. В ответ на это заявление Nintendo сообщила игровому веб-сайту Polygon : «[Nintendo] должна защищать наших собственных персонажей, товарные знаки и другой контент. Несанкционированное использование интеллектуальной собственности Nintendo может ослабить нашу способность защищать и сохранять ее». или, возможно, использовать его для новых проектов». [175]
В августе 2017 года Департамент телекоммуникаций правительства Индии заблокировал Интернет-архив вместе с другими файлообменными веб-сайтами в соответствии с двумя постановлениями суда, вынесенными Высоким судом Мадраса [176] со ссылкой на опасения по поводу пиратства после копирования двух болливудских фильмов . предположительно были переданы через сервис. [177] HTTP - версия Архива была заблокирована, но оставалась доступной по протоколу HTTPS . [176]
В 2023 году Интернет-архив стал популярным сайтом среди индийцев, где они могли посмотреть первый эпизод документального фильма BBC «Индия: вопрос Моди» . [178] Сообщается, что видео было удалено Архивом 23 января. [178] Интернет-архив затем заявил, 27 января, что они удалили видео в ответ на запрос BBC в соответствии с Законом об авторском праве в цифровую эпоху . [179]
Проект Great 78 был запущен в Интернет-архиве для хранения оцифрованных версий песен и альбомов до 1972 года с граммофонных пластинок со скоростью 78 об / мин с заявленной целью «сохранения, исследования и открытия пластинок со скоростью 78 об / мин». Проект стартовал в 2016 году, когда авторские права на записи, выпущенные до 1972 года, имели ограниченный срок действия; В 2019 году Конгресс США принял Закон о модернизации музыки , который продлил авторские права на записи, существовавшие до 1972 года, до 2067 года. В августе 2023 года Sony Music Entertainment и пять других крупных музыкальных издателей подали в суд на Интернет-архив по поводу проекта Great 78, утверждая, что проект был задействован в кража авторских прав, отрицая утверждение об исследовательских целях, поскольку вся музыка была доступна через соответствующие цифровые и потоковые музыкальные сервисы. Компании требовали возмещения установленного законом ущерба за почти 2500 песен, упомянутых в иске, на общую сумму 347 миллионов долларов. [180]
9 октября 2016 года Интернет-архив был временно заблокирован в Турции после того, как хакеры использовали его (среди других файловых хостингов) для размещения 17 ГБ утекших правительственных писем. [181] [182]
Поскольку Интернет-архив лишь слегка модерирует загрузки, он включает в себя ресурсы, которые могут быть ценны экстремистами или могут быть использованы ими для уклонения от блокировки . В мае 2018 года в отчете, опубликованном фирмой по кибербезопасности Flashpoint, говорилось, что Исламское государство использовало Интернет-архив для распространения своей пропаганды. [183] Крис Батлер из Интернет-архива ответил, что они регулярно разговаривали с правительствами США и ЕС об обмене информацией о терроризме. [183] В апреле 2019 г. Европол по поручению французской полиции попросил Интернет-архив удалить 550 сайтов «террористической пропаганды». [184] Архив отклонил запрос, заявив, что отчеты неверны в отношении содержания, на которое они указывают, или слишком широки, чтобы организация могла их соблюдать. [184] 14 июля 2021 г. Интернет-архив провел совместный с Европолом «День перенаправления» по борьбе с террористическими видео. [185] В статье 2021 года говорилось, что джихадисты регулярно использовали Интернет-архив для поиска « тайников » террористических видео. [186] В январе 2022 года в Интернет-архив был загружен 800-страничный манифест бывшего преподавателя Калифорнийского университета в Лос- Анджелесе, содержащий расистские идеи и угрозы в адрес сотрудников Калифорнийского университета в Лос-Анджелесе. [187] Манифест был удален Интернет-архивом через неделю на фоне дискуссии о том, должны ли такие документы сохраняться архивистами или нет. [187] В другом документе 2022 года был обнаружен «тревожный объем террористических, экстремистских и расистских материалов в Интернет-архиве». [188] В документе 2023 года сообщалось, что неонацисты собирают ссылки на общедоступные онлайн-ресурсы, чтобы ими делиться с новобранцами. Поскольку в Интернет-архиве размещаются тексты, запрещенные к размещению на других веб-сайтах, нацистские и неонацистские книги Архива (например, « Дневники Тернера ») часто появляются в этих списках. В этих списках также представлены старые общедоступные материалы, созданные в то время, когда взгляды сторонников превосходства белой расы были мейнстримом. [189]
В разгар пандемии COVID-19 , из-за которой были закрыты многие школы, университеты и библиотеки, 24 марта 2020 года Архив объявил, что создает Национальную чрезвычайную библиотеку, сняв ограничения на выдачу 1,4 миллиона оцифрованных книг. в своей Открытой библиотеке, но в остальном ограничивая пользователей количеством книг, которые они могут взять, и обеспечивая их возврат; обычно сайт разрешает только одну цифровую выдачу на каждую имеющуюся у них физическую копию книги, используя зашифрованный файл , который станет непригодным для использования после завершения периода выдачи. [4] Эта библиотека останется таковой как минимум до 30 июня 2020 года или до окончания чрезвычайного положения в США, в зависимости от того, что наступит позже. [190] На момент запуска Интернет-архив позволял авторам и правообладателям подавать запросы об исключении их произведений из Национальной чрезвычайной библиотеки. [191] [192] [193]
В Интернет-архиве сообщили, что Национальная чрезвычайная библиотека удовлетворила «беспрецедентную глобальную и неотложную потребность в доступе к чтению и исследовательским материалам» из-за закрытия физических библиотек по всему миру. [194] Они обосновали этот шаг по-разному. С юридической точки зрения они заявили, что способствуют доступу к этим недоступным ресурсам, что, по их утверждению, является соблюдением принципов добросовестного использования . Архив продолжал реализовывать свою политику контролируемого цифрового выдачи , которая существовала до Национальной чрезвычайной библиотеки, а это означает, что они по-прежнему шифровали выдаваемые копии, и пользователям было не легче создавать новые копии книг, чем раньше. Окончательное решение о том, является ли Национальная чрезвычайная библиотека добросовестным использованием, может быть вынесено только судом. С моральной точки зрения они также указали, что Интернет-архив является зарегистрированной библиотекой, как и любая другая, что они либо сами платят за книги, либо получают их в качестве пожертвований, и что выдача книг через библиотеки предшествовала ограничениям авторских прав. [191] [195]
Архив уже подвергался критике со стороны авторов и издателей за прежний подход к выдаче кредитов, и после объявления о создании Национальной чрезвычайной библиотеки авторы, издатели и группы, представляющие обе стороны, пошли дальше, приравнивая этот шаг к нарушению авторских прав и цифровому пиратству, а также используя Пандемия COVID-19 как повод раздвинуть границы авторских прав (см. также: Открытая библиотека § Обвинения в нарушении авторских прав ). [193] [196] [197] [198] После того, как работы некоторых из этих авторов были высмеяны в ответах, Джейсон Скотт из Интернет-архива попросил сторонников Национальной библиотеки по чрезвычайным ситуациям не очернять чьи-либо книги: «Я понимаю, что существуют серьезные дебаты и здесь нет разногласий, но книги дают жизнь и меняют жизнь, и эти писатели создали их». [199]
Работа Национальной чрезвычайной библиотеки была частью иска, поданного против Интернет-архива четырьмя крупными книжными издательствами — Hachette, HarperCollins, John Wiley & Sons и Penguin Random House — в июне 2020 года, оспаривая законность авторских прав на контролируемое цифровое выдачу. программа. [4] [102] [200] В ответ Интернет-архив закрыл Национальную чрезвычайную библиотеку 16 июня 2020 г., а не запланированное 30 июня 2020 г., из-за судебного иска. [201] [202] Истцы при поддержке Copyright Alliance [ 203] заявили в своем иске, что действия Интернет-архива представляют собой «умышленное массовое нарушение авторских прав». [204] В августе 2020 года судебное разбирательство по иску предварительно планировалось начать в ноябре 2021 года. [205] К июню 2022 года обе стороны по делу запросили упрощенное решение по делу, каждая из которых отдавала предпочтение своей стороне, что судья Джон Г. Келтл одобрил . [206] Судебное решение не было вынесено, а первое слушание было проведено 20 марта 2023 года. [207] В ходе слушания появился судья Джон Г. Кёлтл. их не трогают заявления IA о добросовестном использовании, и они не убеждены в том, что их практика не повлияла на рынок издателей библиотечных электронных книг. [208]
Сенатор Том Тиллис от Северной Каролины, председатель подкомитета по интеллектуальной собственности Юридического комитета Сената, заявил в письме в Интернет-архив, что он «обеспокоен тем, что Интернет-архив считает, что именно он, а не Конгресс, должен определять объем авторских прав». закон". [204]
В рамках ответа на иск издателей в конце 2020 года Архив запустил кампанию под названием «Расширение возможностей библиотек» (хэштег #EmpoweringLibraries), в которой иск изображался как угроза для всех библиотек. [209]
В препринтной статье 2021 года Аргири Панези утверждал, что это дело «поднимает два важных, но отдельных вопроса, связанных с электронным доступом к библиотечным произведениям; материалов, защищенных авторским правом, может быть добросовестным использованием» и утверждал, что библиотеки играют роль общественной службы, позволяющей «будущим поколениям продолжать иметь равный доступ - или возможности доступа - ко множеству оригинальных источников». [210]
В декабре 2020 года издание Publishers Weekly включило этот иск в «10 лучших библиотечных историй 2020 года». [211]
24 марта 2023 года судья Кёлтл вынес решение против Интернет-архива по этому делу, заявив, что концепция Национальной библиотеки экстренной помощи не является добросовестным использованием, поэтому Архив нарушил свои авторские права, предоставив книги без ограничения списка ожидания. Затем было достигнуто соглашение о том, что Интернет-архив выплатит издателям нераскрытую сумму. [212] Интернет-архив впоследствии заявил, что подаст апелляцию на это решение, но в противном случае продолжит работу над другими услугами цифровых книг, которые ранее были одобрены прецедентным правом, например, книгами для пользователей с нарушениями чтения. [213] [214] Обновленный отчет об апелляционном процессе с участием The Internet Archive был опубликован 18 декабря 2023 года на сайте TorrentFreak News. [215]
В условиях чрезвычайной ситуации, связанной с пандемией, Интернет-архив Брюстера Кале бесплатно предоставил цифровые сканы своей библиотеки. Издатели подали в суд. Владение книгой теперь означает нечто иное.
Уже более восьмидесяти лет MIT Press публикует признанные издания в области науки, технологий, искусства и архитектуры. Теперь, благодаря новому партнерству между Интернет-архивом и MIT Press, читатели впервые смогут брать эту классику онлайн.
С тех пор, как она стала директором [MIT Press] в 2015 году, мало что Брэнд не переосмыслил в прессе. В 2017 году пресса заключила партнерство с Интернет-архивом, чтобы бесплатно предоставить доступ к своему глубокому списку в библиотеках, возродив книги, которые не видели свет на протяжении нескольких поколений.
Интернет-архив получил грант в 1 миллион долларов от Аркадии — благотворительного фонда Лисбет Раузинг и Питера Болдуина — на оцифровку изданий из коллекций университетской прессы, чтобы сделать их доступными посредством контролируемого цифрового кредитования.
Интернет-архив включает полные тексты более 2,5 миллионов электронных книг, включая электронные книги, предоставленные Библиотекой Конгресса. Книги можно читать онлайн или скачивать и читать в различных форматах. Электронные книги из Интернет-архива также можно найти в Открытой библиотеке — инициативе Интернет-архива, посвященной текстам.И: Хохман, Дж. Шайенн; Могол, Ясмин (2017) [апрель 2011 г.]. «Устройства и форматы – Поиск электронных книг: Руководство – Библиографии Библиотеки Конгресса, исследовательские руководства и вспомогательные средства (виртуальные программы и услуги)». Библиотека Конгресса . Архивировано из оригинала 12 февраля 2021 года . Проверено 25 ноября 2020 г.
Публикации Библиотеки Конгресса доступны для бесплатной загрузки на Kindle из Интернет-архива. ... iPad можно использовать в качестве устройства для чтения электронных книг с помощью таких приложений, как iBooks, которые поддерживают форматы ePub (.epub) и PDF (.pdf). Оба формата доступны в Интернет-архиве.
Интернет-архив содержит огромную коллекцию бесплатной загружаемой музыки в категории NetLabels...
Брюстер Кале, человек, стоящий за проектом по архивированию каждой веб-страницы, теперь хочет собирать по одному экземпляру каждой опубликованной книги.
Компьютерные программы и видеоигры, распространяемые в устаревших форматах и требующие наличия оригинального носителя или аппаратного обеспечения в качестве условия доступа, когда обход осуществляется с целью сохранения или архивного воспроизведения опубликованных цифровых произведений библиотекой или архивом. Формат считается устаревшим, если машина или система, необходимые для того, чтобы сделать воспринимаемым произведение, хранящееся в этом формате, больше не производятся или более не доступны на коммерческом рынке.
Доступ к коллекциям Архива предоставляется вам бесплатно и только в научных и исследовательских целях.