Онлайн веб-архив
archive.today (или archive.is ) — это сайт веб-архивирования , основанный в 2012 году, который сохраняет снимки по запросу и поддерживает сайты с большим количеством JavaScript , такие как Google Maps , и прогрессивные веб-приложения, такие как Twitter . [3] archive.today записывает два снимка: один копирует исходную веб-страницу, включая все функциональные действующие ссылки; другой — скриншот страницы. [4]
Сайт не предоставляет информацию о личности оператора(ов). [5]
История
Archive.today был основан в 2012 году. Первоначально сайт назывался archive.today, но в мае 2015 года основное зеркало было изменено на archive.is. [6]
В январе 2019 года домен archive.is начал отказываться от поддержки других зеркал. [7]
Функции
Функциональность
Archive.today может захватывать отдельные страницы в ответ на явные запросы пользователей. [8] [9] [10] С самого начала он поддерживал сканирование страниц с URL-адресами , содержащими ныне устаревший фрагмент хэш-bang ( #! ). [11]
Archive.today записывает только текст и изображения, исключая XML , RTF , электронные таблицы ( xls или ods ) и другой нестатический контент. Однако видео для некоторых сайтов, например Twitter , сохраняются. [12] Он отслеживает историю сохраненных снимков и запрашивает подтверждение перед добавлением нового снимка уже сохраненной страницы. [13] [14]
Страницы захватываются при ширине браузера 1024 пикселя. CSS преобразуется во встроенный CSS, при этом удаляются адаптивный веб-дизайн и селекторы, такие как :hover
и :active
. Содержимое, созданное с помощью JavaScript в процессе сканирования, отображается в замороженном состоянии. [15] Имена классов HTML сохраняются внутри old-class
атрибута . Когда текст выделен , апплет JavaScript генерирует фрагмент URL-адреса , отображаемый в адресной строке браузера , который автоматически выделяет эту часть текста при повторном посещении.
Веб-страницы нельзя дублировать с archive.today на web.archive.org в качестве резервной копии второго уровня , поскольку archive.today исключает Wayback Machine и не сохраняет ее снимки в формате WARC. Обратное — с web.archive.org на archive.today — возможно, [16] , но копирование обычно занимает больше времени, чем прямой захват. Некоторые веб-сайты удаляются из списков Internet Archive задним числом или блокируются от сохранения из-за файла robots.txt , но archive.today не использует это. [10]
Панель инструментов исследования позволяет использовать расширенные операторы ключевых слов, используя *
в качестве подстановочного знака . Пара кавычек адресует поиск по точной последовательности ключевых слов, присутствующих в заголовке или теле веб-страницы, тогда как оператор внутреннего сайта ограничивает его конкретным доменом Интернета. [17]
После того как веб-страница заархивирована, ни один пользователь Интернета не может ее удалить напрямую. [18]
Удалить рекламу, всплывающие окна или расширить ссылки с заархивированных страниц можно, попросив владельца сделать это в его блоге. [19]
При сохранении динамического списка в поле поиска archive.today отображается только результат, который связывает предыдущий и следующий раздел списка (например, 20 ссылок на страницу). [20] Остальные сохраненные веб-страницы фильтруются, и иногда их можно найти по одному из их вхождений. [13] [ нужны разъяснения ]
Функция поиска поддерживается Google CustomSearch. Если он не дает результатов, archive.today пытается использовать Поиск Яндекса . [21]
При сохранении страницы отображается список URL-адресов отдельных элементов страницы и размеров их содержимого, статусы HTTP и типы MIME . Этот список можно просмотреть только в процессе сканирования.
Заархивированные страницы можно скачать в виде ZIP-файла, за исключением страниц, заархивированных с 29 ноября 2019 года, [обновлять]когда archive.today сменил движок браузера с PhantomJS на Chromium . [22]
В июле 2013 года Archive.today начал поддержку API проекта Memento . [23] [24]
Доступность по всему миру
Австралия
В марте 2019 года сайт был заблокирован на шесть месяцев несколькими австралийскими интернет-провайдерами после стрельбы в мечети Крайстчерча в попытке ограничить распространение видеозаписи нападения. [25] [26] С тех пор он был разблокирован.
Китай
По данным GreatFire.org , archive.today заблокирован в материковом Китае с марта 2016 года, [27] archive.li с сентября 2017 года, [28] archive.fo с июля 2018 года, [29] а также archive.ph с декабря. 2019. [30][обновлять][обновлять][обновлять][обновлять]
Финляндия
21 июля 2015 года операторы заблокировали доступ к сервису со всех финских IP-адресов , заявив в Twitter, что сделали это во избежание эскалации спора, который у них якобы возник с правительством Финляндии. [31]
Россия
В России возможен только HTTP-доступ; HTTPS-соединения заблокированы. [32] [33] HTTP не шифруется, в отличие от HTTPS, поэтому агенты, прослушивающие сеть, могут читать и изменять в процессе передачи всю информацию, включая URL-адрес запрошенной страницы, возвращаемый контент и строки, идентифицирующие отправителя. устройство (например, User-Agent и файлы cookie).
Доступность DNS Cloudflare
В период с мая 2018 года [34] по май 2022 года [35] DNS- сервис Cloudflare 1.1.1.1 не разрешал веб-адреса archive.today, что делало его недоступным для пользователей DNS-сервиса Cloudflare . Обе организации заявили, что ответственность за проблему несет другая. Сотрудники Cloudflare заявили, что проблема была в DNS-инфраструктуре archive.today, поскольку ее авторитетные серверы имен возвращали неверные записи, когда сетевые системы Cloudflare отправляли запросы archive.today. archive.today возразил, что проблема возникла из-за того, что запросы Cloudflare не соответствовали стандартам DNS, поскольку Cloudflare не отправляет информацию о подсети клиента EDNS в своих DNS-запросах. [36] [37] Впоследствии проблема была решена. [ нужна ссылка ] [ нужно обновить ]
Смотрите также
Рекомендации
- ^ @archiveis (29 октября 2019 г.). «Текущий список всех доменов Tor и доменов Clear Net» (Твит) – через Twitter .
- ↑ Блог Archive.is (18 февраля 2014 г.). «Когда впервые был запущен сайт Archive-is?». Тамблер . Архивировано из оригинала 20 марта 2021 года . Проверено 10 апреля 2021 г.
- ↑ Бринкманн, Мартин (22 апреля 2015 г.). «Создавайте общедоступные архивы веб-страниц с помощью Archive.is». Гаки . Архивировано из оригинала 12 апреля 2019 года . Проверено 13 июня 2015 г.
- ^ Брунель, Джастин Ф.; Келли, Мэт; Вейгл, Мишель К.; Нельсон, Майкл Л. (25 января 2015 г.). «Влияние JavaScript на архивируемость» (PDF) . Международный журнал цифровых библиотек . 17 (2): 95–117. дои : 10.1007/s00799-015-0140-8. S2CID 8433375. Архивировано (PDF) из оригинала 27 мая 2019 года.
- ↑ Патокаллио, Яни (5 августа 2023 г.). «archive.today: По следам загадочного партизана-архивиста Интернета». Джироваг . Проверено 1 января 2024 г.
- ^ «Почему вы снова изменили URL-адрес с archive-today на archive-is?». Блог Archive.is . 3 мая 2015 г. Архивировано из оригинала 1 июня 2015 г. Проверено 6 января 2019 г.
- ^ @archiveis (4 января 2019 г.). «Пожалуйста, не используйте зеркало archive.IS для связывания, используйте другие зеркала [.TODAY .FO .LI .VN .MD .PH]. .IS может скоро перестать работать» (Твит). Архивировано из оригинала 6 января 2019 года — через Twitter .
- ↑ Даскалеску, Дэн (18 февраля 2013 г.). «Архивирование веб-страниц - Wiki Дэна Даскалеску (обзор)». Wiki.dandascalescu.com. Архивировано из оригинала 22 сентября 2013 года . Проверено 3 октября 2013 г.
- ↑ Кеблер, Джейсон (29 октября 2014 г.). «Дорогой GamerGate: пожалуйста, прекратите воровать наше дерьмо». Материнская плата . Архивировано из оригинала 27 мая 2019 года . Проверено 22 марта 2017 г.
Веб-сайт не может защитить себя от зеркалирования сайта пользователем Archive.today.
- ^ ab «Часто задаваемые вопросы по Archive.today». архив.сегодня . Проверено 15 февраля 2019 г.
- ^ "Домашняя страница Archive.is в 2013 году" . Архивировано из оригинала 12 января 2013 года.
- ^ "Блог Archive.today" . Архивировано из оригинала 7 сентября 2021 года.
- ^ ab Архивирование веб-сайтов с помощью Archive.is, заархивировано из оригинала 27 января 2022 г. , получено 27 января 2022 г.
- ^ «Пример истории снимков на archive.is» .
- ^ Сгенерированная JavaScript анимация загрузки видео Dailymotion , появляющаяся в замороженном состоянии.
- ^ «Пример: страница сохранена из веб-архива в Archive.is» (на испанском языке). Архивировано из оригинала 20 мая 2013 года . Проверено 23 октября 2019 г.
- ^ Например, строка на сайте: https://en.wikipedia.org «Чемпионат мира» возвращает «World+Cup»/связанные снимки.
- ^ «Некоторые часто задаваемые вопросы» (блог) . архив.есть . 24 января 2013 года. Архивировано из оригинала 26 сентября 2013 года . Проверено 12 ноября 2018 г.
- ^ «Пример запроса пользователя в блоге Archive.is» . Блог Archive.is . Архивировано из оригинала 29 апреля 2022 года . Проверено 7 апреля 2022 г.
- ^ «Пример динамического списка» . WorldCat.org . Архивировано из оригинала 23 марта 2019 года . Проверено 15 декабря 2018 г.
- ^ «Только что понял, что сегодня могу искать архив по ключевым словам в строке поиска, это была недавно добавленная функция?». Блог Archive.is . Архивировано из оригинала 27 января 2022 года . Проверено 27 января 2022 г.
- ^ "Блог Archive.is" . 17 июля 2020 г. Архивировано из оригинала 3 октября 2020 г.
- ↑ Нельсон, Майкл Л. (9 июля 2013 г.). «Archive.is поддерживает Memento» . Обновления исследований и преподавания . Группа исследования веб-науки и цифровых библиотек в Университете Олд-Доминион . Архивировано из оригинала 27 июля 2013 года . Проверено 17 сентября 2013 г.
- Ссылки _ Информация протокола на память . Группа развития Мементо. Архивировано из оригинала 15 сентября 2013 года . Проверено 17 сентября 2013 г.
- ^ «Интернет-провайдеры в Австралии и Новой Зеландии начинают цензурировать Интернет без правового прецедента» . Частный доступ в Интернет . 19 марта 2019 года. Архивировано из оригинала 28 апреля 2023 года . Проверено 20 марта 2019 г.
- ^ «Новозеландские интернет-провайдеры заявляют, что блокируют сайты, которые не могут удалить видео стрельбы в Крайстчерче» . Гизмодо Австралия . 19 марта 2019 года. Архивировано из оригинала 18 мая 2019 года . Проверено 20 марта 2019 г.
- ^ «archive.is на 100% заблокирован в Китае» . Анализатор GreatFire . 12 августа 2018 г. Архивировано из оригинала 12 августа 2018 г.
- ^ «archive.li на 100% заблокирован в Китае» . Отличный анализатор пожаров . 12 августа 2018 г. Архивировано из оригинала 12 августа 2018 г.
- ^ «archive.fo на 100% заблокирован в Китае» . Отличный анализатор пожаров . 12 августа 2018 г. Архивировано из оригинала 12 августа 2018 г.
- ^ «archive.ph на 100% заблокирован в Китае» . ru.greatfire.org . Архивировано из оригинала 29 апреля 2022 года . Проверено 7 апреля 2022 г.
- ↑ Лапинти, Ласси (22 июля 2015 г.). «Suomalaisilta estettiin haktivistien suosimalla verkkosivulla käynti» [Доступ финнов к веб-сайту, используемому хактивистами, заблокирован]. Илталехти (на финском языке). Архивировано из оригинала 27 мая 2019 года . Проверено 4 марта 2016 г.
- ^ Елистратов, Владимир (29 января 2016 г.). «Роскомнадзор заблокировал сервис archive.is, хранящий копии веб-сайтов» Роскомнадзор заблокировал сервис archive.is, хранящий копии веб-сайтов. TJournal (на русском языке). Архивировано из оригинала 30 августа 2017 года . Проверено 30 января 2016 г.
- ↑ Кушинг, Тим (4 февраля 2016 г.). «Россия блокирует еще один архивный сайт, поскольку он может содержать старые страницы о наркотиках». Техдирт . Архивировано из оригинала 23 марта 2019 года . Проверено 26 февраля 2016 г.
- ^ "Archive.is - Ошибка 1001" . Сообщество Cloudflare . 15 мая 2018 г. Архивировано из оригинала 2 декабря 2021 г. Проверено 2 декабря 2021 г.
- ^ «Archive.today снова работает на 1.1.1.1 (и archive.{ph,is,li,vn,fo,md})». Сообщество Cloudflare . 22 мая 2022 г. Проверено 12 марта 2023 г.
- ^ @archiveis (16 июля 2018 г.). «Здесь «необходимо сделать» не так однозначно. Отсутствие EDNS и массовое несоответствие (не только на уровне AS/страны, но даже на уровне континента) того, откуда поступают DNS и связанные с ним HTTP-запросы, вызывают так много проблем, поэтому я рассматриваю EDNS. -меньше запросов от Cloudflare как недействительных» (Твит) – через Twitter .
- ^ «Комментарий Мэтью Принса к Hacker News» . Хакерские новости . 4 мая 2019 г. Архивировано из оригинала 13 мая 2022 г. . Проверено 4 октября 2021 г.
Внешние ссылки
Викискладе есть медиафайлы по теме archive.today .
- Официальный веб-сайт
- Archive.is на Tumblr
- archive.today в Твиттере
- archive.today на archiveteam.org
- archive.ph/faq
- «archive.today: По следам загадочного партизана-архивиста Интернета», Жироваг , 5 августа 2023 г.