stringtranslate.com

архив.сегодня

archive.today (или archive.is ) — это сайт веб-архивирования , основанный в 2012 году, который сохраняет снимки по запросу и поддерживает сайты с большим количеством JavaScript , такие как Google Maps , и прогрессивные веб-приложения, такие как Twitter . [3] archive.today записывает два снимка: один копирует исходную веб-страницу, включая все функциональные действующие ссылки; другой — скриншот страницы. [4]

Сайт не предоставляет информацию о личности оператора(ов). [5]

История

Archive.today был основан в 2012 году. Первоначально сайт назывался archive.today, но в мае 2015 года основное зеркало было изменено на archive.is. [6]

В январе 2019 года домен archive.is начал отказываться от поддержки других зеркал. [7]

Функции

Функциональность

Archive.today может захватывать отдельные страницы в ответ на явные запросы пользователей. [8] [9] [10] С самого начала он поддерживал сканирование страниц с URL-адресами , содержащими ныне устаревший фрагмент хэш-bang ( #! ). [11]

Archive.today записывает только текст и изображения, исключая XML , RTF , электронные таблицы ( xls или ods ) и другой нестатический контент. Однако видео для некоторых сайтов, например Twitter , сохраняются. [12] Он отслеживает историю сохраненных снимков и запрашивает подтверждение перед добавлением нового снимка уже сохраненной страницы. [13] [14]

Страницы захватываются при ширине браузера 1024 пикселя. CSS преобразуется во встроенный CSS, при этом удаляются адаптивный веб-дизайн и селекторы, такие как :hoverи :active. Содержимое, созданное с помощью JavaScript в процессе сканирования, отображается в замороженном состоянии. [15] Имена классов HTML сохраняются внутри old-class атрибута . Когда текст выделен , апплет JavaScript генерирует фрагмент URL-адреса , отображаемый в адресной строке браузера , который автоматически выделяет эту часть текста при повторном посещении.

Веб-страницы нельзя дублировать с archive.today на web.archive.org в качестве резервной копии второго уровня , поскольку archive.today исключает Wayback Machine и не сохраняет ее снимки в формате WARC. Обратное — с web.archive.org на archive.today — возможно, [16] , но копирование обычно занимает больше времени, чем прямой захват. Некоторые веб-сайты удаляются из списков Internet Archive задним числом или блокируются от сохранения из-за файла robots.txt , но archive.today не использует это. [10]

Панель инструментов исследования позволяет использовать расширенные операторы ключевых слов, используя *в качестве подстановочного знака . Пара кавычек адресует поиск по точной последовательности ключевых слов, присутствующих в заголовке или теле веб-страницы, тогда как оператор внутреннего сайта ограничивает его конкретным доменом Интернета. [17]

После того как веб-страница заархивирована, ни один пользователь Интернета не может ее удалить напрямую. [18] Удалить рекламу, всплывающие окна или расширить ссылки с заархивированных страниц можно, попросив владельца сделать это в его блоге. [19]

При сохранении динамического списка в поле поиска archive.today отображается только результат, который связывает предыдущий и следующий раздел списка (например, 20 ссылок на страницу). [20] Остальные сохраненные веб-страницы фильтруются, и иногда их можно найти по одному из их вхождений. [13] [ нужны разъяснения ]

Функция поиска поддерживается Google CustomSearch. Если он не дает результатов, archive.today пытается использовать Поиск Яндекса . [21]

При сохранении страницы отображается список URL-адресов отдельных элементов страницы и размеров их содержимого, статусы HTTP и типы MIME . Этот список можно просмотреть только в процессе сканирования.

Заархивированные страницы можно скачать в виде ZIP-файла, за исключением страниц, заархивированных с 29 ноября 2019 года, когда archive.today сменил движок браузера с PhantomJS на Chromium . [22]

В июле 2013 года Archive.today начал поддержку API проекта Memento . [23] [24]

Доступность по всему миру

Австралия

В марте 2019 года сайт был заблокирован на шесть месяцев несколькими австралийскими интернет-провайдерами после стрельбы в мечети Крайстчерча в попытке ограничить распространение видеозаписи нападения. [25] [26] С тех пор он был разблокирован.

Китай

По данным GreatFire.org , archive.today заблокирован в материковом Китае с марта 2016 года, [27] archive.li с сентября 2017 года, [28] archive.fo с июля 2018 года, [29] а также archive.ph с декабря. 2019. [30]

Финляндия

21 июля 2015 года операторы заблокировали доступ к сервису со всех финских IP-адресов , заявив в Twitter, что сделали это во избежание эскалации спора, который у них якобы возник с правительством Финляндии. [31]

Россия

В России возможен только HTTP-доступ; HTTPS-соединения заблокированы. [32] [33] HTTP не шифруется, в отличие от HTTPS, поэтому агенты, прослушивающие сеть, могут читать и изменять в процессе передачи всю информацию, включая URL-адрес запрошенной страницы, возвращаемый контент и строки, идентифицирующие отправителя. устройство (например, User-Agent и файлы cookie).

Доступность DNS Cloudflare

В период с мая 2018 года [34] по май 2022 года [35] DNS- сервис Cloudflare 1.1.1.1 не разрешал веб-адреса archive.today, что делало его недоступным для пользователей DNS-сервиса Cloudflare . Обе организации заявили, что ответственность за проблему несет другая. Сотрудники Cloudflare заявили, что проблема была в DNS-инфраструктуре archive.today, поскольку ее авторитетные серверы имен возвращали неверные записи, когда сетевые системы Cloudflare отправляли запросы archive.today. archive.today возразил, что проблема возникла из-за того, что запросы Cloudflare не соответствовали стандартам DNS, поскольку Cloudflare не отправляет информацию о подсети клиента EDNS в своих DNS-запросах. [36] [37] Впоследствии проблема была решена. [ нужна ссылка ] [ нужно обновить ]

Смотрите также

Рекомендации

  1. ^ @archiveis (29 октября 2019 г.). «Текущий список всех доменов Tor и доменов Clear Net» (Твит) – через Twitter .
  2. Блог Archive.is (18 февраля 2014 г.). «Когда впервые был запущен сайт Archive-is?». Тамблер . Архивировано из оригинала 20 марта 2021 года . Проверено 10 апреля 2021 г.
  3. Бринкманн, Мартин (22 апреля 2015 г.). «Создавайте общедоступные архивы веб-страниц с помощью Archive.is». Гаки . Архивировано из оригинала 12 апреля 2019 года . Проверено 13 июня 2015 г.
  4. ^ Брунель, Джастин Ф.; Келли, Мэт; Вейгл, Мишель К.; Нельсон, Майкл Л. (25 января 2015 г.). «Влияние JavaScript на архивируемость» (PDF) . Международный журнал цифровых библиотек . 17 (2): 95–117. дои : 10.1007/s00799-015-0140-8. S2CID  8433375. Архивировано (PDF) из оригинала 27 мая 2019 года.
  5. Патокаллио, Яни (5 августа 2023 г.). «archive.today: По следам загадочного партизана-архивиста Интернета». Джироваг . Проверено 1 января 2024 г.
  6. ^ «Почему вы снова изменили URL-адрес с archive-today на archive-is?». Блог Archive.is . 3 мая 2015 г. Архивировано из оригинала 1 июня 2015 г. Проверено 6 января 2019 г.
  7. ^ @archiveis (4 января 2019 г.). «Пожалуйста, не используйте зеркало archive.IS для связывания, используйте другие зеркала [.TODAY .FO .LI .VN .MD .PH]. .IS может скоро перестать работать» (Твит). Архивировано из оригинала 6 января 2019 года — через Twitter .
  8. Даскалеску, Дэн (18 февраля 2013 г.). «Архивирование веб-страниц - Wiki Дэна Даскалеску (обзор)». Wiki.dandascalescu.com. Архивировано из оригинала 22 сентября 2013 года . Проверено 3 октября 2013 г.
  9. Кеблер, Джейсон (29 октября 2014 г.). «Дорогой GamerGate: пожалуйста, прекратите воровать наше дерьмо». Материнская плата . Архивировано из оригинала 27 мая 2019 года . Проверено 22 марта 2017 г. Веб-сайт не может защитить себя от зеркалирования сайта пользователем Archive.today.
  10. ^ ab «Часто задаваемые вопросы по Archive.today». архив.сегодня . Проверено 15 февраля 2019 г.
  11. ^ "Домашняя страница Archive.is в 2013 году" . Архивировано из оригинала 12 января 2013 года.
  12. ^ "Блог Archive.today" . Архивировано из оригинала 7 сентября 2021 года.
  13. ^ ab Архивирование веб-сайтов с помощью Archive.is, заархивировано из оригинала 27 января 2022 г. , получено 27 января 2022 г.
  14. ^ «Пример истории снимков на archive.is» .
  15. ^ Сгенерированная JavaScript анимация загрузки видео Dailymotion , появляющаяся в замороженном состоянии.
  16. ^ «Пример: страница сохранена из веб-архива в Archive.is» (на испанском языке). Архивировано из оригинала 20 мая 2013 года . Проверено 23 октября 2019 г.
  17. ^ Например, строка на сайте: https://en.wikipedia.org «Чемпионат мира» возвращает «World+Cup»/связанные снимки.
  18. ^ «Некоторые часто задаваемые вопросы» (блог) . архив.есть . 24 января 2013 года. Архивировано из оригинала 26 сентября 2013 года . Проверено 12 ноября 2018 г.
  19. ^ «Пример запроса пользователя в блоге Archive.is» . Блог Archive.is . Архивировано из оригинала 29 апреля 2022 года . Проверено 7 апреля 2022 г.
  20. ^ «Пример динамического списка» . WorldCat.org . Архивировано из оригинала 23 марта 2019 года . Проверено 15 декабря 2018 г.
  21. ^ «Только что понял, что сегодня могу искать архив по ключевым словам в строке поиска, это была недавно добавленная функция?». Блог Archive.is . Архивировано из оригинала 27 января 2022 года . Проверено 27 января 2022 г.
  22. ^ "Блог Archive.is" . 17 июля 2020 г. Архивировано из оригинала 3 октября 2020 г.
  23. Нельсон, Майкл Л. (9 июля 2013 г.). «Archive.is поддерживает Memento» . Обновления исследований и преподавания . Группа исследования веб-науки и цифровых библиотек в Университете Олд-Доминион . Архивировано из оригинала 27 июля 2013 года . Проверено 17 сентября 2013 г.
  24. Ссылки _ Информация протокола на память . Группа развития Мементо. Архивировано из оригинала 15 сентября 2013 года . Проверено 17 сентября 2013 г.
  25. ^ «Интернет-провайдеры в Австралии и Новой Зеландии начинают цензурировать Интернет без правового прецедента» . Частный доступ в Интернет . 19 марта 2019 года. Архивировано из оригинала 28 апреля 2023 года . Проверено 20 марта 2019 г.
  26. ^ «Новозеландские интернет-провайдеры заявляют, что блокируют сайты, которые не могут удалить видео стрельбы в Крайстчерче» . Гизмодо Австралия . 19 марта 2019 года. Архивировано из оригинала 18 мая 2019 года . Проверено 20 марта 2019 г.
  27. ^ «archive.is на 100% заблокирован в Китае» . Анализатор GreatFire . 12 августа 2018 г. Архивировано из оригинала 12 августа 2018 г.
  28. ^ «archive.li на 100% заблокирован в Китае» . Отличный анализатор пожаров . 12 августа 2018 г. Архивировано из оригинала 12 августа 2018 г.
  29. ^ «archive.fo на 100% заблокирован в Китае» . Отличный анализатор пожаров . 12 августа 2018 г. Архивировано из оригинала 12 августа 2018 г.
  30. ^ «archive.ph на 100% заблокирован в Китае» . ru.greatfire.org . Архивировано из оригинала 29 апреля 2022 года . Проверено 7 апреля 2022 г.
  31. Лапинти, Ласси (22 июля 2015 г.). «Suomalaisilta estettiin haktivistien suosimalla verkkosivulla käynti» [Доступ финнов к веб-сайту, используемому хактивистами, заблокирован]. Илталехти (на финском языке). Архивировано из оригинала 27 мая 2019 года . Проверено 4 марта 2016 г.
  32. ^ Елистратов, Владимир (29 января 2016 г.). «Роскомнадзор заблокировал сервис archive.is, хранящий копии веб-сайтов» Роскомнадзор заблокировал сервис archive.is, хранящий копии веб-сайтов. TJournal (на русском языке). Архивировано из оригинала 30 августа 2017 года . Проверено 30 января 2016 г.
  33. Кушинг, Тим (4 февраля 2016 г.). «Россия блокирует еще один архивный сайт, поскольку он может содержать старые страницы о наркотиках». Техдирт . Архивировано из оригинала 23 марта 2019 года . Проверено 26 февраля 2016 г.
  34. ^ "Archive.is - Ошибка 1001" . Сообщество Cloudflare . 15 мая 2018 г. Архивировано из оригинала 2 декабря 2021 г. Проверено 2 декабря 2021 г.
  35. ^ «Archive.today снова работает на 1.1.1.1 (и archive.{ph,is,li,vn,fo,md})». Сообщество Cloudflare . 22 мая 2022 г. Проверено 12 марта 2023 г.
  36. ^ @archiveis (16 июля 2018 г.). «Здесь «необходимо сделать» не так однозначно. Отсутствие EDNS и массовое несоответствие (не только на уровне AS/страны, но даже на уровне континента) того, откуда поступают DNS и связанные с ним HTTP-запросы, вызывают так много проблем, поэтому я рассматриваю EDNS. -меньше запросов от Cloudflare как недействительных» (Твит) – через Twitter .
  37. ^ «Комментарий Мэтью Принса к Hacker News» . Хакерские новости . 4 мая 2019 г. Архивировано из оригинала 13 мая 2022 г. . Проверено 4 октября 2021 г.

Внешние ссылки