stringtranslate.com

архив.сегодня

archive.today (ранее archive.is ) — веб- сайт для архивирования, основанный в 2012 году, который сохраняет снимки по запросу и поддерживает сайты с большим объемом JavaScript, такие как Google Maps и X . [3] archive.today записывает два снимка: один копирует исходную веб-страницу, включая все функциональные активные ссылки; другой — снимок экрана страницы. [4]

Личность его оператора неизвестна. [5]

История

Archive.today был основан в 2012 году. Первоначально сайт назывался archive.today, но в мае 2015 года сменил основное зеркало на archive.is. [6] В январе 2019 года он начал отказываться от домена archive.is в пользу других зеркал. [7]

По состоянию на 2021 год archive.today сохранил около 500 миллионов страниц. [5]

Функции

Функциональность

Archive.today может захватывать отдельные страницы в ответ на явные запросы пользователей. [8] [9] [10] С самого начала он поддерживал сканирование страниц с URL-адресами, содержащими устаревший фрагмент решетки ( #! ). [11]

Archive.today записывает только текст и изображения, исключая XML , RTF , электронные таблицы ( xls или ods ) и другой нестатичный контент. Однако видео для определенных сайтов, таких как X (ранее Twitter) , сохраняются. [12] Он отслеживает историю сохраненных снимков, запрашивая подтверждение перед добавлением нового снимка уже сохраненной страницы. [13] [14]

Страницы захватываются при ширине браузера 1024 пикселя. CSS преобразуется во встроенный CSS, удаляя адаптивный веб-дизайн и селекторы, такие как :hoverи :active. Содержимое, сгенерированное с помощью JavaScript в процессе сканирования, отображается в замороженном состоянии. [15] Имена классов HTML сохраняются внутри old-class атрибута . При выборе текста апплет JavaScript генерирует фрагмент URL , отображаемый в адресной строке браузера , который автоматически выделяет эту часть текста при повторном посещении.

Веб-страницы можно дублировать из archive.today в web.archive.org в качестве резервной копии второго уровня , но archive.today не сохраняет свои снимки в формате WARC. Обратное — из web.archive.org в archive.today — также возможно, [16] но копирование обычно занимает больше времени, чем прямой захват. Исторически владельцы веб-сайтов имели возможность отказаться от Wayback Machine с помощью стандарта исключения роботов (robots.txt), и эти исключения также применялись ретроспективно. [17] Archive.today не подчиняется robots.txt, потому что он действует «как прямой агент пользователя-человека». [10] По состоянию на 2019 год Wayback Machine больше не подчиняется robots.txt.

Панель инструментов исследования позволяет использовать расширенные операторы ключевых слов, используя *в качестве подстановочного знака . Пара кавычек адресует поиск к точной последовательности ключевых слов, присутствующих в заголовке или в теле веб-страницы, тогда как оператор insite ограничивает его определенным интернет-доменом. [18]

После того, как веб-страница архивирована, она не может быть удалена напрямую любым пользователем Интернета. [19] Удаление рекламы, всплывающих окон или расширяющихся ссылок с архивированных страниц возможно, если попросить владельца сделать это в его блоге. [20]

При сохранении динамического списка поле поиска archive.today показывает только результат, который связывает предыдущий и следующий разделы списка (например, 20 ссылок для страницы). [21] Другие сохраненные веб-страницы фильтруются и иногда могут быть найдены по одному из их вхождений. [13] [ необходимо разъяснение ]

Функция поиска поддерживается Google CustomSearch. Если он не дает результатов, archive.today пытается использовать поиск Яндекса . [22]

При сохранении страницы отображается список URL-адресов отдельных элементов страницы и их размеров содержимого, статусов HTTP и типов MIME . Этот список можно просматривать только во время сканирования.

Можно загрузить архивированные страницы в виде ZIP-файла, за исключением страниц, заархивированных с 29 ноября 2019 года, когда archive.today сменил свой браузерный движок с PhantomJS на Chromium . [23]

В июле 2013 года Archive.today начал поддерживать API проекта Memento . [24] [25]

Доступность по всему миру

Австралия и Новая Зеландия

В марте 2019 года сайт был заблокирован на шесть месяцев несколькими интернет-провайдерами в Австралии и Новой Зеландии после стрельбы в мечети Крайстчерча в попытке ограничить распространение видеозаписи нападения. [26] [27]

Китай

По данным GreatFire .org, archive.today заблокирован в материковом Китае с марта 2016 года, [28] archive.li — с сентября 2017 года, [29] archive.fo — с июля 2018 года, [30] а archive.ph — с декабря 2019 года. [31]

Финляндия

21 июля 2015 года операторы заблокировали доступ к сервису со всех финских IP-адресов , заявив в Twitter, что они сделали это для того, чтобы избежать эскалации спора, который они якобы имели с финским правительством. [32]

Россия

В 2016 году Роскомнадзор начал блокировать доступ к archive.is из России. [33] [34]

Доступность Cloudflare DNS

С мая 2018 года [35] [36] DNS- сервис Cloudflare 1.1.1.1 не разрешал веб-адреса archive.today, что делало его недоступным для пользователей DNS-сервиса Cloudflare. Обе организации утверждали, что за проблему несет ответственность другая. Сотрудники Cloudflare заявили, что проблема была в DNS-инфраструктуре archive.today, поскольку ее авторитетные серверы имен возвращали недействительные записи, когда сетевые системы Cloudflare делали запросы к archive.today. archive.today возразил, что проблема была связана с несоответствием запросов Cloudflare стандартам DNS, поскольку Cloudflare не отправляет информацию о подсети клиента EDNS в своих DNS-запросах. [37] [38]

Смотрите также

Ссылки

  1. ^ @archiveis (30 октября 2019 г.). «текущий список всех доменов Tor и доменов Clear Net» ( Твит ) – через Twitter .
  2. ^ Блог Archive.is (18 февраля 2014 г.). «Когда изначально был запущен сайт Archive-is?». Tumblr . Архивировано из оригинала 20 марта 2021 г. Получено 10 апреля 2021 г.
  3. ^ Бринкманн, Мартин (22 апреля 2015 г.). «Создание общедоступных архивов веб-страниц с помощью Archive.is». Ghacks . Архивировано из оригинала 12 апреля 2019 г. Получено 13 июня 2015 г.
  4. ^ Брунелле, Джастин Ф.; Келли, Мэт; Вайгл, Мишель К.; Нельсон, Майкл Л. (25 января 2015 г.). «Влияние JavaScript на архивируемость» (PDF) . Международный журнал цифровых библиотек . 17 (2): 95–117. doi :10.1007/s00799-015-0140-8. S2CID  8433375. Архивировано (PDF) из оригинала 27 мая 2019 г.
  5. ^ ab Patokallio, Jani (5 августа 2023 г.). "archive.today: По следам таинственного партизанского архивариуса Интернета". Gyrovague . Архивировано из оригинала 13 августа 2023 г. . Получено 1 января 2024 г. .
  6. ^ «Почему вы изменили URL обратно с archive-today на archive-is?». Блог Archive.is . 3 мая 2015 г. Архивировано из оригинала 1 июня 2015 г. Получено 6 января 2019 г.
  7. ^ @archiveis (4 января 2019 г.). «Пожалуйста, не используйте зеркало archive.IS для ссылок, используйте другие зеркала [.TODAY .FO .LI .VN .MD .PH]. .IS может скоро перестать работать» ( Твит ). Архивировано из оригинала 6 января 2019 г. – через Twitter .
  8. ^ Dascalescu, Dan (18 февраля 2013 г.). «Архивирование веб-страниц – Вики Дэна Даскалеску (обзор)». Wiki.dandascalescu.com. Архивировано из оригинала 22 сентября 2013 г. Получено 3 октября 2013 г.
  9. ^ Кёблер, Джейсон (29 октября 2014 г.). «Дорогой GamerGate: Пожалуйста, прекратите воровать наше дерьмо». Motherboard . Архивировано из оригинала 27 мая 2019 г. Получено 22 марта 2017 г. Веб -сайт не может защитить себя от зеркалирования сайта пользователем Archive.today.
  10. ^ ab "Archive.today FAQ". archive.today . Получено 15 февраля 2019 .
  11. ^ "Домашняя страница Archive.is в 2013 году". Архивировано из оригинала 12 января 2013 года.
  12. ^ "Блог Archive.today". Архивировано из оригинала 7 сентября 2021 г.
  13. ^ ab Архивирование веб-сайтов с помощью Archive.is, 15 апреля 2016 г., заархивировано из оригинала 27 января 2022 г. , извлечено 27 января 2022 г.
  14. ^ "Пример истории снимков на archive.is".
  15. ^ Сгенерированная JavaScript анимация загрузки видео Dailymotion, появляющаяся в замороженном состоянии
  16. ^ "Пример: Страница сохранена из веб-архива в Archive.is" (на испанском языке). Архивировано из оригинала 20 мая 2013 года . Получено 23 октября 2019 года .
  17. ^ "FAQs - Некоторые сайты недоступны из-за Robots.txt или других исключений. Что это значит?". Интернет-архив Wayback Machine . Архивировано из оригинала 15 апреля 2011 г.
  18. ^ Например, строка insite: https://en.wikipedia.org "World Cup" возвращает снимки, связанные с "World+Cup"/
  19. ^ "Some Frequently Asked Question" (блог) . archive.is . 24 января 2013 г. Архивировано из оригинала 26 сентября 2013 г. Получено 12 ноября 2018 г.
  20. ^ "Пример запроса пользователя в блоге Archive.is". Блог Archive.is . Архивировано из оригинала 29 апреля 2022 года . Получено 7 апреля 2022 года .
  21. ^ Пример динамического списка: "au:"thomas aquinas"". WorldCat . Архивировано из оригинала 23 марта 2019 . Получено 15 декабря 2018 .
  22. ^ «Только что понял, что могу искать ключевые слова в строке поиска для архива сегодня, это была недавно добавленная функция?». Блог Archive.is . 18 января 2022 г. Архивировано из оригинала 27 января 2022 г. Получено 27 января 2022 г.
  23. ^ "Кнопка "загрузить zip" уже довольно долго выдает ошибку "Не найдено". Блог Archive.is . 17 июля 2020 г. Архивировано из оригинала 3 октября 2020 г.
  24. ^ Нельсон, Майкл Л. (9 июля 2013 г.). «Archive.is Supports Memento». Обновления исследований и преподавания . Исследовательская группа по веб-науке и цифровым библиотекам в Университете Олд Доминион . Архивировано из оригинала 27 июля 2013 г. . Получено 17 сентября 2013 г.
  25. ^ "archive.is". Информация о протоколе Memento . Группа разработки Memento. Архивировано из оригинала 15 сентября 2013 г. Получено 17 сентября 2013 г.
  26. ^ "Интернет-провайдеры в Австралии и Новой Зеландии начинают цензурировать интернет без правовых прецедентов". Private Internet Access . 19 марта 2019 г. Архивировано из оригинала 28 апреля 2023 г. Получено 20 марта 2019 г.
  27. ^ «Провайдеры интернет-услуг Новой Зеландии заявили, что блокируют сайты, которые не удаляют видео со стрельбой в Крайстчерче». Gizmodo Australia . 19 марта 2019 г. Архивировано из оригинала 18 мая 2019 г. Получено 20 марта 2019 г.
  28. ^ "archive.is на 100% заблокирован в Китае". GreatFire Analyzer . 12 августа 2018 г. Архивировано из оригинала 12 августа 2018 г.
  29. ^ "archive.li на 100% заблокирован в Китае". Great Fire Analyzer . 12 августа 2018 г. Архивировано из оригинала 12 августа 2018 г.
  30. ^ "archive.fo на 100% заблокирован в Китае". Great Fire Analyzer . 12 августа 2018 г. Архивировано из оригинала 12 августа 2018 г.
  31. ^ "archive.ph на 100% заблокирован в Китае". en.greatfire.org . Архивировано из оригинала 29 апреля 2022 г. Получено 7 апреля 2022 г.
  32. Лапинти, Ласси (22 июля 2015 г.). «Suomalaisilta estettiin haktivistien suosimalla verkkosivulla käynti» [Доступ финнов к веб-сайту, используемому хактивистами, заблокирован]. Илталехти (на финском языке). Архивировано из оригинала 27 мая 2019 года . Проверено 4 марта 2016 г.
  33. ^ Елистратов, Владимир (29 января 2016 г.). «Роскомнадзор заблокировал сервис archive.is, хранящий копии веб-сайтов» Роскомнадзор заблокировал сервис archive.is, хранящий копии веб-сайтов. TJournal (на русском языке). Архивировано из оригинала 30 августа 2017 года . Проверено 30 января 2016 г.
  34. ^ Кушинг, Тим (4 февраля 2016 г.). «Россия блокирует еще один архивный сайт, потому что он может содержать старые страницы о наркотиках». Techdirt . Архивировано из оригинала 23 марта 2019 г. Получено 26 февраля 2016 г.
  35. ^ "Archive.is – Ошибка 1001". Сообщество Cloudflare . 15 мая 2018 г. Архивировано из оригинала 2 декабря 2021 г. Получено 2 декабря 2021 г.
  36. ^ "Archive.today и связанные сайты снова не работают". Сообщество Cloudflare . 3 марта 2024 г. Архивировано из оригинала 3 апреля 2024 г. Получено 20 марта 2024 г.
  37. ^ @archiveis (16 июля 2018 г.). ««Необходимость делать» здесь не так очевидна. Отсутствие EDNS и огромное несоответствие (не только на уровне AS/Country, но даже на уровне континента) того, откуда поступают DNS и связанные с ними HTTP-запросы, вызывают так много проблем, что я считаю запросы Cloudflare без EDNS недействительными» ( твит ). Архивировано из оригинала 2 августа 2023 г. – через Twitter .
  38. ^ "Комментарий Мэтью Принса на Hacker News". Hacker News . 4 мая 2019 г. Архивировано из оригинала 13 мая 2022 г. Получено 4 октября 2021 г.

Внешние ссылки