stringtranslate.com

Кэш поисковой системы

Ссылка на кэшированную версию веб-страницы в результатах поиска Google (вверху), Bing (в центре) и Яндекса (внизу)

Кэш поисковой системы — это кеш веб -страниц , который показывает страницу в том виде, в котором она была проиндексирована веб -сканером . Кэшированные версии веб-страниц можно использовать для просмотра содержимого страницы, когда действующая версия недоступна , изменена или удалена . [1]

Веб-сканер собирает содержимое веб-страницы, которое затем индексируется поисковой системой . Поисковая система может сделать копию доступной для пользователей. Веб-сканеры, которые соблюдают ограничения в файле robots.txt [2] или метатегах [3] веб-мастера сайта, могут не сделать кэшированную копию доступной для пользователей поисковых систем, если им не дано указание не делать этого.

Кэш поисковой системы может быть использован для расследования преступлений , [4] судебного разбирательства [5] и журналистики . [6] [1] Примерами поисковых систем, которые предлагают своим пользователям кэшированные версии веб-страниц, являются Bing , Yandex Search и Baidu .

Кэш поисковой системы может не быть полностью защищен обычными законами, которые защищают поставщиков технологий от претензий о нарушении авторских прав. [7]

В 2024 году Google прекратила использование службы веб-кэширования. Эта служба была разработана для веб-сайтов, которые могут отображаться в результатах поиска Google, но временно недоступны. Он не был предназначен для долгосрочного или даже среднесрочного архивирования. В Google заявили, что Интернет по состоянию на 2024 год станет гораздо более надежным, чем в прежние времена, и поэтому его служба кэширования больше не является важной службой, которую нужно поддерживать. Google указал на Wayback Machine как на лучшую альтернативу и предположил, что Google может работать с ними в будущем. [8]


Рекомендации

  1. ^ аб Вильфрид Рюттен (2012). Справочник по журналистике данных. O'Reilly Media, Inc. ISBN 9781449330064. Если страница становится спорной, издатели могут удалить ее или изменить без предварительного уведомления. Если вы подозреваете, что столкнулись с проблемой, в первую очередь следует обратиться к кешу страницы Google, каким он был при последнем сканировании.
  2. ^ «Метатег Robots, data-nosnippet и спецификации X-Robots-Tag» . noarchive: не показывать кэшированную ссылку в результатах поиска.
  3. ^ «Специальные теги, которые понимает Google — Справка Search Console» . noarchive — не показывать кэшированную ссылку на страницу в результатах поиска.
  4. ^ Тодд Г. Шипли, Арт Боукер (2013). Расследование интернет-преступлений: введение в раскрытие преступлений в киберпространстве. Ньюнес. ISBN 9780124079298. Для следователя это может быть ценной информацией. В зависимости от того, когда Google просканировал сайт, последняя страница может содержать информацию, отличную от текущей. Таким образом, документирование и запись кэшированной страницы веб-страницы Google может быть важным шагом для обеспечения сохранения моментального снимка.
  5. ^ Стивен Марк Леви (2011). Регулирование ценных бумаг: Книга ответов SEC. Издательство Aspen Online. ISBN 9781454805434. Всемирная паутина не так эфемерна, как можно подумать. Все большее число старых веб-страниц доступно в Интернете через такие службы, как Wayback Machine, Yahoo Cache или Bing Cache. Юристы некоторых истцов и корпоративные оводы регулярно пользуются этими услугами.
  6. ^ Клеланд Том (23 октября 2014 г.). «Кэши Google и поисковая система .com предоставляют решения «права на забвение»». Пресс-Газета . Журналисты также могут получить доступ к исключенному из списка контенту через кэш Google.
  7. ^ Герман Де Бау, Валери Ванденвеге (июнь 2011 г.). «Апелляционный суд Брюсселя оставил в силе решение против Google News и Google Cache». Архивировано из оригинала 26 апреля 2015 г. Что касается функции кэша, суд отклонил исключение «технически необходимой копии». Это исключение исключает временное воспроизведение, которое является необходимой частью технического процесса, применяемого посредником для передачи в сети между третьими лицами. По мнению суда, копия кэша, которую Google хранит на своем сервере, не является технически необходимой для эффективной передачи.
  8. ^ «Ссылки на кэш поиска Google официально удаляются» . 2 февраля 2024 г.