stringtranslate.com

Веб-архив

webarchive — это формат файла веб-архива, доступный на macOS и Windows для сохранения и просмотра полных веб-страниц с помощью веб-браузера Safari . [1] Формат webarchive отличается от отдельного файла HTML , поскольку он также сохраняет связанные файлы, такие как изображения, CSS и JavaScript . [2] Формат webarchive представляет собой конкатенацию исходных файлов с именами файлов, сохраненных в двоичном формате plist с помощью NSKeyedArchiver. [ необходима цитата ] Поддержка документов webarchive была добавлена ​​в Safari 4 Beta на Windows и включена в последующие версии. Safari в iOS 13 (iPhone и iPad) поддерживает файлы веб-архива. [3] Ранее существовало стороннее приложение iOS под названием Web Archive Viewer, которое предоставляло эту функциональность.

Использование

Уязвимость

В феврале 2013 года Джо Венникс, разработчик проекта Metasploit , обнаружил уязвимость в формате веб-архива и сообщил о ней . Эксплойт позволяет злоумышленнику отправить пользователю созданный веб-архив, содержащий код для доступа к файлам cookie , локальным файлам и другим данным. Apple ответила на отчет, что не будет исправлять ошибку, скорее всего, потому, что она требует действий со стороны пользователя для открытия файла. [6]

Конвертация для других браузеров

Возможны обходные пути, позволяющие просматривать файл в других браузерах, хотя определенное содержимое веб-страницы может помешать этому процессу. Для этого требуется один из бесплатных инструментов WebArchive Folderizer (для OS X 10.2 и выше) [1] или WebArchive Extractor (для OS X 10.4.3 и выше). [7] Веб-архивы можно преобразовать в WARC с помощью набора инструментов Warchaeology Национальной библиотеки Норвегии . [8]

Альтернативы

MAFF — это открытый формат (с опубликованной спецификацией), который позволяет сохранять целые веб-страницы в одном файле. В настоящее время он поддерживается Firefox с помощью расширения. [9] [10] Другие веб-браузеры используют формат MHTML или делают эквивалент, сохраняя каталог встроенных ресурсов (обычно изображений) вместе с файлом HTML , иногда сжатым, как формат .war, используемый Konqueror (tar+gzip или tar+bzip2). Safari не поддерживает эти альтернативные форматы архивов.

Для архивирования целых веб-сайтов Архив Интернета разработал формат Web ARChive (WARC), который был стандартизирован ISO .

HTMLD (HTML Directory) — это разработанный NeXT формат для сохранения веб-страниц и их зависимостей в пакете , который также может обслуживаться веб-сервером. [11]

Chrome предлагает формат «веб-страница, полная», который сохраняет страницу с папкой, содержащей необходимые ресурсы.

Ссылки

  1. ^ ab Frakes, Dan. "De-archive Web Archives". Macworld . IDG Communications . Получено 15 июня 2018 г. .
  2. ^ Арнотт, Ник (28 апреля 2013 г.). «Apple отказывается устранять уязвимость в файлах веб-архива Safari, вероятно, потому, что для ее эксплуатации требуются действия пользователя». iMore . Mobile Nations . Получено 7 февраля 2015 г.
  3. ^ "Обзор iOS и IPadOS 13". MacStories . Получено 25 сентября 2019 г. .
  4. ^ "iAd JS Programming Guide: Web Archives and Manifest Files". Библиотека разработчика Mac . Apple . Получено 7 февраля 2015 г. .
  5. ^ "WebArchive Class Reference". Библиотека разработчиков Mac . Apple . Получено 7 февраля 2015 г.
  6. ^ Vennix, Joe (25 апреля 2013 г.). "Злоупотребление форматом файла веб-архива Safari". Rapid7 Metasploit . Rapid7 . Получено 7 февраля 2015 г. .
  7. ^ Экстрактор веб-архива
  8. ^ Документация по преобразованию вархеологии
  9. ^ "Mozilla Archive Format, with MHT and Faithful Save". Архивировано из оригинала 2 ноября 2017 года . Получено 8 декабря 2011 года .
  10. ^ "WebScrapBook" . Получено 17 ноября 2019 г. .
  11. ^ ".htmld Обсуждение".