webarchive — это формат файла веб-архива, доступный на macOS и Windows для сохранения и просмотра полных веб-страниц с помощью веб-браузера Safari . [1] Формат webarchive отличается от отдельного файла HTML , поскольку он также сохраняет связанные файлы, такие как изображения, CSS и JavaScript . [2] Формат webarchive представляет собой конкатенацию исходных файлов с именами файлов, сохраненных в двоичном формате plist с помощью NSKeyedArchiver. [ необходима цитата ] Поддержка документов webarchive была добавлена в Safari 4 Beta на Windows и включена в последующие версии. Safari в iOS 13 (iPhone и iPad) поддерживает файлы веб-архива. [3] Ранее существовало стороннее приложение iOS под названием Web Archive Viewer, которое предоставляло эту функциональность.
В феврале 2013 года Джо Венникс, разработчик проекта Metasploit , обнаружил уязвимость в формате веб-архива и сообщил о ней . Эксплойт позволяет злоумышленнику отправить пользователю созданный веб-архив, содержащий код для доступа к файлам cookie , локальным файлам и другим данным. Apple ответила на отчет, что не будет исправлять ошибку, скорее всего, потому, что она требует действий со стороны пользователя для открытия файла. [6]
Возможны обходные пути, позволяющие просматривать файл в других браузерах, хотя определенное содержимое веб-страницы может помешать этому процессу. Для этого требуется один из бесплатных инструментов WebArchive Folderizer (для OS X 10.2 и выше) [1] или WebArchive Extractor (для OS X 10.4.3 и выше). [7] Веб-архивы можно преобразовать в WARC с помощью набора инструментов Warchaeology Национальной библиотеки Норвегии . [8]
MAFF — это открытый формат (с опубликованной спецификацией), который позволяет сохранять целые веб-страницы в одном файле. В настоящее время он поддерживается Firefox с помощью расширения. [9] [10] Другие веб-браузеры используют формат MHTML или делают эквивалент, сохраняя каталог встроенных ресурсов (обычно изображений) вместе с файлом HTML , иногда сжатым, как формат .war, используемый Konqueror (tar+gzip или tar+bzip2). Safari не поддерживает эти альтернативные форматы архивов.
Для архивирования целых веб-сайтов Архив Интернета разработал формат Web ARChive (WARC), который был стандартизирован ISO .
HTMLD (HTML Directory) — это разработанный NeXT формат для сохранения веб-страниц и их зависимостей в пакете , который также может обслуживаться веб-сервером. [11]
Chrome предлагает формат «веб-страница, полная», который сохраняет страницу с папкой, содержащей необходимые ресурсы.