Type of text or binary file format
Формат файла документа — это текстовый или двоичный формат файла для хранения документов на носителе , особенно для использования компьютерами . В настоящее время существует множество несовместимых форматов файлов документов.
Примерами открытых стандартов на основе XML являются DocBook , XHTML и, в последнее время, стандарты ISO / IEC OpenDocument (ISO 26300:2006) и Office Open XML (ISO 29500:2008).
В 1993 году ITU-T попытался установить стандарт для форматов файлов документов, известный как Open Document Architecture (ODA), который должен был заменить все конкурирующие форматы файлов документов. Он описан в документах ITU-T T.411 — T.421, которые эквивалентны ISO 8613. Это не удалось.
Языки описания страниц, такие как PostScript и PDF, стали фактическим стандартом для документов, которые типичный пользователь должен иметь возможность только создавать и читать, но не редактировать. В 2001 году начала публиковаться серия стандартов ISO / IEC для PDF, включая спецификацию самого PDF, ISO-32000 .
HTML является наиболее используемым и открытым международным стандартом, а также используется как формат файла документа. Он также стал стандартом ISO / IEC (ISO 15445:2000).
Двоичный формат файла, используемый Microsoft Word по умолчанию ( .doc ), стал фактическим стандартом для офисных документов, но это закрытый формат , который не всегда полностью поддерживается другими текстовыми процессорами.
Распространенные форматы файлов документов
- ASCII , UTF-8 — кодировки простого текста . С этими двумя наборами символов используются три различных окончания строк: (a) LF — перевод строки в UNIX и подобных системах, (b) CRLF — возврат каретки, перевод строки в системах DOS и Windows, и (c) CR — возврат каретки в старых системах Macintosh.
- Amigaguide
- .doc для Microsoft Word — структурный двоичный формат, разработанный Microsoft (спецификации доступны с 2008 года в рамках Open Specification Promise ) [1] [2]
- DjVu — формат файла, предназначенный в первую очередь для хранения отсканированных документов [3]
- DocBook — XML-формат для технической документации
- HTML (.html, .htm), (открытый стандарт, ISO от 2000 г.), в сочетании с возможными файлами изображений , на которые дана ссылка.
- FictionBook (.fb2) — открытый формат электронной книги на основе XML
- Markdown (.md) — язык разметки для создания форматированного текста с использованием обычного текста
- Office Open XML — .docx (стандарт на основе XML для офисных документов)
- OpenDocument — .odt (стандарт на основе XML для офисных документов)
- OpenOffice.org XML — .sxw (открытый формат на основе XML для офисных документов)
- OXPS — спецификация Open XML Paper (Windows 8.1 и выше, более старая версия — XPS, используемая в Windows 7)
- PalmDoc — формат карманного документа
- .pages для страниц
- PDF — открытый стандарт для обмена документами. Стандарты ISO включают PDF/X (eXchange), PDF/A (Archive), PDF/E (Engineering), ISO 32000 (PDF), PDF/UA (Accessibility) и PDF/VT (Variable data and transactional print). PDF можно читать практически на любой платформе с помощью бесплатных или открытых программ для чтения. Также доступны программы для создания PDF с открытым исходным кодом.
- Постскриптум — .ps
- Rich Text Format (RTF) — формат метаданных, разрабатываемый корпорацией Microsoft с 1987 года для продуктов Microsoft и кроссплатформенного обмена документами [4] [5] [6] [7] [8]
- СИМБОЛИЧЕСКАЯ СВЯЗЬ (SYLK)
- Масштабируемая векторная графика (SVG) — графический формат, предназначенный в первую очередь для векторных изображений.
- TeX — Программа и формат набора текста с открытым исходным кодом. Первый успешный язык математической нотации.
- TEI — XML-формат для цифровой публикации
- Трофф
- Единый офисный формат — китайский стандарт
- WordPerfect (.wpd, .wp, .wp7, .doc) (Примечание: возможна путаница с расширением формата Word)
Смотрите также
Ссылки
- ^ "Форматы двоичных файлов Microsoft Office (doc, xls, ppt)". Microsoft . 2008-02-15. Архивировано из оригинала 2009-03-08 . Получено 2010-03-18 .
- ^ Корпорация Microsoft (2010-07-23). "MS-DOC - Спецификация структуры двоичного формата файла Word (.doc)" . Получено 2010-08-08 .
- ^ "Что такое DjVu - DjVu.org". DjVu.org . Архивировано из оригинала 2019-01-21 . Получено 2009-03-05 .
- ^ Microsoft Corporation (май 1999 г.). "Спецификация формата Rich Text Format (RTF), версия 1.6" . Получено 13.03.2010 .
- ^ "4.3 Форматы файлов, отличные от HTML". Подразделение электронного правительства. Май 2002 г. Архивировано из оригинала 18 февраля 2010 г. Получено 13 марта 2010 г.
- ^ "RTF (.rtf) — Документация по языку Wolfram". reference.wolfram.com .
- ^ "WD: Спецификация формата Rich Text Format (RTF) 1.7". support.microsoft.com .
- ^ Ранджан Парекх, Ранджан (2006). Принципы мультимедиа . Tata McGraw-Hill. стр. 87. ISBN 0-07-058833-3.
Внешние ссылки
- Трудности перевода: проблемы взаимодействия открытых стандартов — ODF и OOXML в качестве примеров