stringtranslate.com

Док (вычислительная техника)

.doc (сокращение от « документ ») — расширение имени файла , используемое для документов текстового процессора , хранящихся в формате двоичных файлов Microsoft Word Binary File Format компании Microsoft ; это был основной формат для Microsoft Word, пока версия 2007 года не заменила его файлами Office Open XML . [4] Microsoft использует это расширение с 1983 года. .docx

Формат двоичного файла Microsoft Word

Двоичные файлы DOC часто содержат больше информации о форматировании текста (а также скрипты и информацию об отмене), чем некоторые другие форматы файлов документов , такие как Rich Text Format и Hypertext Markup Language , но обычно они менее широко совместимы .

Файлы DOC, созданные в версиях Microsoft Word, отличаются. Версии Microsoft Word до Word 97 («8.0») использовали другой формат, нежели Microsoft Word 97 – 2003, основанный на OLE и CFBF .

В Microsoft Word 2007 и более поздних версиях двоичный формат файла был заменен в качестве формата по умолчанию форматом Office Open XML , хотя Microsoft Word по-прежнему может создавать файлы DOC.

Поддержка приложений

Формат DOC является родным для Microsoft Word. Другие текстовые процессоры , такие как OpenOffice.org Writer , IBM Lotus Symphony , Apple Pages и AbiWord , также могут создавать и читать файлы DOC, хотя и с некоторыми ограничениями. Программы командной строки для Unix-подобных операционных систем, которые могут преобразовывать файлы из формата DOC в простой текст или другие стандартные форматы, включают библиотеку wv , которая сама по себе напрямую используется AbiWord .

Спецификация

Поскольку формат файла DOC был закрытой спецификацией в течение многих лет, непоследовательная обработка формата сохраняется и может привести к некоторой потере информации о форматировании при обработке одного и того же файла несколькими программами обработки текста. Некоторые спецификации для двоичных форматов файлов Microsoft Office 97 были опубликованы в 1997 году под ограничительной лицензией, но эти спецификации были удалены из онлайн-загрузки в 1999 году. [5] [6] [7] [8] Спецификации более поздних версий двоичных форматов файлов Microsoft Office не были общедоступны. Спецификация формата DOC была доступна Microsoft по запросу [9] с 2006 года [10] на ограничительных условиях RAND-Z до февраля 2008 года. Sun Microsystems и OpenOffice.org провели обратную разработку формата файла. [11] 15 февраля 2008 года Microsoft выпустила спецификацию формата .DOC [4] [12] [13] в соответствии с Microsoft Open Specification Promise . [14] [15] Однако эта спецификация не описывает все функции, используемые форматом DOC, и работа по обратному проектированию остается необходимой. [16] С 2008 года спецификация обновлялась несколько раз; последнее изменение было внесено в мае 2022 года.

Формат, использовавшийся в более ранних версиях Word до 97 года («1.0» 1989 — «7.0» 1995), менее известен, но и OpenOffice, и LibreOffice содержат открытый исходный код для чтения этих форматов. Формат, вероятно, связан с форматом «Stream», который можно найти в похожих версиях Excel. [17] Word 95 также, по-видимому, имеет форму OLE-wrapped.

Другие форматы файлов

Некоторые исторические документы могут использовать расширение имени файла DOC для простых текстовых файлов, что указывает на документацию для программного обеспечения или оборудования. Расширение имени файла DOC также использовалось в 1980-х годах WordPerfect для его собственного формата.

Пользователи Palm OS иногда используют DOC как сокращение от PalmDoc, неродственного формата (обычно использующего расширение имени файла PDB), применяемого для кодирования текстовых файлов, таких как электронные книги .

Смотрите также

Ссылки

  1. ^ "IME Content-Type/Subtype - application/msword". IANA . 1993-07-22 . Получено 2012-06-20 .
  2. ^ Справочник по унифицированным идентификаторам типов (PDF) , Apple , получено 20 июня 2012 г.
  3. ^ "Системно-объявленные унифицированные идентификаторы типов (Mac OS X v10.4)". Apple Developer Connection . Apple Inc. 2008-04-08.
  4. ^ abc MS-DOC: Формат двоичного файла Word (.doc), 2019-11-19 , получено 2020-02-25
  5. ^ "Сравнение ODF и OOXML" (PDF) . 2006. Архивировано из оригинала (pdf) 2011-09-28 . Получено 2011-05-23 .
  6. ^ Остерегайтесь гиков, приносящих подарки, 2006 , получено 23.05.2011
  7. ^ "Конвертер Word 8 для Unix" . Получено 2011-05-23 .
  8. ^ "Формат двоичного файла Microsoft Word 97" . Получено 2011-05-23 .
  9. ^ "Бесплатные спецификации для двоичных форматов файлов Microsoft Office" . Получено 2011-05-23 .
  10. ^ "Преобразование документов в двоичном формате (.doc; .xls; .ppt) в формат Open XML". 2008-01-16 . Получено 2011-05-23 .
  11. ^ "Формат составных документов Microsoft" (PDF) . OpenOffice.org . 2007-08-07.
  12. ^ Форматы файлов Microsoft Office Binary (doc, xls, ppt), 2008-02-15, архивировано из оригинала 2008-02-18
  13. ^ "Спецификация формата двоичных файлов Microsoft Office Word 97 - 2007 (*.doc)" (PDF) . Корпорация Microsoft . 2008.
  14. ^ "Microsoft Open Specification Promise". Корпорация Microsoft . 23 марта 2009 г.
  15. ^ "Как извлечь информацию из файлов Office с помощью форматов и схем файлов Office" . Получено 2011-05-23 .
  16. ^ Джоэл Спольски. «Почему форматы файлов Microsoft Office такие сложные? (И некоторые обходные пути)». Архивировано из оригинала 2013-10-14 . Получено 2011-05-23 .
  17. ^ "LibreOffice/core". GitHub .

Внешние ссылки