В вычислительной технике форматированный текст , стилизованный текст или форматированный текст , в отличие от обычного текста , представляет собой цифровой текст , который имеет информацию о стиле, выходящую за рамки минимума семантических элементов: цвета, стили ( жирный шрифт , курсив ), размеры и специальные функции в HTML ( например гиперссылки ).
Форматированный текст не может быть правильно отождествлен с двоичными файлами или отличаться от текста ASCII. Это связано с тем, что форматированный текст не обязательно является двоичным, он может быть только текстовым, например HTML , RTF или расширенными текстовыми файлами, а также может содержать только ASCII. И наоборот, простой текстовый файл может быть не ASCII (в такой кодировке, как Unicode UTF-8 ). [ необходимо дальнейшее объяснение ] Текстовый форматированный текст создается с помощью разметки , которая также является текстовой, в то время как некоторые редакторы форматированного текста, такие как Microsoft Word, сохраняют в двоичном формате.
Форматированный текст берет свое начало в докомпьютерном использовании подчеркивания для придания смелости отрывкам в машинописных рукописях . В первых интерактивных системах ранних компьютерных технологий подчеркивание было невозможно, и пользователи восполняли этот недостаток (и отсутствие форматирования в ASCII), используя определенные символы в качестве замены. Например, акцент в ASCII можно сделать несколькими способами: [1] [2]
Окружение подчеркиванием также использовалось для названий книг: посмотрите его в _The_C_Programming_Language_.
Форматирование может быть отмечено тегами, отличающимися от основного текста специальными символами, такими как угловые скобки в HTML . Например, этот текст:
размечается в HTML следующим образом:
<p> В таксономии собака классифицируется как <i> Canis familis </i> . _ </ р >
Текст, выделенный курсивом, заключен в открывающий и закрывающий теги курсива. В LaTeX текст будет размечен следующим образом:
В систематике собака классифицируется как \textit { Canis familiaris } .
Большинство языков разметки можно редактировать в любом текстовом редакторе , не требуя специального программного обеспечения . Многие языки разметки также можно редактировать с помощью специального программного обеспечения, предназначенного для автоматизации некоторых функций или представления вывода в формате WYSIWYG .
С момента изобретения MacWrite , первого текстового процессора WYSIWYG , в котором машинистка кодирует форматирование визуально, а не путем вставки текстовой разметки, текстовые процессоры имеют тенденцию сохранять данные в двоичных файлах . Открытие таких файлов в текстовом редакторе обнаруживает, что они содержат различные двоичные символы либо вокруг форматированного текста (например, в WordPerfect ), либо отдельно от него, в начале или конце файла (например, в Microsoft Word ).
Однако форматированные текстовые документы в двоичных файлах имеют недостатки, связанные с областью форматирования и секретностью. В то время как степень форматирования точно обозначена в языках разметки, форматирование WYSIWYG основано на памяти, то есть, например, нажатие кнопки, выделенной жирным шрифтом, сохраняется до тех пор, пока оно не будет отменено. Это может привести к ошибкам форматирования и проблемам с обслуживанием. Что касается секретности, форматы файлов текстовых документов, как правило, являются проприетарными и недокументированными, что приводит к трудностям в совместимости кодирования третьими лицами, а также к ненужным обновлениям из-за изменений версий.
WordStar был популярным текстовым процессором, который не использовал двоичные файлы со скрытыми символами.
OpenOffice.org Writer сохраняет файлы в формате XML . Однако полученный файл является двоичным, поскольку он сжат ( эквивалент tarball ).
PDF — это еще один формат текстового файла, который обычно является двоичным (с использованием сжатия текста и сохранением графики и шрифтов в двоичном формате). Обычно это формат конечного пользователя, написанный из такого приложения, как Microsoft Word или OpenOffice.org Writer, и не подлежащий редактированию пользователем после его завершения.