В вычислительной технике форматированный текст , стилизованный текст или расширенный текст , в отличие от обычного текста , представляет собой цифровой текст , который имеет информацию о стиле, выходящую за рамки минимальных семантических элементов: цвета, стили ( жирный шрифт , курсив ), размеры и специальные функции в HTML (например, гиперссылки ).
Форматированный текст не может быть правильно идентифицирован с двоичными файлами или отличаться от текста ASCII. Это связано с тем, что форматированный текст не обязательно является двоичным, он может быть только текстовым, например, HTML , RTF или обогащенные текстовые файлы, и он может быть только ASCII. И наоборот, простой текстовый файл может быть не-ASCII (в кодировке, например, Unicode UTF-8 ). [ необходимо дополнительное объяснение ] Текст, отформатированный только как текст, достигается с помощью разметки , которая также является текстовой, в то время как некоторые редакторы форматированного текста, такие как Microsoft Word, сохраняют в двоичном формате.
Форматированный текст берет свое начало в докомпьютерном использовании подчеркивания для выделения жирным шрифтом отрывков в машинописных рукописях . В первых интерактивных системах ранних компьютерных технологий подчеркивание было невозможно, и пользователи компенсировали этот недостаток (и отсутствие форматирования в ASCII), используя определенные символы в качестве заменителей. Например, выделение можно было достичь в ASCII несколькими способами: [1] [2]
Подчеркивание также использовалось для названий книг: Посмотрите в _Языке_программирования_С_.
Форматирование может быть отмечено тегами, отличающимися от основного текста специальными символами, такими как угловые скобки в HTML . Например, этот текст:
размечен в HTML следующим образом:
< p > В таксономии собака классифицируется как < i > Canis familiaris </ i > . </ p >
Курсивный текст заключен в открывающий и закрывающий теги курсива. В LaTeX текст будет размечен следующим образом:
В таксономии собака классифицируется как \textit { Canis familiaris } .
Большинство языков разметки можно редактировать любым текстовым редактором , не требуя специального программного обеспечения . Многие языки разметки также можно редактировать специализированным программным обеспечением, разработанным для автоматизации некоторых функций или представления вывода в виде WYSIWYG .
С момента изобретения MacWrite , первого текстового процессора WYSIWYG , в котором машинистка кодирует форматирование визуально, а не вставляет текстовую разметку, текстовые процессоры, как правило, сохраняют текст в двоичные файлы . Открытие таких файлов текстовым редактором показывает, что они содержат встроенные в них различные двоичные символы, либо вокруг форматированного текста (например, в WordPerfect ), либо отдельно от него, в начале или конце файла (например, в Microsoft Word ).
Однако форматированные текстовые документы в двоичных файлах имеют недостатки в области форматирования и секретности. В то время как степень форматирования точно обозначена в языках разметки, форматирование WYSIWYG основано на памяти, то есть, например, на сохранении нажатия кнопки жирного шрифта до отмены. Это может привести к ошибкам форматирования и проблемам с обслуживанием. Что касается секретности, форматированные форматы файлов текстовых документов, как правило, являются проприетарными и недокументированными, что приводит к трудностям в совместимости кодирования третьими лицами, а также к ненужным обновлениям из-за изменений версий.
WordStar был популярным текстовым процессором, который не использовал двоичные файлы со скрытыми символами.
OpenOffice.org Writer сохраняет файлы в формате XML . Однако полученный файл является двоичным, поскольку он сжат ( эквивалент tarball ).
PDF — это еще один форматированный текстовый файл, который обычно является двоичным (используя сжатие текста и сохраняя графику и шрифты в двоичном виде). Это, как правило, формат конечного пользователя, написанный из приложения, такого как Microsoft Word или OpenOffice.org Writer, и не подлежащий редактированию пользователем после завершения.