stringtranslate.com

Форматированный текст

В вычислительной технике форматированный текст , стилизованный текст или форматированный текст , в отличие от обычного текста , представляет собой цифровой текст , который имеет информацию о стиле, выходящую за рамки минимума семантических элементов: цвета, стили ( жирный шрифт , курсив ), размеры и специальные функции в HTML ( например гиперссылки ).

Терминология

Форматированный текст не может быть правильно отождествлен с двоичными файлами или отличаться от текста ASCII. Это связано с тем, что форматированный текст не обязательно является двоичным, он может быть только текстовым, например HTML , RTF или расширенными текстовыми файлами, а также может содержать только ASCII. И наоборот, простой текстовый файл может быть не ASCII (в такой кодировке, как Unicode UTF-8 ). [ необходимо дальнейшее объяснение ] Текстовый форматированный текст создается с помощью разметки , которая также является текстовой, в то время как некоторые редакторы форматированного текста, такие как Microsoft Word, сохраняют в двоичном формате.

Начало форматированного текста

Форматированный текст берет свое начало в докомпьютерном использовании подчеркивания для придания смелости отрывкам в машинописных рукописях . В первых интерактивных системах ранних компьютерных технологий подчеркивание было невозможно, и пользователи восполняли этот недостаток (и отсутствие форматирования в ASCII), используя определенные символы в качестве замены. Например, акцент в ASCII можно сделать несколькими способами: [1] [2]

Для названий книг также использовалось окружение подчеркиванием: посмотрите его в _The_C_Programming_Language_.

Языки разметки

Форматирование может быть отмечено тегами, отличающимися от основного текста специальными символами, такими как угловые скобки в HTML . Например, этот текст:

В систематике собака классифицируется как Canis Familiesis .

размечается в HTML следующим образом:

<p> В таксономии собака классифицируется как <i> Canis familis </i> . _ </ р >

Текст, выделенный курсивом, заключен в открывающий и закрывающий теги курсива. В LaTeX текст будет размечен следующим образом:

В систематике собака классифицируется как \textit { Canis familiaris } .

Большинство языков разметки можно редактировать в любом текстовом редакторе , не требуя специального программного обеспечения . Многие языки разметки также можно редактировать с помощью специального программного обеспечения, предназначенного для автоматизации некоторых функций или представления вывода в формате WYSIWYG .

Форматированные файлы документов

С момента изобретения MacWrite , первого текстового процессора WYSIWYG , в котором машинистка кодирует форматирование визуально, а не путем вставки текстовой разметки, текстовые процессоры имеют тенденцию сохранять данные в двоичных файлах . Открытие таких файлов в текстовом редакторе обнаруживает, что они содержат различные двоичные символы либо вокруг форматированного текста (например, в WordPerfect ), либо отдельно от него, в начале или конце файла (например, в Microsoft Word ).

Однако форматированные текстовые документы в двоичных файлах имеют недостатки, связанные с областью форматирования и секретностью. В то время как степень форматирования точно обозначена в языках разметки, форматирование WYSIWYG основано на памяти, то есть, например, нажатие кнопки, выделенной жирным шрифтом, сохраняется до тех пор, пока оно не будет отменено. Это может привести к ошибкам форматирования и проблемам с обслуживанием. Что касается секретности, форматы файлов текстовых документов, как правило, являются проприетарными и недокументированными, что приводит к трудностям в совместимости кодирования третьими лицами, а также к ненужным обновлениям из-за изменений версий.

WordStar был популярным текстовым процессором, который не использовал двоичные файлы со скрытыми символами.

OpenOffice.org Writer сохраняет файлы в формате XML . Однако полученный файл является двоичным, поскольку он сжат ( эквивалент tarball ).

PDF — это еще один формат текстового файла, который обычно является двоичным (с использованием сжатия текста и сохранением графики и шрифтов в двоичном формате). Обычно это формат конечного пользователя, написанный из такого приложения, как Microsoft Word или OpenOffice.org Writer, и не подлежащий редактированию пользователем после его завершения.

Смотрите также

Рекомендации

  1. ^ Хэмбридж, Салли (октябрь 1995 г.). «RFC1855: Рекомендации по сетевому этикету». IETF Datatracker, Рабочая группа по разработке Интернета . Проверено 4 февраля 2024 г.
  2. Маллен, Эд (26 июля 2015 г.). «Структурированный текст». edmullen.net . Проверено 4 февраля 2024 г.