stringtranslate.com

Форматированный текст

В вычислительной технике форматированный текст , стилизованный текст или расширенный текст , в отличие от обычного текста , представляет собой цифровой текст , который имеет информацию о стиле, выходящую за рамки минимальных семантических элементов: цвета, стили ( жирный шрифт , курсив ), размеры и специальные функции в HTML (например, гиперссылки ).

Терминология

Форматированный текст не может быть правильно идентифицирован с двоичными файлами или отличаться от текста ASCII. Это связано с тем, что форматированный текст не обязательно является двоичным, он может быть только текстовым, например, HTML , RTF или обогащенные текстовые файлы, и он может быть только ASCII. И наоборот, простой текстовый файл может быть не-ASCII (в кодировке, например, Unicode UTF-8 ). [ необходимо дополнительное объяснение ] Текст, отформатированный только как текст, достигается с помощью разметки , которая также является текстовой, в то время как некоторые редакторы форматированного текста, такие как Microsoft Word, сохраняют в двоичном формате.

Начало форматированного текста

Форматированный текст берет свое начало в докомпьютерном использовании подчеркивания для выделения жирным шрифтом отрывков в машинописных рукописях . В первых интерактивных системах ранних компьютерных технологий подчеркивание было невозможно, и пользователи компенсировали этот недостаток (и отсутствие форматирования в ASCII), используя определенные символы в качестве заменителей. Например, выделение можно было достичь в ASCII несколькими способами: [1] [2]

Подчеркивание также использовалось для названий книг: Посмотрите в _Языке_программирования_С_.

Языки разметки

Форматирование может быть отмечено тегами, отличающимися от основного текста специальными символами, такими как угловые скобки в HTML . Например, этот текст:

В таксономии собака классифицируется как Canis familiaris .

размечен в HTML следующим образом:

< p > В таксономии собака классифицируется как < i > Canis familiaris </ i > . </ p >

Курсивный текст заключен в открывающий и закрывающий теги курсива. В LaTeX текст будет размечен следующим образом:

В таксономии собака классифицируется как \textit { Canis familiaris } .

Большинство языков разметки можно редактировать любым текстовым редактором , не требуя специального программного обеспечения . Многие языки разметки можно редактировать также с помощью специализированного программного обеспечения, разработанного для автоматизации некоторых функций или представления вывода в виде WYSIWYG .

Форматированные файлы документов

С момента изобретения MacWrite , первого текстового процессора WYSIWYG , в котором машинистка кодирует форматирование визуально, а не вставляет текстовую разметку, текстовые процессоры, как правило, сохраняют текст в двоичные файлы . Открытие таких файлов текстовым редактором показывает, что они содержат встроенные в них различные двоичные символы, либо вокруг форматированного текста (например, в WordPerfect ), либо отдельно от него, в начале или конце файла (например, в Microsoft Word ).

Однако форматированные текстовые документы в двоичных файлах имеют недостатки в области форматирования и секретности. В то время как степень форматирования точно обозначена в языках разметки, форматирование WYSIWYG основано на памяти, то есть, например, на сохранении нажатия кнопки жирного шрифта до отмены. Это может привести к ошибкам форматирования и проблемам с обслуживанием. Что касается секретности, форматированные форматы файлов текстовых документов, как правило, являются проприетарными и недокументированными, что приводит к трудностям в совместимости кодирования третьими лицами, а также к ненужным обновлениям из-за изменений версий.

WordStar был популярным текстовым процессором, который не использовал двоичные файлы со скрытыми символами.

OpenOffice.org Writer сохраняет файлы в формате XML . Однако полученный файл является двоичным, поскольку он сжат ( эквивалент tarball ).

PDF — это еще один форматированный текстовый файл, который обычно является двоичным (используя сжатие текста и сохраняя графику и шрифты в двоичном виде). ​​Это, как правило, формат конечного пользователя, написанный из приложения, такого как Microsoft Word или OpenOffice.org Writer, и не подлежащий редактированию пользователем после завершения.

Смотрите также

Ссылки

  1. ^ Хамбридж, Салли (октябрь 1995 г.). «RFC1855: Руководство по сетевому этикету». IETF Datatracker, Internet Engineering Task Force . Получено 4 февраля 2024 г.
  2. ^ Маллен, Эд (26 июля 2015 г.). «Структурированный текст». edmullen.net . Получено 4 февраля 2024 г. .