stringtranslate.com

Обработка текста

В вычислительной технике термин «обработка текста» относится к теории и практике автоматизации создания или манипулирования электронным текстом.Текст обычно относится ко всем буквенно-цифровым символам, указанным на клавиатуре человека, занимающегося практикой, но в целом текст означает уровень абстракции, расположенный непосредственно над стандартной кодировкой символов целевого текста. Термин «обработка» относится к автоматизированной (или механизированной) обработке, в отличие от тех же манипуляций, выполняемых вручную.

Обработка текста включает в себя компьютерные команды, которые вызывают содержимое, его изменение и перемещение курсора, например, для

Текстовая обработка регулярного выражения представляет собой виртуальную редактирующую машину, имеющую примитивный язык программирования, имеющий именованные регистры (идентификаторы) и именованные позиции в последовательности символов, составляющих текст. Используя их, «текстовый процессор» может, например, отметить область текста, а затем переместить ее. Утилита обработки текста представляет собой программу-фильтр , или фильтр . Эти два механизма включают обработку текста.

Определение

Поскольку стандартизированная разметка, такая как escape-коды ANSI, обычно невидима для редактора, они содержат набор временных свойств, которые иногда становятся неотличимыми от обработки текста . Но определенные отличия от обработки текста заключаются в том, что собственно обработка текста :

Таким образом, разметка, такая как шрифт и цвет, на самом деле не является отличительным фактором, поскольку последовательности символов, влияющие на шрифт и цвет, представляют собой просто стандартные символы, вставленные автоматически в режиме фоновой обработки текста , созданные для прозрачной работы совместимыми текстовыми редакторами, но ставшие иными. видимы как команды обработки текста , когда этот режим не действует. Таким образом, обработка текста в основном (но не полностью) определяется визуальными символами (или графемами ), а не стандартными, но невидимыми символами.

История

Развитие компьютерной обработки текста началось всерьез с того, что Клини формализовала регулярный язык . Такие регулярные выражения затем могли бы стать мини-программой с процессом компиляции, доступной для любого редактирования, как только этот язык будет расширен. Аналогичным образом фильтры расширяются за счет развития определенных опций .

Базовые концепты

По сути, редактор вызывает входной поток и направляет его в среду обработки текста, которая представляет собой либо командную оболочку , либо текстовый редактор . Полученный результат применим для дальнейшей обработки текста, конечный результат которой сравним с однократным применением алгоритма, примененного один раз более сложной и структурированной компьютерной программой.

Обработка текста, в отличие от алгоритма, представляет собой администрируемую вручную последовательность более простых макросов, которые представляют собой выражения шаблонного действия и механизмы фильтрации. В любом случае намерение программиста косвенно отражается на заданном наборе текстовых символов в процессе обработки текста. Результаты этапа обработки текста иногда только обнадеживают, и используемый механизм часто подвергается многократному пересмотру посредством визуальной обратной связи, пока детали регулярного выражения или языка разметки или параметры утилиты не будут полностью освоены.

Обработка текста связана главным образом с созданием текстовых символов на самом высоком уровне вычислений, где ее деятельность находится чуть ниже практического использования вычислений — ручной передачи информации.

В конечном счете, все вычисления — это обработка текста, от самокомпилируемых текстовых символов ассемблера через автоматизированный язык программирования, созданный для обработки большого количества графических данных, и, наконец, до метасимволов регулярных выражений, которые обрабатывают существующие текстовые документы.

Обработка текста представляет собой собственную автоматизацию.

Персонажи

Текстовые символы входят в стандартизированные наборы символов, содержащие также управляющие символы, такие как символы новой строки, которые упорядочивают текст. Другие типы управляющих символов организуют передачу, определяют наборы символов и выполняют другие служебные задачи.

Смотрите также

Внешние ссылки