Набор текста — это составление текста для публикации, отображения или распространения посредством организации физического типа (или сортировки ) в механических системах или глифов в цифровых системах, представляющих символы (буквы и другие символы). [1] Сохраненные типы извлекаются и упорядочиваются в соответствии с орфографией языка для визуального отображения. Набор текста требует одного или нескольких шрифтов (которые широко, но ошибочно путают с гарнитурами шрифтов и заменяют их ). Одним из существенных эффектов набора текста было то, что авторство работ можно было обнаружить легче, что затрудняло копирование для тех, кто не получил разрешения. [2]
В течение большей части эпохи высокой печати наборный шрифт вручную набирался для каждой страницы рабочими, называемыми наборщиками. Поднос со множеством разделителей, называемый корпусом, содержал литые металлические шрифты , каждый с одной буквой или символом, но в обратном порядке (чтобы они печатались правильно). Наборщик собирал эти шрифты в слова, затем строки, затем страницы текста, которые затем плотно связывались вместе рамкой, составляя форму или страницу. Если все было сделано правильно, все буквы были одинаковой высоты, и создавалась плоская поверхность шрифта. Форму помещали в пресс и покрывали краской, а затем печатали (делали оттиск) на бумаге. [3] Металлический шрифт читался в обратном порядке, справа налево, и ключевым навыком наборщика была его способность читать этот текст в обратном порядке.
До изобретения компьютеров и, таким образом, компьютеризированного (или цифрового) набора текста, размеры шрифтов менялись путем замены символов на другой размер шрифта. В типографской печати отдельные буквы и знаки препинания отливались на небольших металлических блоках, известных как «сортировки», а затем компоновались для формирования текста на странице. Размер шрифта определялся размером символа на лицевой стороне сортировки. Наборщику приходилось физически менять сортировки на другой размер, чтобы изменить размер шрифта.
Во время набора отдельные сорта выбираются из набора правой рукой и устанавливаются слева направо в наборную палочку, которую держат в левой руке, и которая кажется наборщику перевернутой. Как видно на фотографии наборной палочки, строчная «q» выглядит как «d», строчная «b» выглядит как «p», строчная «p» выглядит как «b», а строчная «d» выглядит как «q». Считается, что отсюда произошло выражение «следите за своими p и q». Это могло бы также легко быть «следите за своими b и d». [3]
Забытая, но важная часть процесса происходила после печати: после очистки растворителем дорогостоящие сортировки должны были быть перераспределены в наборной коробке — это называлось сортировкой или диссингом — чтобы они были готовы к повторному использованию. Ошибки в сортировке могли впоследствии привести к опечаткам, если, скажем, ap был помещен в отделение b.
На схеме справа показана литая металлическая сортировка: a лицо, b тело или хвостовик, c размер точки, 1 плечо, 2 зарубка, 3 канавка, 4 ступня. Деревянные печатные сортировки использовались на протяжении столетий в сочетании с металлическими шрифтами. Не показано, и больше всего литейщика волнует «набор» или ширина каждого сорта. Ширина набора, как и размер корпуса, измеряется в пунктах.
Чтобы продлить срок службы шрифта и учесть конечные сорта в случае шрифта, копии форм отливались в ожидании последующих печатных изданий текста, освобождая дорогостоящий шрифт для другой работы. Это было особенно распространено в книжной и газетной работе, где ротационные прессы требовали, чтобы шрифтовые формы оборачивали печатный цилиндр, а не устанавливались в станину пресса. В этом процессе, называемом стереотипизацией , вся форма вдавливается в тонкую матрицу, такую как гипс или папье-маше, чтобы создать флонг , с которого отливается позитивная форма из металлического шрифта .
Такие достижения, как пишущая машинка и компьютер, еще больше продвинули уровень искусства вперед. Тем не менее, ручная верстка и высокая печать не вышли из употребления полностью, и с появлением цифрового набора они возродились как ремесленное занятие. Однако это небольшая ниша на более крупном рынке наборных работ.
Время и усилия, необходимые для ручного набора текста, привели к нескольким попыткам в 19 веке производить механический набор. Хотя некоторые, такие как наборщик Пейджа , имели ограниченный успех, к концу 19 века было разработано несколько методов, с помощью которых оператор, работающий с клавиатурой или другими устройствами, мог производить желаемый текст. Большинство успешных систем включали в себя внутреннее литье шрифта, который должен был использоваться, поэтому их называют набором «горячим металлом». Машина линотипа , изобретенная в 1884 году, использовала клавиатуру для сборки матриц для литья и отливала целую строку шрифта за раз (отсюда и ее название). В системе монотипа клавиатура использовалась для пробивки бумажной ленты , которая затем подавалась для управления литейной машиной. Типограф Ладлоу использовал матрицы для ручного набора, но в остальном использовал горячий металл. К началу 20 века различные системы были почти универсальны в крупных газетах и издательствах.
Фотонаборные системы или системы «холодного типа» впервые появились в начале 1960-х годов и быстро вытеснили машины непрерывного литья. Эти устройства состояли из стеклянных или пленочных дисков или полос (по одной на шрифт ), которые вращались перед источником света для выборочного экспонирования символов на светочувствительной бумаге. Первоначально они приводились в действие предварительно перфорированными бумажными лентами . Позже их подключили к компьютерным интерфейсам.
Одна из самых ранних электронных фотонаборных систем была представлена Fairchild Semiconductor . Наборщик печатал строку текста на клавиатуре Fairchild, которая не имела дисплея. Для проверки правильности содержания строки она печаталась второй раз. Если две строки были идентичны, звонил звонок, и машина производила перфорированную бумажную ленту, соответствующую тексту. После завершения блока строк наборщик подавал соответствующие бумажные ленты в фотонаборное устройство, которое механически устанавливало контуры шрифта, напечатанные на стеклянных листах, на место для экспонирования на негативную пленку . Светочувствительная бумага экспонировалась светом через негативную пленку, в результате чего получалась колонка черного шрифта на белой бумаге, или гранка . Затем гранка разрезалась и использовалась для создания механического рисунка или склейки целой страницы. Большой пленочный негатив страницы снимался и использовался для изготовления пластин для офсетной печати .
Следующее поколение фотонаборных машин, которые появились, были те, которые генерировали символы на дисплее с электронно-лучевой трубкой . Типичными для этого типа были Alphanumeric APS2 (1963), [4] IBM 2680 (1967), III VideoComp (1973?), Autologic APS5 (1975), [5] и Linotron 202 (1978). [6] Эти машины были основой фотонабора на протяжении большей части 1970-х и 1980-х годов. Такие машины могли «управляться в режиме онлайн» с помощью компьютерной фронтальной системы или получать свои данные с магнитной ленты. Печатные шрифты хранились в цифровом виде на обычных магнитных дисках.
Компьютеры отлично справляются с автоматическим набором и исправлением документов. [7] Посимвольный компьютерный фотонабор, в свою очередь, быстро устарел в 1980-х годах из-за полностью цифровых систем, использующих растровый процессор изображений для преобразования целой страницы в единое цифровое изображение высокого разрешения , что теперь известно как набор изображений.
Первым коммерчески успешным лазерным фотонаборным устройством, способным использовать растровый процессор изображений, был Monotype Lasercomp. ECRM, Compugraphic (позже приобретенный Agfa ) и другие быстро последовали его примеру, выпустив собственные машины.
Раннее программное обеспечение для набора текста на базе мини-компьютеров, представленное в 1970-х и начале 1980-х годов, такое как Datalogics Pager, Penta, Atex , Miles 33, Xyvision, troff от Bell Labs и продукт IBM Script с терминалами CRT, были способны лучше управлять этими электромеханическими устройствами и использовали языки разметки текста для описания типа и другой информации о форматировании страницы. Потомками этих языков разметки текста являются SGML , XML и HTML .
Миникомпьютерные системы выводили колонки текста на пленку для склеивания и в конечном итоге производили целые страницы и подписи из 4, 8, 16 или более страниц с использованием программного обеспечения для спуска полос на таких устройствах, как израильский Scitex Dolev. Поток данных, используемый этими системами для управления макетом страницы на принтерах и фотонаборных машинах, часто являющийся собственностью или специфичным для производителя или устройства, стимулировал разработку обобщенных языков управления принтером, таких как PostScript от Adobe Systems и PCL от Hewlett-Packard .
Компьютеризированный набор был настолько редок, что журнал BYTE (сравнивающий себя с «детьми сапожника, которые ходили босиком») не использовал никаких компьютеров в производстве до выпуска в августе 1979 года, в котором использовалась система Compugraphics для набора и верстки страниц. Журнал еще не принимал статьи на дискетах, но надеялся делать это «по мере развития событий». [8] До 1980-х годов практически весь набор для издателей и рекламодателей выполнялся специализированными наборными компаниями. Эти компании выполняли набор на клавиатуре, редактирование и производство бумажной или пленочной продукции и составляли значительную часть индустрии графического искусства. В Соединенных Штатах эти компании располагались в сельской Пенсильвании, Новой Англии или на Среднем Западе, где рабочая сила была дешевой, а бумага производилась поблизости, но все еще в нескольких часах езды от основных издательских центров.
В 1985 году с появлением новой концепции WYSIWYG (что видишь, то и получаешь) в редактировании текста и обработке текста на персональных компьютерах, настольные издательские системы стали доступны, начиная с Apple Macintosh , Aldus PageMaker (а позже QuarkXPress ) и PostScript, а на платформе ПК — с Xerox Ventura Publisher под DOS, а также Pagemaker под Windows. Улучшения в программном и аппаратном обеспечении, а также быстрое снижение затрат популяризировали настольные издательские системы и позволили очень точно контролировать результаты набора текста гораздо дешевле, чем специализированные системы для мини-компьютеров. В то же время системы обработки текста, такие как Wang , WordPerfect и Microsoft Word , произвели революцию в офисных документах. Однако они не обладали типографскими возможностями или гибкостью, необходимыми для сложной компоновки книг, графики, математики или расширенных правил переноса и выравнивания ( H и J ).
К 2000 году этот сегмент отрасли сократился, поскольку издатели теперь могли интегрировать набор текста и графический дизайн на своих собственных внутренних компьютерах. Многие обнаружили, что стоимость поддержания высоких стандартов типографского дизайна и технических навыков сделала более экономичным аутсорсинг фрилансерам и специалистам по графическому дизайну.
Доступность дешевых или бесплатных шрифтов облегчила переход к самостоятельному созданию, но также открыла разрыв между опытными дизайнерами и любителями. Появление PostScript, дополненного форматом файлов PDF , предоставило универсальный метод проверки дизайнов и макетов, читаемый на основных компьютерах и операционных системах.
QuarkXPress занимал долю рынка в 95% в 1990-х годах, но с середины 2000-х годов уступил свое лидерство Adobe InDesign . [9]
IBM создала и вдохновила семейство языков набора текста с названиями, которые были производными от слова «SCRIPT». Более поздние версии SCRIPT включали расширенные функции, такие как автоматическое создание оглавления и индекса, многоколоночная разметка страницы, сноски, рамки, автоматическая расстановка переносов и проверка орфографии. [10]
NSCRIPT был портом SCRIPT на ОС и TSO из CP-67/CMS SCRIPT. [11]
Waterloo Script был создан позже в Университете Ватерлоо (UW). [12] Одна версия SCRIPT была создана в MIT, а AA/CS в UW взяла на себя разработку проекта в 1974 году. Программа была впервые использована в UW в 1975 году. В 1970-х годах SCRIPT был единственным практичным способом обработки текста и форматирования документов с использованием компьютера. К концу 1980-х годов система SCRIPT была расширена для включения различных обновлений. [13]
Первоначальная реализация SCRIPT в Вашингтонском университете была задокументирована в выпуске информационного бюллетеня Вычислительного центра за май 1975 года, в котором были отмечены некоторые преимущества использования SCRIPT:
В статье также указывалось, что SCRIPT имел более 100 команд для форматирования документов, хотя 8–10 из этих команд было достаточно для выполнения большинства задач форматирования. Таким образом, SCRIPT имел многие из возможностей, которые пользователи компьютеров обычно связывают с современными текстовыми процессорами. [14]
SCRIPT/VS — вариант SCRIPT, разработанный в IBM в 1980-х годах.
DWScript — это версия SCRIPT для MS-DOS, названная в честь ее автора, Д. Д. Уильямса, [15] , но никогда не выпускавшаяся для широкой публики и использовавшаяся только внутри IBM.
Скрипт по-прежнему доступен в IBM как часть Document Composition Facility для операционной системы z/OS . [16]
Стандартный обобщенный язык разметки ( SGML ) был основан на IBM Generalized Markup Language (GML). GML представлял собой набор макросов поверх IBM Script. DSSSL — это международный стандарт, разработанный для предоставления таблиц стилей для документов SGML.
XML является преемником SGML. XSL-FO чаще всего используется для создания PDF-файлов из XML-файлов.
Появление SGML/XML в качестве модели документа сделало популярными другие движки для набора текста. К таким движкам относятся Datalogics Pager, Penta, Miles 33's OASYS, Xyvision's XML Professional Publisher , FrameMaker и Arbortext . К движкам, совместимым с XSL-FO, относятся Apache FOP , Antenna House Formatter и RenderX 's XEP . Эти продукты позволяют пользователям программировать процесс набора текста SGML/XML с помощью скриптовых языков.
Prince от YesLogic — еще один пример, основанный на CSS Paged Media.
В середине 1970-х годов Джо Оссанна , работавший в Bell Laboratories , написал программу набора текста troff для управления фотонаборным устройством Wang C/A/T , принадлежащим лабораториям; позже Брайан Керниган усовершенствовал ее для поддержки вывода на различное оборудование, например, лазерные принтеры . Хотя ее использование сошло на нет, она по-прежнему включена в ряд систем Unix и Unix-подобных систем и использовалась для набора ряда высококлассных технических и компьютерных книг. Некоторые версии, а также аналогичная GNU программа groff теперь имеют открытый исходный код .
Система TeX , разработанная Дональдом Э. Кнутом в конце 1970-х годов, является еще одной широко распространенной и мощной автоматизированной системой набора текста, которая установила высокие стандарты, особенно для набора текста математики. LuaTeX и LuaLaTeX являются вариантами TeX и LaTeX, которые можно писать на языке Lua . TeX считается довольно сложным для изучения сам по себе и больше касается внешнего вида, чем структуры. Пакет макросов LaTeX, написанный Лесли Лэмпортом в начале 1980-х годов, предлагал более простой интерфейс и более легкий способ систематического кодирования структуры документа. Разметка LaTeX широко используется в академических кругах для опубликованных статей и книг. Хотя стандартный TeX не предоставляет никакого интерфейса, существуют программы, которые его предоставляют. К этим программам относятся Scientific Workplace и LyX , которые являются графическими/интерактивными редакторами; TeXmacs , будучи независимой системой набора текста, также может помочь в подготовке документов TeX с помощью своих возможностей экспорта.
GNU TeXmacs (название которого представляет собой комбинацию TeX и Emacs , хотя он независим от обеих этих программ) — это система набора текста, которая одновременно является текстовым процессором WYSIWYG .
SILE заимствует некоторые алгоритмы из TeX и опирается на другие библиотеки, такие как HarfBuzz и ICU , с расширяемым ядром, разработанным на Lua . [17] [18] По умолчанию входные документы SILE могут быть составлены в пользовательской разметке, вдохновленной LaTeX (SIL), или в XML. С помощью добавления сторонних модулей также возможна композиция в Markdown или Djot. [19]