Слогификация ( / s ɪ ˌ l æ b ɪ f ɪ ˈ k eɪ ʃ ən / ) или слогирование ( / s ɪ ˌ l æ b ɪ ˈ k eɪ ʃ ən / ), также известная как расстановка переносов , представляет собой разделение слова на слоги , произносимые, написанные [1] или подписанные. [2]
Письменное разделение на слоги обычно обозначается дефисом при использовании английской орфографии (например, слог) и точкой при транскрипции фактически произнесенных слогов в Международном фонетическом алфавите (например, [ˈsɪl.ə.bᵊɫ] ). . В целях презентации типографы могут использовать вставку ( символ Юникода U+00B7, например, слог), специальную «точку переноса» (U+2027, например, слог) или пробел . (например, слог).
В конце строки слово разделяется на письме на части, условно называемые «слогами», если оно не умещается в строку и если перемещение его на следующую строку сделало бы первую строку значительно короче остальных. Это может стать особой проблемой при использовании очень длинных слов и узких колонок в газетах. Обработка текста автоматизировала процесс выравнивания , делая слоговое разделение более коротких слов часто ненужным.
В некоторых языках произнесенные слоги также являются основой слогообразования на письме. Однако, возможно, из-за слабого соответствия между звуками и буквами в правописании современного английского языка, письменное слогообразование в английском языке базируется преимущественно на этимологических или морфологических , а не на фонетических принципах. Например, невозможно слогово обозначить «обучение» как обучение согласно правильной слоговой системе живого языка. Вид только lear- в конце строки может ввести читателя в заблуждение и заставить его произнести слово неправильно, поскольку орграф ea может содержать множество разных значений . История английской орфографии объясняет такие явления.
Таким образом, английское письменное слогообразование имеет дело с понятием «слог», которое не соответствует лингвистическому понятию фонологической (в отличие от морфологической) единицы.
В результате даже большинство носителей английского языка не могут составлять слова по слогам в соответствии с установленными правилами, не обращаясь к словарю или не используя текстовый процессор. Школы обычно не дают большего совета по этой теме, чем обратиться к словарю. Кроме того, существуют различия между британским и американским слогом и даже между словарями одного и того же английского языка.
В финском , итальянском , португальском , японском ( ромаджи ), корейском ( романизированном ) и других почти фонематически написанных языках писатели в принципе могут правильно составить слоги любого существующего или вновь созданного слова, используя только общие правила. В Финляндии детей сначала учат расставлять каждое слово через дефис до тех пор, пока они не составят правильное слоговое образование, после чего дефисы можно опустить.
Существует ли идеальный алгоритм слогообразования в английском языке?
Алгоритм расстановки переносов — это набор правил, особенно кодифицированных для реализации в компьютерной программе, который решает, в каких точках слово можно разбить на две строки дефисом. Например, алгоритм расстановки переносов может решить, что импичмент можно разделить на импичмент или импичмент , но не как импичмент .
Одна из причин сложности правил разделения слов заключается в том, что разные диалекты английского языка имеют тенденцию различаться в расстановке переносов: американский английский имеет тенденцию работать со звуком, а британский английский имеет тенденцию обращать внимание на происхождение слова, а затем на его звучание. . [ нужна цитата ] Существует также большое количество исключений, что еще больше усложняет ситуацию. [ нужна цитата ]
Некоторые практические правила можно найти в книге майора Кири «О расстановке переносов: анархия педантизма». [3] Среди алгоритмических подходов к расстановке переносов широко используется тот, который реализован в системе набора текста TeX . Это подробно описано в первых двух томах книги « Компьютеры и набор текста» Дональда Кнута и в диссертации Франклина Марка Ляна. [4] Целью работы Ляна было получить настолько точный алгоритм, насколько это возможно, и сохранить небольшой словарь исключений.
В исходных шаблонах расстановки переносов TeX для американского английского список исключений содержит всего 14 слов. [5]
Порты алгоритма расстановки переносов TeX доступны в виде библиотек для нескольких языков программирования, включая Haskell , JavaScript , Perl , PostScript , Python , Ruby , C# , а TeX можно заставить показывать дефисы в журнале командой \showhyphens
.
В LaTeX исправление переносов может быть добавлено пользователями с помощью:
\hyphenation{слова}
Команда \hyphenation
объявляет разрешенные точки переноса, в которых слова представляют собой список слов, разделенных пробелами, в котором каждая точка переноса обозначается символом -
. Например,
\hyphenation{фортран, э-го-но-микрофон}
заявляет, что в текущей работе "фортран" не следует ставить через дефис и что если "эргономичный" нужно ставить через дефис, то это будет в одной из указанных точек. [6]
Однако существует несколько ограничений. Например, \hyphenation
команда stock по умолчанию принимает только буквы ASCII , поэтому ее нельзя использовать для исправления переносов в словах с символами, отличными от ASCII (например, ä , é , ç ), которые очень распространены во многих языках. Однако существуют простые обходные пути. [7] [8]