Слогоделение ( / s ɪ ˌ l æ b ɪ f ɪ ˈ k eɪ ʃ ən / ) или слогоделение ( / s ɪ ˌ l æ b ɪ ˈ k eɪ ʃ ən / ), также известное как перенос , — это разделение слова на слоги , будь то устное, письменное [1] или знаковое [2] .
Письменное разделение на слоги обычно обозначается дефисом при использовании английской орфографии (например, syl-la-able) и точкой при транскрипции фактически произнесенных слогов в Международном фонетическом алфавите (например, [ˈsɪl.ə.bᵊɫ] ). Для целей представления типографы могут использовать интерпункт ( символ Unicode U+00B7, например, syl·la·ble), специальную «точку переноса» (U+2027, например, syl‧la‧ble) или пробел ( например, syl la ble).
В конце строки слово в письме разделяется на части, традиционно называемые «слогами», если оно не помещается в строку и если его перемещение на следующую строку сделает первую строку намного короче остальных. Это может быть особой проблемой с очень длинными словами и с узкими колонками в газетах. Обработка текста автоматизировала процесс выравнивания , делая слоговое разбиение более коротких слов часто ненужным.
В некоторых языках слоги, произносимые вслух, также являются основой письменного деления на слоги. Однако, возможно, из-за слабого соответствия между звуками и буквами в написании современного английского языка, письменное деление на слоги в английском языке основано в основном на этимологических или морфологических , а не фонетических принципах. Например, невозможно разделить слово «learning» на слоги как learn-ning в соответствии с правильным делением на слоги живого языка. Если в конце строки увидеть только lear-, читатель может неправильно произнести слово, так как диграф ea может иметь много разных значений . История английской орфографии учитывает такие явления.
Таким образом, письменное слогоделение в английском языке имеет дело с понятием «слог», которое не соответствует лингвистическому понятию фонологической (в отличие от морфологической) единицы.
В результате даже большинство носителей английского языка не способны разбить слова на слоги в соответствии с установленными правилами без обращения к словарю или использования текстового процессора. Школы обычно не дают намного больше советов по этой теме, чем просто обратиться к словарю. Кроме того, существуют различия между британской и американской слоговой системой и даже между словарями одного и того же варианта английского языка.
В финском , итальянском , португальском , японском ( ромадзи ), корейском ( романизированном ) и других языках с почти фонематическим написанием писатели в принципе могут правильно разделить на слоги любое существующее или новое слово, используя только общие правила. В Финляндии детей сначала учат переносить каждое слово, пока они не будут уверенно производить правильное разделение на слоги, после чего дефисы можно опускать.
Алгоритм переноса — это набор правил, особенно кодифицированных для реализации в компьютерной программе, который решает, в каких точках слово может быть разбито на две строки дефисом. Например, алгоритм переноса может решить, что impeachment может быть разбит как impeach-ment или imp-peachment , но не impe-achment .
Одной из причин сложности правил переноса слов является то, что разные диалекты английского языка, как правило, различаются в вопросах переноса: американский английский, как правило, работает над звучанием, а британский английский, как правило, обращается к происхождению слова, а затем к звучанию. [ необходима цитата ] Существует также большое количество исключений, что еще больше усложняет ситуацию. [ необходима цитата ]
Некоторые практические правила можно найти в работе майора Кири «О переносах – анархии педантизма». [3] Среди алгоритмических подходов к переносам широко используется тот, который реализован в системе набора текста TeX . Он подробно документирован в первых двух томах «Компьютеров и набора текста» Дональда Кнута и в диссертации Франклина Марка Ляна. [4] Целью работы Ляна было сделать алгоритм максимально точным и свести исключения к минимуму.
В оригинальных шаблонах переносов TeX для американского английского список исключений содержит всего 14 слов. [5]
Порты алгоритма переносов TeX доступны в виде библиотек для нескольких языков программирования, включая Haskell , JavaScript , Perl , PostScript , Python , Ruby , C# и TeX можно настроить для отображения переносов в журнале с помощью команды \showhyphens
.
В LaTeX исправление переносов может быть добавлено пользователями с помощью:
\перенос{слов}
Команда \hyphenation
объявляет разрешенные точки переноса, в которых слова — это список слов, разделенных пробелами, в котором каждая точка переноса обозначается символом -
. Например,
\hyphenation{fortran er-go-no-mic}
заявляет, что в текущей работе «fortran» не следует переносить, а если «ergonomic» необходимо переносить, то это будет в одной из указанных точек. [6]
Однако есть несколько ограничений. Например, \hyphenation
команда stock по умолчанию принимает только буквы ASCII , поэтому ее нельзя использовать для исправления переносов слов с не-ASCII-символами (например, ä , é , ç ), которые очень распространены во многих языках. Однако существуют простые обходные пути. [7] [8]