Слогификация

Слогификация ( / s ɪ ˌ l æ b ɪ f ɪ ˈ k eɪ ʃ ən / ) или слогирование ( / s ɪ ˌ l æ b ɪ ˈ k eɪ ʃ ən / ), также известная как расстановка переносов , представляет собой разделение слова на слоги , произносимые, написанные ^[1] или подписанные. ^[2]

Обзор

Письменное разделение на слоги обычно обозначается дефисом при использовании английской орфографии (например, слог) и точкой при транскрипции фактически произнесенных слогов в Международном фонетическом алфавите (например, [ˈsɪl.ə.bᵊɫ] ). . В целях презентации типографы могут использовать вставку ( символ Юникода U+00B7, например, слог), специальную «точку переноса» (U+2027, например, слог) или пробел . (например, слог).

В конце строки слово разделяется на письме на части, условно называемые «слогами», если оно не умещается в строку и если перемещение его на следующую строку сделало бы первую строку значительно короче остальных. Это может стать особой проблемой при использовании очень длинных слов и узких колонок в газетах. Обработка текста автоматизировала процесс выравнивания , делая слоговое разделение более коротких слов часто ненужным.

В некоторых языках произнесенные слоги также являются основой слогообразования на письме. Однако, возможно, из-за слабого соответствия между звуками и буквами в правописании современного английского языка, письменное слогообразование в английском языке базируется преимущественно на этимологических или морфологических , а не на фонетических принципах. Например, невозможно слогово обозначить «обучение» как обучение согласно правильной слоговой системе живого языка. Вид только lear- в конце строки может ввести читателя в заблуждение и заставить его произнести слово неправильно, поскольку орграф ea может содержать множество разных значений . История английской орфографии объясняет такие явления.

Таким образом, английское письменное слогообразование имеет дело с понятием «слог», которое не соответствует лингвистическому понятию фонологической (в отличие от морфологической) единицы.

В результате даже большинство носителей английского языка не могут составлять слова по слогам в соответствии с установленными правилами, не обращаясь к словарю или не используя текстовый процессор. Школы обычно не дают большего совета по этой теме, чем обратиться к словарю. Кроме того, существуют различия между британским и американским слогом и даже между словарями одного и того же английского языка.

В финском , итальянском , португальском , японском ( ромаджи ), корейском ( романизированном ) и других почти фонематически написанных языках писатели в принципе могут правильно составить слоги любого существующего или вновь созданного слова, используя только общие правила. В Финляндии детей сначала учат расставлять каждое слово через дефис до тех пор, пока они не составят правильное слоговое образование, после чего дефисы можно опустить.

Алгоритм

Нерешенная задача в информатике :

Существует ли идеальный алгоритм слогообразования в английском языке?

(еще нерешенные проблемы по информатике)

Алгоритм расстановки переносов — это набор правил, особенно кодифицированных для реализации в компьютерной программе, который решает, в каких точках слово можно разбить на две строки дефисом. Например, алгоритм расстановки переносов может решить, что импичмент можно разделить на импичмент или импичмент , но не как импичмент .

Одна из причин сложности правил разделения слов заключается в том, что разные диалекты английского языка имеют тенденцию различаться в расстановке переносов: американский английский имеет тенденцию работать со звуком, а британский английский имеет тенденцию обращать внимание на происхождение слова, а затем на его звучание. . ^{[ нужна цитата ]} Существует также большое количество исключений, что еще больше усложняет ситуацию. ^{[ нужна цитата ]}

Некоторые практические правила можно найти в книге майора Кири «О расстановке переносов: анархия педантизма». ^[3] Среди алгоритмических подходов к расстановке переносов широко используется тот, который реализован в системе набора текста TeX . Это подробно описано в первых двух томах книги « Компьютеры и набор текста» Дональда Кнута и в диссертации Франклина Марка Ляна. ^[4] Целью работы Ляна было получить настолько точный алгоритм, насколько это возможно, и сохранить небольшой словарь исключений.

В исходных шаблонах расстановки переносов TeX для американского английского список исключений содержит всего 14 слов. ^[5]

В ТеХе

Порты алгоритма расстановки переносов TeX доступны в виде библиотек для нескольких языков программирования, включая Haskell , JavaScript , Perl , PostScript , Python , Ruby , C# , а TeX можно заставить показывать дефисы в журнале командой \showhyphens.

В LaTeX исправление переносов может быть добавлено пользователями с помощью:

\hyphenation{слова}

Команда \hyphenationобъявляет разрешенные точки переноса, в которых слова представляют собой список слов, разделенных пробелами, в котором каждая точка переноса обозначается символом -. Например,

\hyphenation{фортран, э-го-но-микрофон}

заявляет, что в текущей работе "фортран" не следует ставить через дефис и что если "эргономичный" нужно ставить через дефис, то это будет в одной из указанных точек. ^[6]

Однако существует несколько ограничений. Например, \hyphenationкоманда stock по умолчанию принимает только буквы ASCII , поэтому ее нельзя использовать для исправления переносов в словах с символами, отличными от ASCII (например, ä , é , ç ), которые очень распространены во многих языках. Однако существуют простые обходные пути. ^[7]^[8]

Смотрите также

Примечания

^ Этот термин также используется для обозначения процесса превращения согласного в слоговое. Например, в северо-центральноамериканском английском «can» может произноситься как [kən] или [kn̩] со слоговым /n/.
^ Баус, К.; Гутьеррес, Э.; Каррейрас, М. (13 ноября 2014 г.). «Роль слогов в производстве языка жестов». Границы в психологии . 5 : 1254. doi : 10.3389/fpsyg.2014.01254 . ПМК 4230165 .
^ Майор Кири. «О переносах — анархия педантизма». Обновление ПК . Группа пользователей ПК в Мельбурне. Архивировано из оригинала 10 марта 2005 года . Проверено 6 октября 2005 г.
^ Лян, Франклин Марк (август 1983 г.). Слово «перенос» с помощью компьютера (доктор философии). Кафедра компьютерных наук Стэнфордского университета . СТАН-CS-83-977.
^ "Таблицы переносов Plain TeX" . Проверено 23 июня 2009 г.
^ "\ переносы". Гипертекстовая справка по LaTeX . Йель.
^ «Слова с ударением не пишутся через дефис» . Часто задаваемые вопросы по TeX .
^ «Как работает расстановка переносов в TeX?». Часто задаваемые вопросы по TeX .

Внешние ссылки

Online Lyric Hyphenator: переносит английский текст на слоги.
Инструмент расстановки переносов для французского языка: расставляет переносы французских слов с пояснениями.