stringtranslate.com

Разделитель слов

В пунктуации разделитель слов — это форма глифа , разделяющего написанные слова . В языках, использующих латинский , кириллический и арабский алфавиты , а также другие письменности Европы и Западной Азии, разделителем слов является пробел или пробел . Эта традиция распространяется, наряду с другими аспектами европейской пунктуации, в Азию и Африку, где слова обычно пишутся без разделения слов. [1] [ требуется лучший источник ]

В кодировке символов сегментация слов зависит от того, какие символы определены как разделители слов.

История

В Древнем Египте детерминативы могли использоваться как для разграничения границ слов, так и для устранения неоднозначности семантики слов. [ 2] Редко в ассирийской клинописи , но обычно в более позднем клинописном угаритском алфавите , для разделения слов использовалась вертикальная черта 𒑰. В древнеперсидской клинописи использовался диагонально наклонный клин 𐏐. [3]

По мере распространения алфавита по всему древнему миру слова часто писались вместе без разделения, и эта практика сохраняется или сохранялась до недавнего времени во многих странах Южной и Юго-Восточной Азии. Однако нередко в надписях для разделения слов использовалась вертикальная линия, а в рукописях — одинарная (·), двойная (:) или тройная (⫶) интерпунктная (точка). Такая практика была обнаружена в финикийском , арамейском , иврите , греческом и латинском языках и продолжается сегодня в эфиопском , хотя там пробелы набирают силу.

Scriptio continua

Ранние алфавитные системы письма, такие как финикийский алфавит , имели только знаки для согласных (хотя некоторые знаки для согласных могли также обозначать гласные , так называемые matres lectionis ). Без какой-либо формы видимых разделителей слов разбор текста на отдельные слова был бы головоломкой. С введением букв, представляющих гласные в греческом алфавите , необходимость в разделении слов уменьшилась. Самые ранние греческие надписи использовали интерпункты, как это было принято в системах письма, которые предшествовали им, но вскоре практика scriptio continua , непрерывного письма, в котором все слова писались вместе без разделения, стала общепринятой.

Типы

Никто

Алфавитное письмо без межсловного разделения, известное как scriptio continua , использовалось в Древнем Египте. Оно появилось в постклассической латыни после нескольких столетий использования интерпункта.

Традиционно для индийских алфавитов Южной и Юго-Восточной Азии и хангыля в Корее использовалась система scriptio continua , но теперь в хангыле и все чаще в индийских алфавитах используется интервал.

Сегодня китайский и японский языки являются наиболее широко используемыми письменностями, последовательно записываемыми без знаков препинания для разделения слов, хотя другие письменности, такие как тайский и лаосский, также следуют этой традиции письма. В классическом китайском языке слово и иероглиф были почти одним и тем же, поэтому разделители слов были бы излишними. Хотя в современном мандаринском языке есть множество многосложных слов, и каждый слог пишется отдельным иероглифом, концептуальная связь между иероглифом и словом или, по крайней мере, морфемой остается сильной, и не ощущается необходимости в разделении слов, кроме того, что уже обеспечивают иероглифы. Эта связь также встречается во вьетнамском языке ; однако во вьетнамском алфавите практически все слоги разделены пробелами, независимо от того, образуют ли они границы слов или нет.

Пример яванского письма scriptio continua первой статьи Декларации прав человека.

Космос

Пробел является наиболее распространенным разделителем слов, особенно в латинском алфавите .

Примеры традиционных интервалов из Чикагского руководства по стилю 1911 года [4]

Вертикальные линии

Древние письмена и клинописные шрифты, такие как анатолийские иероглифы, часто использовали короткие вертикальные линии для разделения слов, как и линейное письмо Б. В рукописях вертикальные линии чаще использовались для более крупных разрывов, эквивалентных латинской запятой и точке. Так было в библейском иврите ( пасек ) и продолжается во многих современных индийских шрифтах ( данда ).

Интерпункт, множественные точки и гиподиастола

Эфиопский двойной интерпункт

Как отмечалось выше, одинарный и двойной интерпункт использовались в рукописях (на бумаге) по всему древнему миру. Например, в эфиопских надписях использовалась вертикальная линия, тогда как в рукописях использовались двойные точки (፡), напоминающие двоеточие. Последняя практика продолжается и сегодня, хотя пространство проникает внутрь. Классическая латынь использовала интерпункт как в бумажных рукописях, так и в надписях на камне. [5] Древнегреческая орфография использовала от двух до пяти точек в качестве разделителей слов, а также гиподиастолу .

Различные формы букв

В современных еврейских и арабских алфавитах некоторые буквы имеют различные формы в конце и/или начале слов. Это разграничение используется в дополнение к пробелам.

Вертикальное расположение

Насталик, используемый для урду (пишется справа налево)

Форма исламской каллиграфии насталик использует вертикальное расположение для разделения слов. Начало каждого слова пишется выше, чем конец предыдущего слова, так что строка текста приобретает пилообразный вид. Насталик распространился из Персии и сегодня используется для персидского , уйгурского , пушту и урду .

Пауза

В дактилоскопии и азбуке Морзе слова разделяются паузой.

Юникод

Для использования с компьютерами эти знаки имеют кодовые точки в Unicode :

В линейном письме Б :

Смотрите также

Ссылки

  1. ^ (Сенгер 2000)
  2. ^ «Определители являются наиболее важным средством повышения читаемости, поскольку являются легко распознаваемыми разделителями слов» (Ритнер 1996:77)
  3. Кинг, Леонард Уильям (1901). Ассирийская клинопись . Нью-Йорк: AMS Press. С. 42.
  4. Издательство Чикагского университета (1911). Руководство по стилю: Сборник типографских правил, регламентирующих публикации Чикагского университета, с образцами шрифтов, используемых в издательстве университета (третье изд.). Чикаго: Чикагский университет. стр. 101. Эта строка имеет интервал.
  5. ^ (Уинго 1972:16)

Дальнейшее чтение