В пунктуации разделитель слов — это форма глифа , разделяющего написанные слова . В языках, использующих латинский , кириллический и арабский алфавиты , а также другие письменности Европы и Западной Азии, разделителем слов является пробел или пробел . Эта традиция распространяется, наряду с другими аспектами европейской пунктуации, в Азию и Африку, где слова обычно пишутся без разделения слов. [1] [ требуется лучший источник ]
В кодировке символов сегментация слов зависит от того, какие символы определены как разделители слов.
В Древнем Египте детерминативы могли использоваться как для разграничения границ слов, так и для устранения неоднозначности семантики слов. [ 2] Редко в ассирийской клинописи , но обычно в более позднем клинописном угаритском алфавите , для разделения слов использовалась вертикальная черта 𒑰. В древнеперсидской клинописи использовался диагонально наклонный клин 𐏐. [3]
По мере распространения алфавита по всему древнему миру слова часто писались вместе без разделения, и эта практика сохраняется или сохранялась до недавнего времени во многих странах Южной и Юго-Восточной Азии. Однако нередко в надписях для разделения слов использовалась вертикальная линия, а в рукописях — одинарная (·), двойная (:) или тройная (⫶) интерпунктная (точка). Такая практика была обнаружена в финикийском , арамейском , иврите , греческом и латинском языках и продолжается сегодня в эфиопском , хотя там пробелы набирают силу.
Ранние алфавитные системы письма, такие как финикийский алфавит , имели только знаки для согласных (хотя некоторые знаки для согласных могли также обозначать гласные , так называемые matres lectionis ). Без какой-либо формы видимых разделителей слов разбор текста на отдельные слова был бы головоломкой. С введением букв, представляющих гласные в греческом алфавите , необходимость в разделении слов уменьшилась. Самые ранние греческие надписи использовали интерпункты, как это было принято в системах письма, которые предшествовали им, но вскоре практика scriptio continua , непрерывного письма, в котором все слова писались вместе без разделения, стала общепринятой.
Алфавитное письмо без межсловного разделения, известное как scriptio continua , использовалось в Древнем Египте. Оно появилось в постклассической латыни после нескольких столетий использования интерпункта.
Традиционно для индийских алфавитов Южной и Юго-Восточной Азии и хангыля в Корее использовалась система scriptio continua , но теперь в хангыле и все чаще в индийских алфавитах используется интервал.
Сегодня китайский и японский языки являются наиболее широко используемыми письменностями, последовательно записываемыми без знаков препинания для разделения слов, хотя другие письменности, такие как тайский и лаосский, также следуют этой традиции письма. В классическом китайском языке слово и иероглиф были почти одним и тем же, поэтому разделители слов были бы излишними. Хотя в современном мандаринском языке есть множество многосложных слов, и каждый слог пишется отдельным иероглифом, концептуальная связь между иероглифом и словом или, по крайней мере, морфемой остается сильной, и не ощущается необходимости в разделении слов, кроме того, что уже обеспечивают иероглифы. Эта связь также встречается во вьетнамском языке ; однако во вьетнамском алфавите практически все слоги разделены пробелами, независимо от того, образуют ли они границы слов или нет.
Пробел является наиболее распространенным разделителем слов, особенно в латинском алфавите .
Древние письмена и клинописные шрифты, такие как анатолийские иероглифы, часто использовали короткие вертикальные линии для разделения слов, как и линейное письмо Б. В рукописях вертикальные линии чаще использовались для более крупных разрывов, эквивалентных латинской запятой и точке. Так было в библейском иврите ( пасек ) и продолжается во многих современных индийских шрифтах ( данда ).
Как отмечалось выше, одинарный и двойной интерпункт использовались в рукописях (на бумаге) по всему древнему миру. Например, в эфиопских надписях использовалась вертикальная линия, тогда как в рукописях использовались двойные точки (፡), напоминающие двоеточие. Последняя практика продолжается и сегодня, хотя пространство проникает внутрь. Классическая латынь использовала интерпункт как в бумажных рукописях, так и в надписях на камне. [5] Древнегреческая орфография использовала от двух до пяти точек в качестве разделителей слов, а также гиподиастолу .
В современных еврейских и арабских алфавитах некоторые буквы имеют различные формы в конце и/или начале слов. Это разграничение используется в дополнение к пробелам.
Форма исламской каллиграфии насталик использует вертикальное расположение для разделения слов. Начало каждого слова пишется выше, чем конец предыдущего слова, так что строка текста приобретает пилообразный вид. Насталик распространился из Персии и сегодня используется для персидского , уйгурского , пушту и урду .
В дактилоскопии и азбуке Морзе слова разделяются паузой.
Для использования с компьютерами эти знаки имеют кодовые точки в Unicode :
Эта строка имеет интервал.