В пунктуации разделитель слов представляет собой форму глифа , который разделяет написанные слова . В языках, использующих латинский , кириллический и арабский алфавиты , а также другие письменности Европы и Западной Азии, разделителем слов является пробел или пробел . Эта конвенция распространяется вместе с другими аспектами европейской пунктуации в Азии и Африке, где слова обычно пишутся без разделения слов. [1] [ нужен лучший источник ]
При кодировании символов сегментация слов зависит от того, какие символы определены как разделители слов.
В Древнем Египте определители могли использоваться как для обозначения границ слов, так и для устранения неоднозначности семантики слов. [2] Редко в ассирийской клинописи , но обычно в более позднем клинописном угаритском алфавите для разделения слов использовалась вертикальная черта 𒑰. В древнеперсидской клинописи использовался диагонально наклоненный клин 𐏐. [3]
По мере распространения алфавита по всему древнему миру слова часто соединялись вместе, не разделяясь, и эта практика сохраняется или сохранялась до недавнего времени в большей части Южной и Юго-Восточной Азии. Однако нередко в надписях для разделения слов использовалась вертикальная линия, а в рукописях — одинарный (·), двойной (:) или тройной (⫶) межпунктовый знак (точка). Эта практика была обнаружена в финикийском , арамейском , иврите , греческом и латыни и продолжается сегодня в эфиопском языке , хотя и там пробелы набирают силу.
Ранние системы алфавитного письма, такие как финикийский алфавит , имели только знаки для согласных (хотя некоторые знаки для согласных могли обозначать и гласные , так называемые matres lectionis ). Без каких-либо видимых разделителей слов разбор текста на отдельные слова был бы загадкой. С появлением в греческом алфавите букв, обозначающих гласные , необходимость в разделении между словами уменьшилась. В самых ранних греческих надписях использовались интерпункты, как это было принято в предшествующих им системах письма, но вскоре стала распространена практика scriptio continua , непрерывного письма, в котором все слова соединялись вместе, не разделяясь.
Алфавитное письмо без разделения между словами, известное как scriptio continua , использовалось в Древнем Египте. Он появился в постклассической латыни после нескольких столетий использования интерпункта.
Традиционно scriptio continua использовался для индийских алфавитов Южной и Юго-Восточной Азии и хангыля Кореи, но теперь пробелы используются в хангыле и все чаще в индийских алфавитах.
Сегодня китайский и японский языки являются наиболее широко используемыми алфавитами, которые последовательно пишутся без знаков препинания для разделения слов, хотя другие сценарии, такие как тайский и лаосский , также следуют этому соглашению. В классическом китайском языке слово и иероглиф были почти одним и тем же, поэтому разделители слов были бы излишними. Хотя в современном мандаринском языке имеется множество многосложных слов, и каждый слог пишется отдельным символом, концептуальная связь между символом и словом или, по крайней мере, морфемой остается сильной, и нет необходимости в разделении слов кроме того, что уже обеспечивают символы. Эта ссылка также имеется на вьетнамском языке ; однако во вьетнамском алфавите практически все слоги разделены пробелами, независимо от того, образуют ли они границы слов или нет.
Пробел — наиболее распространенный разделитель слов, особенно в латинице .
В древних письменных и клинописных письмах , таких как анатолийские иероглифы, для разделения слов часто использовались короткие вертикальные линии, как и в линейном письме B. В рукописях для больших разрывов чаще использовались вертикальные линии, эквивалентные латинской запятой и точке. Так было с библейским ивритом ( пасек ) и продолжается сегодня во многих индийских письменностях ( данда ).
Как отмечалось выше, одинарный и двойной интерпункт использовался в рукописях (на бумаге) по всему древнему миру. Например, в эфиопских надписях использовалась вертикальная линия, тогда как в рукописях использовались двойные точки (፡), напоминающие двоеточие. Последняя практика продолжается и сегодня, хотя в космосе происходит все большее распространение. Классическая латынь использовала интерпункт как в бумажных рукописях, так и в надписях на камнях. [5] Древнегреческая орфография использовала от двух до пяти точек в качестве разделителей слов, а также гиподиастолу .
В современных еврейском и арабском алфавитах некоторые буквы имеют разные формы в конце и/или начале слов. Это разграничение используется в дополнение к интервалу.
В форме исламской каллиграфии насталик для разделения слов используется вертикальное расположение. Начало каждого слова пишется выше конца предыдущего слова, поэтому строка текста приобретает пилообразный вид. Насталик распространился из Персии и сегодня используется в персидском , уйгурском , пушту и урду .
При пальчиковом написании и азбуке Морзе слова разделяются паузой.
Для использования на компьютерах эти знаки имеют коды в Юникоде :
Эта строка разделена интервалом.