Символы руби или символы руби ( яп .ルビ; rōmaji : rubi ; кор . 루비 ; romaja : rubi ) — это небольшие аннотативные глоссы , которые обычно размещаются выше или справа от логографических символов языков в культурной сфере Восточной Азии , таких как китайский ханзи , японский кандзи и корейский ханджа , чтобы показать произношение логографов; ранее они также использовались для вьетнамских чу-хан и чу-ном , и их все еще иногда можно увидеть в этом контексте при чтении архаичных текстов. Обычно называемые просто руби или руби , такие аннотации чаще всего используются в качестве руководств по произношению для символов, которые, вероятно, будут незнакомы читателю.
Вот пример японских рубиновых иероглифов (называемых фуригана ) для Токио («東京»):
Большинство фуриган записаны слоговой азбукой хирагана , но иногда используются катакана и ромадзи . В качестве альтернативы иногда иностранные слова (обычно английские) печатаются с помощью фуриганы, чтобы передать значение, и наоборот. Учебники иногда передают on-чтения катаканой, а kun-чтения — хираганой.
Ниже приведен пример рубиновых иероглифов для слова «Пекин» («北京») в письменностях чжуинь (он же бопомофо), сяоэрцзин и пиньинь.
На Тайване основным слоговым письмом для китайских рубиновых иероглифов является чжуинь фухао (также известный как бопомофо ); в материковом Китае в основном используется пиньинь . Обычно, в отличие от примера, показанного выше, чжуинь используется с вертикальным традиционным письмом, и чжуинь пишется с правой стороны иероглифов. В материковом Китае используется горизонтальное письмо, и рубиновые иероглифы (пиньинь) пишутся над китайскими иероглифами.
Xiao'erjing — персидско-арабский алфавит, принятый мусульманами хуэй и иногда используемый в качестве рубиновых символов в различных рукописях. Эта система имеет свои недостатки, главным образом, то, что она не может обозначать тона. С распространением пиньинь использование этой системы в последние десятилетия пришло в упадок. Большинство рукописей, которые отмечают символы с помощью Xiao'erjing, делают это справа налево, что довольно уникально по сравнению с другими системами. Это связано с тем, что обычно такие рукописи включают арабские тексты, такие как Коран, а китайское письмо является объяснением или переводом.
Книги с фонетическими справочниками (особенно пиньинь) пользуются популярностью у детей и иностранцев, изучающих китайский язык.
Вот пример корейских рубиновых иероглифов для Кореи («韓國»):
Romaja обычно используется в иностранных учебниках до тех пор, пока не введен хангыль. Рубиновые символы могут быть довольно распространены на вывесках в некоторых частях Южной Кореи.
Вот пример вьетнамских рубиновых символов ( Chữ Quốc Ngữ ) для Ханоя («河內»):
Китайские иероглифы и их производные ( chữ Hán и chữ Nôm ), которые использовались вьетнамцами , вышли из употребления в пользу латинского письма chữ Quốc ngữ во время французского колониального периода, когда оно стало частью обязательного образования (с 1920-х годов). В настоящее время все еще используются народом Джин . [ требуется ссылка ]
Ruby может использоваться по разным причинам:
Также ruby может использоваться для указания значения, а не произношения, возможно незнакомого (обычно иностранного) или сленгового слова. Обычно это используется в разговорном диалоге и применяется только к японским публикациям. Наиболее распространенная форма ruby называется furigana или yomigana и встречается в японских учебных пособиях, газетах, комиксах и книгах для детей.
В японском языке некоторые символы, такие как сокуон (促音) (маленький цу ,っ), который обозначает паузу перед согласным, которому он предшествует, обычно пишутся примерно в два раза меньше обычных символов. При написании руби такие символы обычно имеют тот же размер, что и другие рубиновые символы. Достижения в области технологий теперь позволяют точно отображать некоторые символы. [ требуется разъяснение ] [1]
В китайском языке практика предоставления фонетических подсказок с помощью руби встречается редко, но систематически встречается в учебниках или словарях для начальной школы. У китайцев нет специального названия для этой практики, поскольку она не так распространена, как в Японии. На Тайване она известна как « чжуинь », по названию фонетической системы, используемой там для этой цели. Она практически всегда используется вертикально, поскольку публикации обычно имеют вертикальный формат, а чжуинь не так легко читать, когда он представлен горизонтально. [ необходима цитата ] Там, где чжуинь не используется, используются другие китайские фонетические системы, такие как пиньинь .
В академических целях вьетнамский текст, написанный на chữ Hán или chữ Nôm, для современных читателей может быть дополнен рубином chữ quốc ngữ . [2]
Иногда межстрочные глоссы визуально похожи на руби, появляясь над или под основным текстом более мелким шрифтом. Однако это отдельная практика, используемая для помощи студентам иностранного языка, давая глоссы для слов в тексте, в отличие от произношения менее известных символов.
Рубиновые аннотации можно использовать и в рукописном тексте.
В британской типографии ruby изначально было названием шрифта высотой 5,5 пунктов , который печатники использовали для межстрочных примечаний в печатных документах. В японском языке, вместо того, чтобы ссылаться на размер шрифта, это слово стало названием наборного фуригана . При транслитерации обратно на английский язык некоторые тексты передавали слово как rubi (типичная романизация японского словаルビ, вместоルビー( rubī ), ожидаемой транслитерации ruby ). Однако написание «ruby» стало более распространенным с тех пор, как W3C опубликовал рекомендации по разметке ruby . В США размер шрифта назывался « agate », термин, используемый с 1831 года, согласно Оксфордскому словарю английского языка .
В 2001 году W3C опубликовал спецификацию Ruby Annotation [1] для дополнения XHTML разметкой Ruby. Разметка Ruby включена в спецификацию XHTML 1.1 и в HTML5. [3]
Для браузеров, которые изначально не поддерживают Ruby, поддержку Ruby проще всего добавить с помощью правил CSS , доступных в Интернете. [4]
Разметка Ruby структурирована таким образом, что если браузер не поддерживает Ruby, отображается резервный рендеринг, состоящий из символов Ruby в скобках сразу после основного текста.
W3C также работает над специальным модулем ruby для CSS уровня 2, который дополнительно позволяет группировать ruby и автоматически пропускать фуригану, соответствующую их аннотированной части. [5]
Ниже приведены несколько примеров разметки ruby. Сначала отображается разметка, затем отображается отрендеренная разметка, а затем неотмеченная версия. Веб-браузеры либо отображают ее с правильным размером и позиционированием, как показано в приведенных выше примерах на основе таблиц, либо используют резервную визуализацию с символами ruby в скобках:
Обратите внимание, что китайский текст ruby обычно отображается в вертикальных столбцах справа от каждого символа. Этот подход обычно не поддерживается в браузерах в настоящее время.
Это пример таблицы вертикальных столбцов:
Сложная разметка ruby позволяет связать более одного текста ruby с базовым текстом или части текста ruby с частями базового текста. [6]
Unicode и сопутствующий ему стандарт, универсальный набор символов , поддерживают Ruby с помощью следующих символов межстрочной аннотации : [7]
FFF9
( hex ) — якорь межстрочной аннотации — отмечает начало аннотированного текста.FFFA
(шестнадцатеричная) — разделитель межстрочных аннотаций — отмечает начало символа(ов) аннотации.FFFB
(шестнадцатеричная) — терминатор межстрочной аннотации — отмечает конец аннотированного текста.Немногие приложения реализуют эти символы. Технический отчет Unicode № 20 [8] разъясняет, что эти символы не предназначены для показа пользователям языков разметки и программных приложений. Он предлагает использовать вместо них разметку Ruby, где это уместно.
Символы межстрочной аннотации являются частью блока Unicode «Specials»:
ISO/IEC 6429 (также известный как ECMA -48), который определяет escape-коды ANSI, также предоставил механизм для текста ruby для использования текстовыми терминалами, хотя немногие терминалы и эмуляторы терминалов реализуют его. Escape-код PARALLEL TEXTS (PTX) принимал шесть значений параметров, давая следующие escape-последовательности для маркировки текста ruby:
CSI 0 \
(или просто CSI \
так как 0 используется как значение по умолчанию для этого элемента управления) – конец параллельных текстовCSI 1 \
– начало строки основного параллельного текстаCSI 2 \
– начало строки дополнительного параллельного текстаCSI 3 \
– начало строки дополнительной фонетической аннотации на японском языкеCSI 4 \
– начало строки дополнительной фонетической аннотации на китайском языкеCSI 5 \
– конец ряда дополнительных фонетических аннотаций