Рубиновые символы или символы руби ( японский :ルビ; ромадзи : руби ; корейский : 루비 ; ромаджа : руби ) — небольшие аннотативные глоссы , которые обычно размещаются над или справа от логографических символов языков восточноазиатской культурной сферы , таких как китайский ханзи , японский кандзи и корейский ханджа , чтобы показать произношение логотипов; раньше они также использовались для обозначения вьетнамских chữ Hán и chữ Nôm , и их до сих пор иногда можно увидеть в этом контексте при чтении архаичных текстов. Такие аннотации , которые обычно называются просто Ruby или Rubi , чаще всего используются в качестве руководства по произношению символов, которые могут быть незнакомы читателю.
Вот пример японских рубиновых символов (называемых фуригана ) для Токио («東京»):
Большинство фуриган написаны слоговой азбукой хирагана , но иногда также используются катакана и ромадзи . Альтернативно, иногда иностранные слова (обычно английские) печатаются с помощью фуриганы, чтобы передать значение, и наоборот. В учебниках иногда чтение читается катаканой, а чтение куна - хираганой.
Вот пример рубиновых символов Пекина («北京») в Чжуинь (также известный как Бопомофо), Сяоэрцзин и Пиньинь.
На Тайване основным слоговым письмом, используемым для китайских рубиновых иероглифов, является Чжуинь фухао (также известный как Бопомофо ); в материковом Китае в основном используется пиньинь . Обычно, в отличие от примера, показанного выше, чжуинь используется с традиционным вертикальным письмом, а чжуинь пишется с правой стороны иероглифов. В материковом Китае используется горизонтальное письмо, а над китайскими иероглифами пишутся рубиновые символы (пиньинь).
Сяоэрцзин — это персидско-арабский алфавит, принятый мусульманами хуэй и иногда используемый в качестве рубиновых символов в различных рукописях. У этой системы есть свои недостатки, в основном отсутствие возможности индикации тонов. С распространением пиньинь использование этой системы в последние десятилетия сократилось. В большинстве рукописей символы Сяоэрцзин отмечены справа налево, что весьма уникально по сравнению с другими системами. Это связано с тем, что обычно такие рукописи включают арабские тексты, такие как Коран, а китайское письмо является объяснением или переводом.
Книги с фонетическими руководствами (особенно пиньинь) пользуются популярностью у детей и иностранцев, изучающих китайский язык.
Вот пример корейских рубиновых иероглифов для Кореи («韓國»):
Ромаха обычно используется в иностранных учебниках до тех пор, пока не будет введен хангыль. Рубиновые символы могут быть довольно распространены на вывесках в некоторых частях Южной Кореи.
Вот пример вьетнамских рубиновых символов ( Chữ Quốc Ngữ) для Ханоя («河內»):
Китайские иероглифы и их производные ( chữ Hán и chữ Nôm ), которые использовались вьетнамцами, вышли из употребления в пользу латинского письма chữ Quốc ngữ во время французского колониального периода, когда оно стало частью обязательного образования ( 1920-е годы и далее). В настоящее время все еще используется людьми, употребляющими джин . [ нужна цитата ]
Ruby может использоваться по разным причинам:
Кроме того, рубин может использоваться для обозначения значения, а не произношения, возможно, незнакомого (обычно иностранного) или жаргонного слова. Обычно это используется в устном диалоге и применимо только к японским публикациям. Самая распространенная форма рубина называется фуригана или йомигана и встречается в японских учебных пособиях, газетах, комиксах и книгах для детей.
В японском языке некоторые символы, такие как сокуон (促音) (маленький цу ,っ), обозначающий паузу перед предшествующей ей согласной, обычно пишутся примерно вдвое меньше обычных символов. При написании рубиновыми символами такие символы обычно имеют тот же размер, что и другие рубиновые символы. Достижения в области технологий теперь позволяют точно отображать некоторые символы. [ необходимо уточнение ] [1]
В китайском языке практика передачи фонетических сигналов с помощью Ruby встречается редко, но систематически встречается в учебниках и словарях для начальной школы. У китайцев нет специального названия для этой практики, поскольку она не так широко распространена, как в Японии. На Тайване он известен как « чжуинь » по названию фонетической системы, используемой там для этой цели. Он практически всегда используется вертикально, потому что публикации обычно имеют вертикальный формат, а чжуинь не так легко читать, когда он представлен горизонтально. [ нужна цитата ] Там, где чжуинь не используется, используются другие китайские фонетические системы, такие как пиньинь .
В академических целях вьетнамский текст, написанный на языке chữ Hán или chữ Nôm, для современных читателей может быть дополнен рубином chữ quốc ngữ . [2]
Иногда подстрочные глоссы визуально похожи на Ruby: они появляются над или под основным текстом более мелким шрифтом. Однако это особая практика, используемая для помощи изучающим иностранный язык путем толкования слов в тексте, а не произношения менее известных символов.
Аннотации Ruby также можно использовать при рукописном вводе.
В британской типографике рубин изначально был названием шрифта высотой 5,5 пунктов , который принтеры использовали для подстрочных аннотаций в печатных документах. В японском языке это слово стало названием не размера шрифта, а названия фуриганы . При обратной транслитерации на английский язык в некоторых текстах это слово отображалось как руби (типичная латинизация японского словаルビвместоルビー( руби ), ожидаемой транслитерации рубина ). Однако написание «ruby» стало более распространенным после того, как W3C опубликовал рекомендацию по разметке Ruby . В США размер шрифта назывался « агат » — термин, используемый с 1831 года согласно Оксфордскому словарю английского языка .
В 2001 году W3C опубликовал спецификацию Ruby Annotation [1] для дополнения XHTML рубиновой разметкой. Разметка Ruby включена в спецификацию XHTML 1.1 и в HTML5. [3]
Для браузеров, которые не поддерживают Ruby изначально, поддержку Ruby проще всего добавить с помощью правил CSS , доступных в Интернете. [4]
Разметка Ruby структурирована таким образом, что резервный рендеринг, состоящий из символов Ruby в круглых скобках сразу после основного текста, появляется, если браузер не поддерживает Ruby.
W3C также работает над специальным модулем Ruby для CSS уровня 2, который дополнительно позволяет группировать Ruby и автоматически исключать фуриганы, соответствующие их аннотированной части. [5]
Ниже приведены несколько примеров рубиновой разметки. Разметка отображается первой, затем отображается визуализированная разметка, а затем немаркированная версия. Веб-браузеры либо визуализируют его с правильным размером и расположением, как показано в приведенных выше примерах на основе таблиц, либо используют резервный рендеринг с символами Ruby в круглых скобках:
Обратите внимание, что текст на китайском языке Ruby обычно отображается в вертикальных столбцах справа от каждого символа. В настоящее время этот подход обычно не поддерживается в браузерах.
Это табличный пример вертикальных столбцов:
Сложная разметка Ruby позволяет связать более одного текста Ruby с базовым текстом или части текста Ruby с частями базового текста. [6]
Юникод и сопутствующий ему стандарт, универсальный набор символов , поддерживают Ruby посредством следующих символов подстрочных аннотаций : [7]
FFF9
( шестнадцатеричный ) — привязка подстрочной аннотации — отмечает начало аннотированного текста.FFFA
(шестнадцатеричный) — подстрочный разделитель аннотаций — отмечает начало аннотирующих символов.FFFB
(шестнадцатеричный) — знак завершения подстрочной аннотации — отмечает конец аннотированного текста.Лишь немногие приложения реализуют эти символы. Технический отчет Unicode № 20 [8] поясняет, что эти символы не предназначены для использования пользователями языков разметки и программных приложений. Там, где это возможно, предлагается использовать рубиновую разметку.
Символы подстрочной аннотации являются частью блока Unicode «Specials»:
ISO/IEC 6429 (также известный как ECMA -48), который определяет escape-коды ANSI, также предоставляет механизм Ruby-текста для использования текстовыми терминалами, хотя немногие терминалы и эмуляторы терминалов реализуют его. Escape-код PARALLEL TEXTS (PTX) допускал шесть значений параметров, дающих следующие escape-последовательности для маркировки Ruby-текста:
CSI 0 \
(или просто CSI \
, поскольку в качестве значения по умолчанию для этого элемента управления используется 0) — конец параллельных текстовCSI 1 \
– начало строки основного параллельного текстаCSI 2 \
– начало строки дополнительного параллельного текстаCSI 3 \
– начало строки дополнительной японской фонетической аннотации.CSI 4 \
– начало строки дополнительной фонетической аннотации на китайском языке.CSI 5 \
– конец строки дополнительных фонетических аннотаций