stringtranslate.com

Шрифт Юникод

Шрифт Unicode — это компьютерный шрифт , который сопоставляет глифы с кодовыми точками , определенными в стандарте Unicode . [1] Подавляющее большинство современных компьютерных шрифтов используют сопоставления Unicode, даже те шрифты, которые включают только глифы для одной системы письма или даже поддерживают только базовый латинский алфавит . Шрифты, которые поддерживают широкий спектр сценариев Юникода и символов Юникода , иногда называют «шрифтами пан-Юникода», хотя максимальное количество глифов, которые можно определить в шрифте TrueType , ограничено 65 535, это невозможно для один шрифт для предоставления отдельных глифов для всех определенных символов Юникода (149 813 символов в Юникоде 15.1). В этой статье перечислены некоторые широко используемые шрифты Unicode (поставляемые вместе с операционной системой или созданные известной коммерческой компанией по производству шрифтов), которые поддерживают сравнительно большое количество и широкий диапазон символов Unicode.

Фон

Стандарт Unicode не определяет и не создает какой-либо шрифт ( гарнитуру ), набор графических фигур, называемых глифами. Скорее, он определяет абстрактные символы как определенное число (известное как кодовая точка ), а также определяет необходимые изменения формы в зависимости от контекста, в котором используется глиф (например, объединение символов , заранее составленных символов и буквенно - диакритических комбинаций). Выбор шрифта, который определяет, как абстрактные символы из универсального набора кодированных символов (UCS) преобразуются в растровый или векторный вывод, который затем можно просмотреть на экране или распечатать, остается за пользователем. Если выбран шрифт, который не содержит глифа для кодовой точки, используемой в документе, он обычно отображает вопросительный знак, рамку или какой-либо другой заменяющий символ .

В компьютерных шрифтах используются различные методы отображения символов или глифов. Растровый шрифт содержит сетку точек, называемую пикселями, образующую изображение каждого глифа каждой грани и размера. В контурных шрифтах (также известных как векторные шрифты) для описания каждого глифа используются инструкции по рисованию или математические формулы. Штриховые шрифты используют серию заданных линий (для границы глифа) и дополнительную информацию для определения профиля или размера и формы линии в определенной грани и размере, которые вместе описывают внешний вид глифа.

Шрифты также включают встроенные специальные орфографические правила для вывода определенных комбинаций форм букв (альтернативных символов для одной и той же буквы) и их объединения в специальные формы лигатур (смешанные символы). Операционные системы , веб-браузеры ( пользовательский агент ) и другое программное обеспечение, широко использующее типографику, используют шрифт для отображения текста на экране или печатных носителях и могут быть запрограммированы на использование этих встроенных правил. В качестве альтернативы они могут использовать внешние технологии формирования сценариев (технологию рендеринга или механизм «умных шрифтов»), а также их можно запрограммировать на использование либо большого шрифта Unicode, либо использования нескольких разных шрифтов для разных символов или языков.

Ни один «шрифт Unicode» не включает в себя все символы, определенные в текущей версии стандарта ISO 10646 (Unicode), поскольку к нему постоянно добавляется все больше и больше языков и символов, а общие форматы шрифтов не могут содержать более 65 535 глифов (около половины количество символов, закодированных в Юникоде). В результате разработчики и производители шрифтов включают новые символы в новые версии или версии шрифта или в отдельные вспомогательные шрифты, предназначенные специально для определенных языков.

UCS имеет более 1,1 миллиона кодовых точек, но только первые 65 536 (Плоскость 0: Базовая многоязычная плоскость , или BMP) вошли в общее использование до 2000 года.

См. статью о плоскостях Юникода для получения дополнительной информации о других плоскостях, в том числе: Уровень 1: дополнительный многоязычный уровень (SMP), уровень 2: дополнительный идеографический уровень (SIP), уровень 14: дополнительный уровень специального назначения (SSP), уровень 15 и 16. : зарезервировано для зон частного использования (PUA).

Первыми шрифтами Unicode (с очень большими наборами символов и поддержкой множества блоков Unicode ) были Lucida Sans Unicode (выпущенный в марте 1993 г.), шрифт Unihan (1993 г.) и Everson Mono (1995 г.).

Проблемы

В Юникоде существуют типографские неоднозначности, поэтому некоторые из унифицированных символов хань (которые встречаются в китайском, японском и корейском языках) будут типографически различаться в разных регионах. Например, точка Юникода U+9AA8 CJK UNIFIED IDEOGRAPH-9AA8 типографически отличается на упрощенном и традиционном китайском языке. Это имеет значение для идеи о том, что один и тот же шрифт может удовлетворить потребности всех регионов. [2] Конструкция Unicode гарантирует, что такие различия не создают семантическую двусмысленность, но использование неправильных форм часто считается визуально неудобным или эстетически неуместным для читателей, являющихся носителями восточноазиатских языков.

Применение шрифтов Unicode

Unicode теперь является стандартной кодировкой для многих новых стандартов и протоколов и встроен в архитектуру операционных систем ( Microsoft Windows , Apple Mac OS и многих версий Unix и Linux ), языков программирования ( Ada , Perl , Python , Java , Common LISP , APL ) и библиотеки (IBM International Components for Unicode (ICU), а также механизмы рендеринга Pango , Graphite , Scribe , Uniscribe и ATSUI ), форматы шрифтов ( TrueType и OpenType ) и так далее. Многие другие стандарты также обновляются, чтобы стать совместимыми с Unicode.

Утилита

Вот подборка некоторых служебных программ , которые могут идентифицировать символы, присутствующие в файле шрифта:

Список шрифтов Юникода

Из множества доступных шрифтов Unicode перечисленные ниже наиболее часто используются во всем мире на основных компьютерных платформах .

Примечание
^‡ OTF+TTO:шрифт OpenType с контурами TrueType .
^‡ Шрифты OpenType иногда содержат не таблицу пар кернов один за другим, а таблицу пар кернов по классам, где группы похожих символов рассматриваются как одна группа кернов. Например, V и W имеют почти одинаковую левую и правую геометрию. Таким образом, «0» не означает, что кернинг не поддерживается.
^⸶ Регистрация по истечении «разумного» срока (слова автора).
^⸷ Включает более 27 000 символов ханьцзы из шрифта WenQuanYi Bitmap Song.
^⸸ Хан Ном A охватывает в основном идеографы CJK U Ext A, а Хан Ном B охватывает в основном Ext B.
Sun-Ext A охватывает 102 блока разных языков. Sun-ExtB охватывает в основном CJK Supplement, CJK U Ideographs Ext B, C, TaiXuan Jing.
^⸹ Zen Hei, Zen Hei Mono и Zen Hei Sharp сосуществуют в одном файле TTC; также со встроенными растровыми изображениями. Латынь/хангыль происходит от UnDotum, Bopomofo — от cwTeX, моноширинная латынь — от M+ M2 Light. Полное покрытие CJK. Входит в состав Fedora Linux, Ubuntu Linux.

Сравнение шрифтов

Ниже указано количество символов, включенных в вышеуказанную версию шрифтов для различных блоков Юникода . Базовая латиница (128: 0000–007F ) означает, что в диапазоне, называемом «Базовая латиница», имеется 128 назначенных кодов, пронумерованных от 0 до 7F . Затем в ячейках отображается количество тех кодов, которые покрыты каждым шрифтом. Перечисленные блоки Юникода действительны для версии Юникода 8.0 .

Ячейки, заштрихованные зеленым, обозначают полное покрытие.
Ячейки, заштрихованные синим цветом, не являются полными, но являются наиболее полными из перечисленных шрифтов.
Пустые ячейки означают, что в этом блоке нет символов.

0000–077F

0780–139F

13A0–1DBF

1DC0–257F

2580–2ДФФ

2E00–4DBF

4DC0–ФАФФ

FB00–FFFF

Список шрифтов SMP Unicode

10000–1F9FF

Перечисленные блоки Юникода действительны для версии Юникода 8.0 .

Список шрифтов SIP Unicode

20000–2FFFF

Перечисленные блоки Юникода действительны для версии Юникода 8.0 .

Список шрифтов SSP Unicode

E0000–EFFFF

Перечисленные блоки Юникода действительны для версии Юникода 8.0 .

Смотрите также

Рекомендации

  1. ^ «Шрифты и клавиатуры». Консорциум Юникод. 28 июня 2017 года. Архивировано из оригинала 18 октября 2019 года . Проверено 13 октября 2019 г.
  2. ^ Кен Лунде, CJKV Information Processing , O'Reilly Inc, 1999. Страница 128, «Различия в форме символов CJKV»
  3. ^ "Arial Unicode MS" . Майкрософт . Архивировано из оригинала 8 января 2010 г. Проверено 15 января 2010 г.
  4. ^ "Разъяснения о пабах STI" . Шрифты STIX. Архивировано из оригинала 13 апреля 2012 г. Проверено 21 августа 2012 г.
  5. ^ «Основные шрифты Microsoft TrueType для Интернета» . Архивировано из оригинала 1 июня 2015 г. Проверено 21 апреля 2010 г.
  6. ^ "Вэнь Цюань И - китайский с открытым исходным кодом: BitmapSong ru" . Wenq.org. 14 мая 2012 г. Проверено 21 августа 2012 г.
  7. ^ «Вэнь Цюань И - китайский с открытым исходным кодом: MicroHei (en)» . Wenq.org . Проверено 21 августа 2012 г.
  8. ^ «Вэнь Цюань И - китайский с открытым исходным кодом: ZenHei (en)» . Wenq.org . Проверено 21 августа 2012 г.
  9. ^ «Сначала STIX, а теперь XITS | خالد حسني» . Khaledhosny.org. Архивировано из оригинала 25 марта 2012 г. Проверено 21 августа 2012 г.

Внешние ссылки