stringtranslate.com

DIN 91379

Стандарт DIN DIN 91379 : «Символы и определенные последовательности символов в Юникоде для электронной обработки имен и обмена данными в Европе с CD-ROM» [ 1] определяет нормативное подмножество латинских символов Юникода , последовательности базовых символов и диакритических знаков . и специальные символы для использования в именах физических, юридических лиц, продуктах, адресах и т. д. Стандарт определяет нормативное сопоставление латинских букв с базовыми буквами AZ в соответствии с рекомендациями ИКАО . [2]

Поддерживаемые языки и сценарии

Подмножество поддерживает все официальные языки стран Европейского Союза , а также официальные языки Исландии , Лихтенштейна , Норвегии , Швейцарии , а также языки немецких меньшинств . Для возможности транслитерации имен в других системах письма на латиницу согласно соответствующим стандартам ISO предусмотрены все необходимые диакритические знаки .

Помимо нормативных символов, стандарт определяет подмножества расширенных символов, которые содержат современные греческие буквы для Греции и Кипра , кириллические буквы для Болгарии и специальные символы для названий продуктов и юридических лиц.

Соответствующие приложения могут поддерживать дополнительные символы, однако для соглашений об интерфейсах или регистров может оказаться целесообразным поддерживать только последнее подмножество символов и последовательностей, основанное на этом стандарте. [3]

Текст прежнего стандарта DIN SPEC 91379, [4] пояснения и списки символов и последовательностей в виде файлов Excel и XML можно найти в Koordinierungsstelle für IT-Standards (KoSIT). [5] Этот справочник также содержит файл схемы XML с шаблонами для проверки соответствия текста подмножествам, определенным в этом стандарте. Списки символов и последовательностей DIN SPEC 91379 и DIN 91379 в виде обычных текстовых файлов доступны на GitHub в разделе DIN 91379 «Символы и последовательности» . [6] DIN содержит несколько дополнительных символов и последовательностей. [6] [1]

Применение стандарта

Соблюдение этого стандарта станет обязательным для властей и организаций Германии при обмене данными между органами власти или с гражданами и бизнесом с 1 ноября 2024 года. [7]

Руководство по архитектуре федеральных ИТ-инфраструктуры Германии требует использования стандарта DIN SPEC 91379. [8]

Непрерывный текст и исторические буквы не входят в сферу действия этой нормы. [1]

Структура стандарта

Стандарт DIN состоит из нормативной [9] и информативной [9] частей.

Требования нормативной части являются обязательными для всех соответствующих систем. В нормативной части указаны буквы для обработки имен с основными латинскими буквами и диакритическими знаками. Все соответствующие системы должны поддерживать эти буквы. Кроме того, определено соответствие нормативных букв основным латинским буквам AZ.

Соответствующая система может поддерживать дополнительные буквы в дополнение к нормативным буквам.

Рекомендации в информативной части не являются обязательными для соответствующих систем. Информационная часть определяет подмножество расширенных букв UNICODE, например, для юридических лиц, названий продуктов и для обмена данными в ЕС. Кроме того, информационная часть определяет типы данных, которые можно использовать для проверки полей данных.

Нормативная часть

Согласие

Для соответствия этой норме необходимо

Нормативные письма

Любая соответствующая ИТ-система должна иметь возможность обрабатывать нормативные буквы во всех полях имени. Сюда входит сбор, хранение, передача, отображение и распечатка.

Ниже приведены нормативные группы символов. Соответствующие символы также можно найти в DIN 91379 «Символы и последовательности для машинной обработки». [6] Следующие таблицы символов были созданы на основе XML-файла chars.xml в приложении DIN.

Латинские буквы (bll)

Эти буквы должны поддерживаться для обозначения имен.

Небуквы N1 (bnlreq)

Эти символы должны поддерживаться для обозначения личных имен.

Небуквы N2 (млр.)

Эти символы должны поддерживаться для обозначения географических названий, названий улиц, номеров домов, названий юридических лиц и названий продуктов.

Небуквы N3 (bnlopt)

Эти буквы должны поддерживаться для названий юридических лиц и названий продуктов.

Небуквы N4 (бнлнот)

Эти буквы непригодны для обозначения имен, но их необходимо обработать.

Устаревшие буквы

Существующие документы и записи реестра содержат устаревшие буквы, которые сегодня больше не используются. Эти письма должны поддерживаться соответствующими ИТ-системами. При создании новых записей не следует использовать устаревшие буквы.

Нормативное сопоставление латинских букв с базовыми буквами (форма поиска)

Ниже приведено нормативное сопоставление всех нормативных букв с основными латинскими буквами A – Z. Такое сопоставление необходимо, например, для машиносчитываемой зоны паспортов. Еще одно применение — создание форм поиска, благодаря которым имена можно будет найти, даже если они написаны по-разному или без указания диакритических знаков.

Следующая таблица основана на таблице 9 стандарта DIN 91379 и главе 6, таблице A спецификаций ИКАО для машиносчитываемых проездных документов. [2] Таблица была создана на основе информации из XML-файла chars.xml в приложении DIN 91379.

Записи, которые появляются в спецификации ИКАО и в таблице 9 DIN, отмечены ICAO в столбце «Сопоставление» , дополнительные записи в таблице 9 DIN отмечены EXT . В столбце Тип указывается идентификатор для записей, описывающих сопоставление идентификаторов, и MAP для других сопоставлений.

Информационная часть

Расширенные буквы

Каждая соответствующая ИТ-система должна иметь возможность обрабатывать расширенные буквы для всех полей имени. Сюда входит сбор, хранение, передача, отображение и распечатка.

Греческие буквы (гл)

Для трансграничного обмена данными каждая ИТ-система должна поддерживать греческие буквы в полях имен.

Кириллические буквы (кл)

Для трансграничного обмена данными каждая ИТ-система должна поддерживать кириллицу в полях имен для болгарских имен.

Небуквы E1 (enl)

Эти буквы должны поддерживаться для названий юридических лиц и названий продуктов.

Типы технических данных (информативно)

Для информации, типы технических данных определяются как подмножества букв, определенных в стандарте. Их можно использовать для соглашений о взаимодействии, для технических проверок или в качестве основы для создания собственных типов данных. Реализация в виде типа схемы XML включена в файл din-91379-datatypes.xsd, прикрепленный к стандарту. Эта реализация также доступна бесплатно как часть библиотеки XOEV. [10]

Новые письма

По сравнению с DIN SPEC 91379 добавлено несколько новых букв, только две из них не устарели.

Текущее состояние

Текущие результаты процесса стандартизации включают спецификацию DIN SPEC 91379 в марте 2019 года и окончательную версию стандарта DIN в августе 2022 года. Предпринимаются усилия по дальнейшему развитию его в европейский стандарт CEN . [5]

Программное обеспечение с открытым исходным кодом, поддерживающее DIN 91379.

Рекомендации

  1. ^ abcd «DIN 91379:2022-08: Символы и определенные последовательности символов в Юникоде для электронной обработки имен и обмена данными в Европе, с CD-ROM» (на немецком языке). Бет Верлаг. Август 2022.
  2. ^ ab «Doc 9303, Машиносчитываемые проездные документы, Часть 3. Технические характеристики, общие для всех МСПД» (PDF) . ИКАО . Проверено 6 мая 2022 г.
  3. ^ «Символы ПРОЕКТА и определенные последовательности символов в Юникоде для электронной обработки имен и обмена данными в Европе, с компакт-диском» . ДИН . Проверено 19 марта 2022 г.
  4. ^ «DIN SPEC 91379:2019-03: Символы Юникода для электронной обработки имен и обмена данными в Европе; с цифровым присоединением» (на немецком языке). Бет Верлаг. Март 2019 года . Проверено 19 марта 2022 г.
  5. ^ ab Koordinierungsstelle für IT-Standards (KoSIT). «String.Latin+ 1.2: eine kommentierte und erweiterte Fassung der DIN SPEC 91379. Inklusive einer umfangreichen Liste häufig gestellter Fragen. Herausgegeben von der Fachgruppe String.Latin. (zip, 1,7 МБ)» [String.Latin+ 1.2: Комментированная и расширенная версия DIN SPEC 91379.] (на немецком языке) . Проверено 19 марта 2022 г.
  6. ^ abc «Символы и последовательности DIN 91379». 19 августа 2022 г. Получено 19 августа 2022 г. - через GitHub.
  7. ^ IT-Planungsrat (10 ноября 2022 г.). «Beschluss 2022/51 – String.Latin» [Решение 2022/51 – String.Latin] (на немецком языке) . Проверено 22 декабря 2022 г.
  8. ^ Der Beauftragte der Bundesregierung für Informationstechnik. «Architekturrichtlinie für die IT des Bundes – Technische Spezifikationen zur Architekturrichtlinie –» [Руководство по архитектуре для федеральных ИТ – Технические спецификации для руководства по архитектуре –] (PDF) (на немецком языке) . Проверено 8 октября 2022 г.
  9. ^ ab «Внутренние правила, Часть 3: Принципы и правила структуры и составления документов CEN и CENELEC» (PDF) . CEN - CENELEC . 2022 . Проверено 13 мая 2023 г.
  10. ^ "din-norm-91379-datatypes.xsd" . ХОЕВ-Библиотека . Координация IT-стандартов (KoSIT). 14 октября 2022 г. Проверено 30 апреля 2023 г.
  11. ^ «OpenPDF — это Java-библиотека с открытым исходным кодом для файлов PDF» . 19 марта 2022 г. – через GitHub.
  12. ^ «Акценты, DIN 91379, нелатинское письмо» . 10 мая 2022 г. – через GitHub.
  13. ^ "Проект Apache FOP" . 9 февраля 2023 г.
  14. ^ "Зеркало Apache FOP" . 9 февраля 2023 г. – через GitHub.
  15. ^ "Ното Аримо". Гитхаб .
  16. ^ "Аримо". Гугл шрифты .
  17. ^ "Ното латынь, греческий, кириллица" . 9 февраля 2023 г. — через GitHub.
  18. ^ «Объединение запятой сверху справа в неправильном положении · Проблема № 33 · нотофонты/латинско-греческий-кириллица» . Гитхаб .
  19. ^ "Шрифт для кодирования Sudo" . 30 августа 2023 г.

Внешние ссылки