Стандарт DIN DIN 91379 : «Символы и определенные последовательности символов в Юникоде для электронной обработки имен и обмена данными в Европе с CD-ROM» [ 1] определяет нормативное подмножество латинских символов Юникода , последовательности базовых символов и диакритических знаков . и специальные символы для использования в именах физических, юридических лиц, продуктах, адресах и т. д. Стандарт определяет нормативное сопоставление латинских букв с базовыми буквами AZ в соответствии с рекомендациями ИКАО . [2]
Подмножество поддерживает все официальные языки стран Европейского Союза , а также официальные языки Исландии , Лихтенштейна , Норвегии , Швейцарии , а также языки немецких меньшинств . Для возможности транслитерации имен в других системах письма на латиницу согласно соответствующим стандартам ISO предусмотрены все необходимые диакритические знаки .
Помимо нормативных символов, стандарт определяет подмножества расширенных символов, которые содержат современные греческие буквы для Греции и Кипра , кириллические буквы для Болгарии и специальные символы для названий продуктов и юридических лиц.
Соответствующие приложения могут поддерживать дополнительные символы, однако для соглашений об интерфейсах или регистров может оказаться целесообразным поддерживать только последнее подмножество символов и последовательностей, основанное на этом стандарте. [3]
Текст прежнего стандарта DIN SPEC 91379, [4] пояснения и списки символов и последовательностей в виде файлов Excel и XML можно найти в Koordinierungsstelle für IT-Standards (KoSIT). [5] Этот справочник также содержит файл схемы XML с шаблонами для проверки соответствия текста подмножествам, определенным в этом стандарте. Списки символов и последовательностей DIN SPEC 91379 и DIN 91379 в виде обычных текстовых файлов доступны на GitHub в разделе DIN 91379 «Символы и последовательности» . [6] DIN содержит несколько дополнительных символов и последовательностей. [6] [1]
Соблюдение этого стандарта станет обязательным для властей и организаций Германии при обмене данными между органами власти или с гражданами и бизнесом с 1 ноября 2024 года. [7]
Руководство по архитектуре федеральных ИТ-инфраструктуры Германии требует использования стандарта DIN SPEC 91379. [8]
Непрерывный текст и исторические буквы не входят в сферу действия этой нормы. [1]
Стандарт DIN состоит из нормативной [9] и информативной [9] частей.
Требования нормативной части являются обязательными для всех соответствующих систем. В нормативной части указаны буквы для обработки имен с основными латинскими буквами и диакритическими знаками. Все соответствующие системы должны поддерживать эти буквы. Кроме того, определено соответствие нормативных букв основным латинским буквам AZ.
Соответствующая система может поддерживать дополнительные буквы в дополнение к нормативным буквам.
Рекомендации в информативной части не являются обязательными для соответствующих систем. Информационная часть определяет подмножество расширенных букв UNICODE, например, для юридических лиц, названий продуктов и для обмена данными в ЕС. Кроме того, информационная часть определяет типы данных, которые можно использовать для проверки полей данных.
Для соответствия этой норме необходимо
Любая соответствующая ИТ-система должна иметь возможность обрабатывать нормативные буквы во всех полях имени. Сюда входит сбор, хранение, передача, отображение и распечатка.
Ниже приведены нормативные группы символов. Соответствующие символы также можно найти в DIN 91379 «Символы и последовательности для машинной обработки». [6] Следующие таблицы символов были созданы на основе XML-файла chars.xml в приложении DIN.
Эти буквы должны поддерживаться для обозначения имен.
Эти символы должны поддерживаться для обозначения личных имен.
Эти символы должны поддерживаться для обозначения географических названий, названий улиц, номеров домов, названий юридических лиц и названий продуктов.
Эти буквы должны поддерживаться для названий юридических лиц и названий продуктов.
Эти буквы непригодны для обозначения имен, но их необходимо обработать.
Существующие документы и записи реестра содержат устаревшие буквы, которые сегодня больше не используются. Эти письма должны поддерживаться соответствующими ИТ-системами. При создании новых записей не следует использовать устаревшие буквы.
Ниже приведено нормативное сопоставление всех нормативных букв с основными латинскими буквами A – Z. Такое сопоставление необходимо, например, для машиносчитываемой зоны паспортов. Еще одно применение — создание форм поиска, благодаря которым имена можно будет найти, даже если они написаны по-разному или без указания диакритических знаков.
Следующая таблица основана на таблице 9 стандарта DIN 91379 и главе 6, таблице A спецификаций ИКАО для машиносчитываемых проездных документов. [2] Таблица была создана на основе информации из XML-файла chars.xml в приложении DIN 91379.
Записи, которые появляются в спецификации ИКАО и в таблице 9 DIN, отмечены ICAO в столбце «Сопоставление» , дополнительные записи в таблице 9 DIN отмечены EXT . В столбце Тип указывается идентификатор для записей, описывающих сопоставление идентификаторов, и MAP для других сопоставлений.
Каждая соответствующая ИТ-система должна иметь возможность обрабатывать расширенные буквы для всех полей имени. Сюда входит сбор, хранение, передача, отображение и распечатка.
Для трансграничного обмена данными каждая ИТ-система должна поддерживать греческие буквы в полях имен.
Для трансграничного обмена данными каждая ИТ-система должна поддерживать кириллицу в полях имен для болгарских имен.
Эти буквы должны поддерживаться для названий юридических лиц и названий продуктов.
Для информации, типы технических данных определяются как подмножества букв, определенных в стандарте. Их можно использовать для соглашений о взаимодействии, для технических проверок или в качестве основы для создания собственных типов данных. Реализация в виде типа схемы XML включена в файл din-91379-datatypes.xsd, прикрепленный к стандарту. Эта реализация также доступна бесплатно как часть библиотеки XOEV. [10]
По сравнению с DIN SPEC 91379 добавлено несколько новых букв, только две из них не устарели.
Текущие результаты процесса стандартизации включают спецификацию DIN SPEC 91379 в марте 2019 года и окончательную версию стандарта DIN в августе 2022 года. Предпринимаются усилия по дальнейшему развитию его в европейский стандарт CEN . [5]