stringtranslate.com

арабский алфавит

Страны, использующие арабскую графику:
  как единственный официальный сценарий
  как официальный сценарий

Арабский алфавит ْحُرُوف الْعَرَبِيَّة , аль - Хуруф аль-Арабия ) , или арабский абджад , представляет собой арабское письмо , в частности систематизировано письменность арабского языка. Он написан справа налево курсивом и включает 28 букв, большинство из которых имеют контекстную буквенную форму. Арабский алфавит считается абджадом , в котором необходимо писать только согласные ; из-за необязательного использования диакритических знаков для обозначения гласных он считается нечистым абджадом . [2]

Согласные

Основной арабский алфавит содержит 28 букв . Формы, использующие арабскую вязь для написания других языков, добавляли и удаляли буквы: например , персидский , османский турецкий , курдский , урду , синдхи , азербайджанский , малайский , ачехский , банджарский , яванский , пушту , пенджабский , уйгурский , арви и арабский малаялам все имеют дополнительные буквы в своем алфавите. В отличие от алфавитов греческого происхождения, в арабском нет четко выраженных букв верхнего и нижнего регистра .

Многие буквы выглядят одинаково, но отличаются друг от друга точками ( iʿjām ) над или под их центральной частью ( rasm ). Эти точки являются неотъемлемой частью буквы, поскольку они различают буквы, обозначающие разные звуки. Например, арабские буквы ب b , ت t и ث th имеют одинаковую базовую форму, но с добавлением одной точки внизу, двух точек сверху и трех точек сверху соответственно. Буква ن n также имеет одинаковую форму в начальной и средней формах, с добавленной выше одной точкой, хотя в изолированной и конечной формах она несколько отличается.

Как печатный, так и письменный арабский язык написаны курсивом , причем большинство букв в слове непосредственно соединены с соседними буквами.

Алфавитный порядок

В арабском алфавите есть две основные последовательности сопоставления («алфавитный порядок»): абджади и хиджаи .

Первоначальный порядок абджади происходит от порядка, используемого в финикийском алфавите , и поэтому напоминает порядок других алфавитов, например, еврейского и греческого . При таком порядке буквы также используются как числа, известные как цифры абджад , обладающие теми же нумерологическими кодами, что и в еврейской гематрии и греческой изопсефии .

Порядок хиджаи или алифбаи используется при сортировке списков слов и имен, например, в телефонных книгах, классных списках и словарях. В порядке расположения буквы группируются по графическому сходству форм глифов.

Абджади

Порядок абджади не является простым соответствием более раннему северосемитскому алфавитному порядку, поскольку он занимает позицию, соответствующую арамейской букве самек ס , которая исторически не имела родственной буквы в арабском алфавите.

Утрата самеха была компенсирована за счет:

Остальные шесть букв, не соответствующие ни одной северосемитской букве, помещены в конце.

Обычно это озвучивается следующим образом:

абджад хавваз хутти каламан сафаш карашат тахадх дазаг .

Другая вокализация:

Абуджадин Хавазин Хутия Калман Сафаш Куришат Тахудх Дасуг [ нужна ссылка ]

Это можно озвучить так:

Абуджадин Хавазин Хутия Калман Сафад Курисат Тахудх Загуш

хиджаи

Сопоставление хиджа по сравнению с ивритом, сирийским и греческим языками

Современные словари и другие справочники не используют порядок абджади для сортировки по алфавиту; вместо этого используется новый порядок хиджаи , в котором буквы частично сгруппированы вместе по сходству формы. Порядок хиджа никогда не используется в качестве цифр.

В порядке хиджаи (недавно [ когда? ] на порядок Машрики , [4] [ ненадежный источник? ] (хотя он до сих пор используется во многих коранических школах в Алжире) [ нужна ссылка ] последовательность такова: [3]

В энциклопедии Абу Мухаммада аль-Хасана аль-Хамдани الإكليل من أخبار اليمن وأنساب حمير Китаб аль-Иклиль мин ахбар аль-Яман ва-ансаб Химьяр последовательность букв следующая: [5]

Формы писем

Арабский алфавит всегда написан курсивом, а форма букв различается в зависимости от их положения в слове. Буквы могут иметь до четырех различных форм, соответствующих начальному, медиальному (среднему), конечному или изолированному положению ( IMFI ). Хотя некоторые буквы демонстрируют значительные различия, другие остаются почти идентичными во всех четырех позициях. Обычно буквы в одном слове соединяются друг с другом с обеих сторон короткими горизонтальными линиями, но шесть букв ( و,ز,ر,ذ,د,ا ) могут быть связаны только с предыдущей буквой. Например, أرارات ( Арарат ) имеет только изолированные формы, поскольку каждая буква не может быть соединена со следующей за ней. Кроме того, некоторые комбинации букв записываются как лигатуры (особые формы), в частности lām-alif لا , [6] которая является единственной обязательной лигатурой (несвязанная комбинация ل‍‌‍ا считается трудной для чтения).

Таблица основных букв

Примечания

  1. ^ Названия арабских букв, приведенные ниже, являются стандартными и наиболее широко используемыми именами, вместо них могут использоваться другие имена (например, названия букв в Египте).
  2. ^ abc Alif может обозначать множество фонем. См. раздел «Алиф».
  3. ^ abcdefgh См. раздел о неродных буквах и звуках; буквы ⟨ ك ⟩, ⟨ ق ⟩, ⟨ غ ⟩, ⟨ ج ⟩ иногда используются для транскрипции фонемы / ɡ / в заимствованных словах и диалектных словах. См. раздел о региональных вариантах: ⟨ ب ⟩ для транскрипции / p / и ⟨ ف ⟩ для транскрипции / v / . Аналогичным образом буквы ⟨ و ⟩ и ⟨ ي ⟩ используются для транскрипции гласных / oː / и / eː / соответственно в заимствованных словах и диалектах.
  4. ^ ج произносится по-разному в зависимости от региона. См. арабскую фонологию#Согласные .
  5. ^ ز также можно называть («зайн» / زين ).
  6. ^ abcd См. раздел о региональных вариантах формы букв.
  7. ^ (считается буквой алфавита и играет важную роль в арабском правописании), обозначает большинство неправильных существительных женского пола .
  8. ^ (не считается буквой в алфавите, но играет важную роль в арабской грамматике и лексике, включая указание [обозначает большинство существительных женского пола] и правописание). Альтернативная форма ت ( « связанный tāʼ» / تاء مربوطة ) используется в конец слов для обозначения женского рода существительных и прилагательных. Он обозначает конечный звук /-h/ или /-t/. Стандартный та', чтобы отличить его от та' марбута, называется та' мафтуха (تاء مفتوحة, «открытый та'»).
  9. ^ (не считается буквой в алфавите, но играет важную роль в арабской грамматике и лексике, включая указание [обозначает глаголы] и правописание). Он используется в конце слов со звуком /aː/ в современном стандартном арабском языке, которые не относятся к категории использования tāʼ marbūṭah (ة) [в основном некоторые времена глаголов и арабские имена мужского рода].
В академической работе хамза ( ء ) транслитерируется с помощью буквы-модификатора «правое полукольцо» (ʾ), тогда как буква-модификатор «левое полукольцо» (ʿ) транслитерирует букву «айн» ( ع ), которая представляет собой другой звук, не встречающийся в Английский.
Хамза имеет единственную форму, поскольку она никогда не связана с предыдущей или последующей буквой . Однако иногда его комбинируют с вау , йа' или алифом , и в этом случае носитель ведет себя как обычный вау , йа' или алиф .

Вариации

Алиф

Модифицированные буквы

Ниже приведены не отдельные буквы, а различные контекстуальные варианты некоторых арабских букв.

Лигатуры

Компоненты лигатуры слова «Аллах»:
1. алиф
2. хамзат вауль ( ْهَمْزَة وَصْل ‎) 3. лам 4. лам 5. шадда ( شَدَّة ‎) 6. кинжал алиф ( أَلِفْ خَنْجَریَّة ‎) 7. ха'




Использование лигатуры в арабском языке является обычным явлением. Есть одна обязательная лигатура — lām ل + alif ا, которая существует в двух формах. Все остальные лигатуры, которых много, [7] не обязательны.

Для обозначения слова «Аллах» обычно используется более сложная лигатура, объединяющая до семи различных компонентов .

Единственная лигатура в основном диапазоне арабского письма в Юникоде (U+06xx) — это lām + alif . Это единственный обязательный параметр для шрифтов и текстовых редакторов. Другие диапазоны предназначены для совместимости со старыми стандартами и содержат другие лигатуры, которые не являются обязательными.

Примечание. Юникод также имеет в своей форме представления B диапазон FExx код этой лигатуры. Если ваш браузер и шрифт правильно настроены для арабского языка, показанная выше лигатура должна быть идентична этой: U+FEFBАРАБСКАЯ ЛИГАТУРА LAM С ИЗОЛИРОВАННОЙ ФОРМОЙ АЛЕФ:

Примечание. Unicode также имеет в своей форме представления B диапазон U+FExx код этой лигатуры. Если ваш браузер и шрифт правильно настроены для арабского языка, показанная выше лигатура должна быть идентична этой:

Другая лигатура в форме представления Unicode. Диапазон от U+FB50 до U+FDxx — это специальный код глифа для лигатуры Аллах («Бог»), U+FDF2АРАБСКАЯ ЛИГАТУРА ИЗОЛИРОВАННАЯ ФОРМА АЛЛАХА:

Это обход недостатков большинства текстовых процессоров, которые неспособны отображать правильные знаки гласных для слова «Аллах» в Коране . Поскольку арабское письмо используется для написания других текстов, а не только Корана, передача лам + лам + ха' в качестве предыдущей лигатуры считается ошибочной.

Этот упрощенный стиль часто предпочтительнее для ясности, особенно в неарабских языках, но его нельзя считать подходящим в ситуациях, когда предпочтителен более сложный стиль каллиграфии. – СИЛ Интернешнл [9]

Если на компьютере установлен один из нескольких шрифтов (Noto Naskh Arab, mry_KacstQurn, KacstOne, Nadeem, DejaVu Sans, Harmattan, Scheherazade, Lateef, Иранский Sans, Baghdad, DecoType Naskh) (иранский Sans поддерживается веб-сайтом Wikimedia). шрифты), слово будет отображаться без диакритических знаков.

Попытка отобразить их на дефектных шрифтах без автоматического добавления знака геминации и верхнего индекса alif, хотя и не может отображаться должным образом во всех браузерах, заключается в добавлении U+200d(соединитель нулевой ширины) после первого или второго символа .

Близнецы

Близнецование – это удвоение согласного. Вместо того, чтобы писать букву дважды, арабский язык помещает над ней W -образный знак, называемый шадда . Обратите внимание: если между двумя согласными стоит гласная, буква просто будет написана дважды. Диакритический знак появляется только в том случае, если согласная в конце одного слога идентична начальной согласной следующего слога. (Общий термин для таких диакритических знаков — Харакат ).

нунация

Нунация ( араб . تنوين tanwīn ) — это добавление конечной буквы -n   к существительному или прилагательному . Гласная перед ней указывает грамматический падеж . В письменном арабском языке нунация обозначается удвоением диакритического знака гласной в конце слова.

Гласные

Пользователи арабского языка обычно пишут длинные гласные , но опускают короткие, поэтому читатели должны использовать свои знания языка, чтобы добавить недостающие гласные. Однако в системе образования, и особенно на уроках арабской грамматики, эти гласные используются, поскольку они имеют решающее значение для грамматики. Арабское предложение может иметь совершенно другое значение за счет незначительного изменения гласных. Вот почему в таком важном тексте, как Коран , три основных гласных знака (см. ниже) обязательны, как и харакат и все другие диакритические знаки или другие типы знаков, например знаки кантилляции .

Краткие гласные

В повседневном арабском почерке, в публикациях и на уличных вывесках короткие гласные обычно не пишутся. С другой стороны, копии Корана не могут быть одобрены религиозными институтами, которые их рассматривают, если в них не включены диакритические знаки. Детские книги, учебники для начальной школы и грамматики арабского языка в целом в той или иной степени будут включать диакритические знаки. Такие тексты называются « вокализованными ».

Краткие гласные могут быть написаны с диакритическими знаками , расположенными выше или ниже согласной, которая предшествует им в слоге, называемом харакат . Все арабские гласные, длинные и краткие, следуют за согласной; в арабском языке такие слова, как «Али» или «алиф», например, начинаются с согласной: «Алий , алиф» .

Долгие гласные

В полностью озвученном арабском тексте, встречающемся в таких текстах, как Коран , длинный ā , следующий за согласной, отличной от хамзы , пишется с коротким знаком ( фатха ) на согласной плюс алиф после нее; длинный ī пишется как знак краткого i ( kasrah ) плюс yāʾ ; и длинный ū как знак краткого u ( хамма ) плюс вав . Короче говоря, ᵃa = ā ; ⁱy = ī ; и ᵘw = ū . Длинное ā, следующее за хамзой, может быть представлено алифом мадда или свободным хамзой , за которым следует алиф (два последовательных алифа в арабском языке никогда не допускаются).

В таблице ниже показаны гласные, расположенные над или под пунктирным кружком, заменяющие основную согласную букву или знак шадды . Для ясности в таблице основные буквы слева, обозначающие эти долгие гласные, показаны только в изолированном виде. Большинство согласных действительно соединяются слева с «алиф» , «вав» и «йа» , написанными затем в их средней или конечной форме. Кроме того, буква й в последнем ряду может соединяться с буквой слева от нее и тогда будет использовать среднюю или начальную форму. Используйте таблицу основных букв, чтобы просмотреть их фактические глифы и типы соединения.

В неогласованном тексте (в котором краткие гласные не отмечены) долгие гласные представлены рассматриваемой гласной: « алиф тавилах/максура» , «вав » или «йа» . Долгие гласные, написанные в середине слова неогласованного текста, рассматриваются как согласные с сукуном (см. Ниже) в тексте с полными диакритическими знаками. Здесь также для наглядности в таблице долгие гласные буквы показаны только в изолированном виде.

Сочетания وا и يا всегда произносятся как ва и йах соответственно. Исключением является суффикс ـوا۟ в окончаниях глаголов, где ʾalif молчит, в результате чего получается ū или aw .

Кроме того, при транслитерации имен и заимствованных слов носители арабского языка записывают большую часть или все гласные одинаковой длины ( ā с ا ʾalif , ē и ī с ي yaʾ , а также ō и ū с و wāw ), что означает, что это приближается к настоящему алфавиту.

Дифтонги

Дифтонги /aj/ и /aw/ представлены в вокализованном тексте следующим образом :

Пропуск гласных

Арабский слог может быть открытым (оканчивающимся на гласную) или закрытым (оканчивающимся на согласную):

Обычный текст состоит только из ряда согласных и букв, удлиняющих гласные; таким образом, слово qalb , «сердце», пишется qlb , а слово qalaba «он обернулся», также пишется qlb .

Чтобы написать калабу без этой двусмысленности, мы могли бы указать, что за буквой «л» следует короткое « а» , написав над ней фетху .

Чтобы написать qalb , мы бы вместо этого указали, что за l не следует гласная, пометив ее диакритическим знаком сукун (  ْ ‎), например: قلْب .

Это на один шаг ниже полной вокализации, где гласная после q также обозначается фатхой : قَلْب .

Коран традиционно записывается полной вокализацией .

В некоторых изданиях Корана долгий звук « и » пишется с помощью буквы «касра», за которой следует буква « у» без диакритического знака , а долгий звук «у» — через букву «хамма» , за которой следует пустая буква « . В других случаях эти y и w носят сукун . За пределами Корана последнее соглашение встречается крайне редко, вплоть до того, что y с сукуном будет однозначно читаться как дифтонг /aj/ , а w с сукуном будет читаться /aw/ .

Например, буквы myl можно читать как английские meel или mail , или (теоретически) также как mayyal или mayil . Но если к букве y добавляется сукун , тогда у м не может быть сукуна (поскольку две буквы подряд не могут быть сукуны ), не может быть хаммы ( потому что в арабском языке никогда не бывает звука у , если после него не стоит другая гласная). y ) и не может иметь касру (поскольку касра до сукунатеда y никогда не встречается за пределами Корана ), поэтому у нее должна быть фетха , и единственное возможное произношение — /majl/ (что означает милю или даже электронную почту) . Точно так же, myt с сукуном над y может быть mayt , но не mayyit или meet , а mwt с сукуном над w может быть только mawt , а не moot ( это невозможно, когда w закрывает слог).

Знаки гласных всегда пишутся так, как будто гласные ираба действительно произносятся, даже если при фактическом произношении их приходится пропускать. Таким образом, при написании имени Ахмад необязательно ставить сукун на букву ḥ , но сукун на букве d запрещен , потому что он будет нести в себе Хамму , если за ним последует какое-либо другое слово, как в Ахмаду зауджи «Ахмад - мой муж». .

Другой пример: предложение, которое на правильном литературном арабском языке должно произноситься как Aḥmadu zawjun shirrīr «Ахмад — злой муж», обычно неправильно произносится (из-за влияния народных арабских разновидностей) как Aḥmad zawj shirrīr . Тем не менее, с точки зрения арабской грамматики и орфографии, оно рассматривается так, как если бы оно не было произнесено неправильно и как если бы за ним следовало еще одно слово, т. е. при добавлении каких-либо знаков гласных они должны быть добавлены так, как если бы произношение было Ахмаду завджун шаррирун с tanwīn 'un' в конце. Итак, правильно добавить знак un tanwīn к последней букве r , но на самом деле его произнесение было бы гиперкоррекцией. Кроме того, никогда не будет правильно писать сукун на этом r , даже если в фактическом произношении это (и в правильном арабском языке ДОЛЖНО быть) сукун эд.

Конечно, если правильный ирабсукун , его можно написать опционально.

ٰٰ Сукун также используется для транслитерации слов в арабский алфавит. Например , персидское слово ماسک ( mâsk , от английского слова «маска») может быть написано с сукуном над, чтобы указать, что между этой буквой и ک нет гласного звука .

Дополнительные буквы

Региональные вариации

Некоторые буквы в определенных регионах принимают традиционно другую форму:

Фонема /g/ считается родной в большинстве арабских диалектов. Ниже приведены различные представления фонемы в родных и заимствованных словах:

Неродные буквы стандартного арабского языка

Некоторые модифицированные буквы используются для обозначения неродных звуков современного стандартного арабского языка. Эти буквы используются в транслитерированных именах, заимствованных словах и диалектных словах.

  1. / t͡ʃ / считается родной фонемой/аллофоном в некоторых диалектах, например, в кувейтском и иракском диалектах.
  2. / ʒ / считается родной фонемой (вместо / d͡ʒ / ) в ряде левантийских и североафриканских диалектов, а также в качестве аллофона в других.
  3. / ɡ / считается родной фонемой/аллофоном в большинстве современных арабских диалектов.

Используется на языках, отличных от арабского

Цифры

Вместе с арабским текстом используются два основных типа цифр; Западные арабские цифры и восточно-арабские цифры . На большей части территории современной Северной Африки используются обычные западно-арабские цифры. Как и в западных арабских цифрах, в восточно-арабских цифрах единицы всегда располагаются крайними справа, а наивысшее значение — крайними слева. Восточно-арабские цифры пишутся слева направо.

Буквы как цифры

Кроме того, арабский алфавит можно использовать для обозначения чисел ( цифры Абджада ). Такое использование основано на порядке алфавита абджади . أ ʾalif равен 1, ب bāʾ равен 2, ج jīm равен 3, и так далее, пока ي yāʾ = 10, ك kāf = 20, ل lām = 30, ..., ر rā' = 200, ..., غ ghayn = 1000. Иногда используется для создания хронограмм .

История

Эволюция ранней арабской каллиграфии (9–11 века). В качестве примера взята басмала из рукописей куфического Корана . (1) В письме начала IX века не использовались точки и диакритические знаки; [12] (2) и (3) в 9–10 веках, во времена династии Аббасидов, в системе Абу аль-Асвада использовались красные точки, каждое расположение или позиция обозначали разные короткие гласные. Позже для различения таких букв, как фа и каф , использовалась вторая система черных точек ; [13] (4) в 11 веке ( система аль-Фарахиди ) точки были преобразованы в формы, напоминающие буквы, для транскрипции соответствующих долгих гласных. Эта система используется сегодня. [14]

Арабский алфавит можно проследить до набатейского письма , используемого для написания набатейского арамейского языка . Первый известный текст на арабском алфавите — это надпись конца четвертого века из Джебель-Рама в 50 км к востоку от Акабы в Иордании , но первая датированная — это трехъязычная надпись в Зеведе в Сирии , датированная 512 годом . Эпиграфические записи чрезвычайно скудны: сохранилось только пять наверняка доисламских арабских надписей , хотя некоторые другие могут быть доисламскими. Позже над и под буквами были добавлены точки, чтобы различать их. (В арамейском языке было меньше фонем, чем в арабском, и некоторые первоначально отдельные арамейские буквы стали неразличимы по форме, так что в ранних письменах 15 различных форм букв должны были отвечать за 29 звуков; ср. столь же двусмысленную « Книгу Пехлеви» . )

Первым сохранившимся документом, в котором определенно используются эти точки, является также первый сохранившийся арабский папирус ( PERF 558 ), датированный апрелем 643 года, хотя они стали обязательными гораздо позже. Важные тексты часто запоминались и до сих пор запоминаются, особенно при запоминании Корана .

Еще позже были введены знаки гласных и хамза, начиная где-то во второй половине VII века, до первого изобретения сирийских и тиверийских вокализаций . Первоначально это делалось с помощью системы красных точек, которая, как говорят, была введена в эксплуатацию в эпоху Омейядов Абу аль-Асвадом ад-Дуали : точка вверху = a , точка внизу = i , точка на линии = u , а двойные точки обозначают нунацию . Однако это было громоздко и легко перепуталось с точками, различающими буквы, поэтому примерно 100 лет спустя была принята современная система. Система была завершена около 786 года аль-Халилем ибн Ахмадом аль-Фарахиди .

арабская печать

Средневековая арабская гравюра процветала с 10 по 14 век. Он был посвящен лишь очень мелким текстам, обычно предназначенным для использования в амулетах .

В 1514 году, после изобретения Иоганном Гутенбергом печатного станка в 1450 году, венецианец Грегорио де Грегори опубликовал целый молитвенник, написанный арабской вязью; он назывался «Китаб Салат ас-Саваи» и предназначался для восточно-христианских общин. [15]

Между 1580 и 1586 годами шрифтовой дизайнер Роберт Гранжон разработал арабские шрифты для кардинала Фердинандо Медичи , а в конце 16 века издательство Medici Oriental Press опубликовало множество христианских молитв и научных арабских текстов. [16]

Монахи-марониты из монастыря Маар Кужай на горе Ливан опубликовали первые на Ближнем Востоке арабские книги, в которых использовался подвижный шрифт. Монахи транслитерировали арабский язык сирийским письмом.

Хотя Наполеону обычно приписывают введение печатного станка в Египет во время его вторжения в эту страну в 1798 году, и хотя он действительно привез печатные станки и арабские станки для печати официальной газеты французской оккупации « Аль-Танбия «Курьер», печатавшейся в Арабский язык зародился на несколько столетий раньше.

Ювелир (например, Гутенберг) спроектировал и внедрил печатный станок с подвижным шрифтом на арабской вязи на Ближнем Востоке. Ливанский монах-мелькит Абдалла Захер установил арабский печатный станок с подвижным шрифтом в монастыре Святого Иоанна в городе Дхур-эль-Шувайр в Горном Ливане, первый самодельный печатный станок в Ливане, использующий арабскую вязь. Он лично вырезал формы для шрифтов и разработал шрифт. Первая книга вышла в его типографии в 1734 году; этот пресс продолжал использоваться до 1899 года. [17]

Компьютеры

Арабский алфавит может быть закодирован с использованием нескольких наборов символов , включая ISO-8859-6 , Windows-1256 и Unicode (см. ссылки в информационном окне выше), последнее благодаря «арабскому сегменту», записям от U+0600 до U+06FF. Однако ни один из наборов не указывает форму, которую должен принимать каждый символ в контексте. Механизм рендеринга должен выбрать правильный глиф для отображения для каждого символа.

Каждая буква имеет независимую от позиции кодировку в Юникоде , и программное обеспечение рендеринга может определить правильную форму глифа (начальную, среднюю, конечную или изолированную) на основе контекста ее соединения. Это текущая рекомендация. Однако для совместимости с предыдущими стандартами начальную, среднюю, конечную и изолированную формы также можно кодировать отдельно.

Юникод

Начиная с Unicode 15.1, арабский алфавит содержится в следующих блоках : [18]

Базовый арабский диапазон кодирует стандартные буквы и диакритические знаки, но не кодирует контекстуальные формы (U+0621-U+0652 напрямую основаны на ISO 8859-6 ). Он также включает наиболее распространенные диакритические знаки и арабско-индийские цифры . От U+06D6 до U+06ED кодируются знаки коранических аннотаций, такие как «конец аята » ۝ۖ и «начало руб эль-хизб » ۞. Диапазон арабских дополнений кодирует варианты букв, которые в основном используются для написания африканских (неарабских) языков. Диапазон арабского расширенного-A кодирует дополнительные аннотации Корана и варианты букв, используемые для различных неарабских языков.

Диапазон арабских форм представления-A кодирует контекстуальные формы и лигатуры вариантов букв, необходимые для персидского, урду, синдхи и среднеазиатских языков. Диапазон арабских презентационных форм-B кодирует пробельные формы арабских диакритических знаков и более контекстуальные формы букв. Блок арабских математических алфавитных символов кодирует символы, используемые в арабских математических выражениях.

См. также примечания к разделу об измененных буквах.

Клавиатуры

Арабская раскладка клавиатуры Mac
Арабская раскладка клавиатуры ПК
Intellark навязал раскладку клавиатуры QWERTY

Клавиатуры, разработанные для разных стран, имеют разные раскладки, поэтому владение одним стилем клавиатуры, например, в Ираке, не переходит в владение другим, например, в Саудовской Аравии. Различия могут включать расположение неалфавитных символов.

Все арабские клавиатуры позволяют вводить латинские символы, например, URL-адрес в веб-браузере . Таким образом, на каждой арабской клавиатуре имеются как арабские, так и латинские символы. Обычно латинские символы арабской клавиатуры соответствуют раскладке QWERTY , но в Северной Африке , где французский язык является наиболее распространенным языком с использованием латинских символов, арабские клавиатуры — это AZERTY .

Для кодирования определенной письменной формы символа в Юникоде предусмотрены дополнительные кодовые точки, которые можно использовать для выражения точной желаемой письменной формы. Формы представления диапазона A на арабском языке (от U+FB50 до U+FDFF) содержат лигатуры, а формы представления диапазона B на арабском языке (от U+FE70 до U+FEFF) содержат позиционные варианты. Эти эффекты лучше достигаются в Юникоде с помощью соединительных элементов нулевой ширины и необъединяющих элементов нулевой ширины , поскольку эти формы представления не рекомендуются в Юникоде и обычно должны использоваться только внутри внутреннего программного обеспечения для рендеринга текста; при использовании Unicode в качестве промежуточной формы для преобразования между кодировками символов; или для обратной совместимости с реализациями, которые полагаются на жесткое кодирование форм глифов.

Наконец, кодировка арабского языка в Юникоде находится в логическом порядке , то есть символы вводятся и сохраняются в памяти компьютера в том порядке, в котором они пишутся и произносятся, не беспокоясь о том, в каком направлении они будут отображаться на бумаге или на бумаге. экран. Опять же, механизм рендеринга должен представить символы в правильном направлении, используя функции двунаправленного текста Unicode . В связи с этим, если арабские слова на этой странице написаны слева направо, это указывает на то, что механизм рендеринга Unicode, используемый для их отображения, устарел. [19] [20]

Существуют конкурирующие онлайн-инструменты, например редактор Yamli, которые позволяют вводить арабские буквы без установки поддержки арабского языка на ПК и без знания раскладки арабской клавиатуры. [21]

Распознавание рукописного ввода

Первая в мире программа такого рода, распознающая арабский почерк в режиме реального времени, была разработана исследователями из Университета Бен-Гуриона (BGU).

Прототип позволяет пользователю писать арабские слова от руки на электронном экране, который затем анализирует текст и переводит его в печатные арабские буквы за тысячную долю секунды. По словам доктора Джихада Эль-Саны с факультета компьютерных наук БГУ, который разработал систему вместе со студентом магистратуры Фади Биадси, уровень ошибок составляет менее трех процентов. [22]

Смотрите также

Рекомендации

  1. ^ Дэниэлс, Питер Т .; Брайт, Уильям , ред. (1996). Мировые системы письменности . Oxford University Press, Inc. с. 559. ИСБН 978-0195079937.
  2. ^ Зитуни, Имед (2014). Обработка естественного языка семитских языков . Спрингер Наука и бизнес. п. 15. ISBN 978-3642453588.
  3. ^ abc Macdonald 1986, с. 117, 130, 149.
  4. ^ ab (на арабском языке) Alyaseer.net ترتيب المداخل والبطاقات في القوائم والفهارس الموضوعية Заказ записей и карточек в предметных указателях. Архивировано 23 декабря 2007 г. на Wayback Machine. Обсудить. ионная нить (по состоянию на 6 октября 2009 г.)
  5. ^ Макдональд 1986, с. 130.
  6. ^ Роджерс, Генри (2005). Системы письменности: лингвистический подход . Издательство Блэквелл. п. 135.
  7. ^ «Список форм арабской лигатуры в Юникоде» .
  8. ^ В зависимости от шрифтов, используемых для рендеринга, форма, отображаемая на экране, может быть лигатурной формой, а может и не быть.
  9. ^ "Новая Шахерезада". СИЛ Интернешнл . Проверено 4 февраля 2022 г.
  10. ^ Обратите внимание на Sur les Divers Жанры d'écriture Ancienne et Moderne des Arabes, Des Persans et des turcs / par A.-P. Пихан. 1856.
  11. ^ «Учебник по арабскому диалекту» (PDF) . Архивировано из оригинала (PDF) 17 декабря 2008 года . Проверено 2 декабря 2008 г.
  12. ^ Файл: Basmala kufi.svg – Wikimedia Commons
  13. ^ Файл: Kufi.jpg – Wikimedia Commons
  14. ^ Файл: Коран-фолио, куфик 11 века.jpg - Wikimedia Commons
  15. ^ "294-я годовщина Федерианской библиотеки: богатая и любопытная вещь на Китаб Салат аль-Савай" . Проверено 31 января 2017 г.
  16. Нагашян, Наги (21 января 2013 г.). Дизайн и структура арабской письменности. epubli. ISBN 9783844245059.
  17. ^ Арабский язык и искусство печати - специальный раздел. Архивировано 29 декабря 2006 года в Wayback Machine , автор Пол Лунде.
  18. ^ «UAX # 24: Файл данных сценария» . База данных символов Юникода . Консорциум Юникод.
  19. ^ Для получения дополнительной информации о кодировании арабского языка обратитесь к руководству по Unicode, доступному на веб-сайте Unicode.
  20. ^ См. также «Многоязычные вычисления с арабским языком и арабской транслитерацией: арабизация приложений Windows для чтения и письма на арабском языке» и «Решения для трясины транслитерации, с которой сталкиваются языки с арабской графикой», а также руководство по PowerPoint (со снимками экрана и закадровым голосом на английском языке) о том, как добавить Арабский для операционной системы Windows. Архивировано 11 сентября 2011 года в Wayback Machine.
  21. ^ "Ямли в новостях".
  22. ^ "Израиль 21с" . 14 мая 2007 г.

Источники

Внешние ссылки