Арабский алфавит , [a] или арабский абджад , является арабским письмом , специально кодифицированным для записи арабского языка. Он пишется справа налево в курсивном стиле и включает 28 букв, [b] из которых большинство имеют контекстные буквенные формы. Арабский алфавит считается абджадом , в котором требуются только согласные для записи; из-за его необязательного использования диакритических знаков для обозначения гласных, он считается нечистым абджадом . [2]
Базовый арабский алфавит содержит 28 букв . Формы, использующие арабскую письменность для записи других языков, добавляли и удаляли буквы: например, ⟨پ⟩ часто используется для представления /p/ в адаптациях арабской письменности. В отличие от алфавитов, полученных из греческого языка , в арабском языке нет отдельных заглавных и строчных букв.
Многие буквы выглядят похоже, но отличаются друг от друга точками ( ʾiʿjām ) над или под их центральной частью ( rasm ). Эти точки являются неотъемлемой частью буквы, поскольку они различают буквы, представляющие разные звуки. Например, арабские буквы ب b , ت t и ث th имеют одинаковую базовую форму, но с одной добавленной точкой снизу, двумя добавленными точками сверху и тремя добавленными точками сверху соответственно. Буква ن n также имеет одинаковую форму в начальной и средней формах с одной добавленной точкой сверху, хотя она несколько отличается в своих изолированных и конечных формах. Исторически они часто опускались в стиле письма, называемом rasm .
Как печатный, так и письменный арабский язык является курсивным , при этом большинство букв в слове непосредственно соединены с соседними буквами.
Существуют две основные последовательности сортировки («алфавитные упорядочения») для арабского алфавита: хиджаи и абджади .
Порядок Хиджаи ( هِجَائِيّ Hijāʾiyy /hid͡ʒaːʔijj/ ) используется чаще всего и применяется при сортировке списков слов и имен, например, в телефонных книгах, списках классов и словарях. Порядок группирует буквы по графическому сходству форм глифов.
Первоначальный порядок Абджади ( أَبْجَدِيّ ʾabjadiyy /ʔabd͡ʒadijj/ ) происходит от порядка, используемого в финикийском алфавите , и поэтому напоминает порядки других алфавитов, таких как еврейский и греческий . При таком порядке буквы также используются в качестве чисел, известных как цифры абджад , обладающие теми же нумерологическими кодами, что и в еврейской гематрии и греческой изопсефии .
Современные словари и другие справочники не используют порядок Абджади для сортировки по алфавиту; вместо этого используется более новый порядок Хиджаи, в котором буквы частично сгруппированы по схожести формы. Порядок Хиджаи никогда не используется в качестве цифр.
В странах Магриба использовался другой порядок хиджа , но сейчас он считается устаревшим. Последовательность следующая: [3]
В энциклопедии Абу Мухаммада аль-Хасана аль-Хамдани الإكليل من أخبار اليمن وأنساب حمير Китаб аль-Иклиль мин ахбар аль-Яман ва-ансаб Химьяр последовательность букв следующая: [4]
Порядок Абджади не является простым соответствием более раннему северосемитскому алфавитному порядку, поскольку в нем есть позиция, соответствующая арамейской букве самек 𐡎 , которая исторически не имеет родственной буквы в арабском алфавите.
Потеря самеха была компенсирована:
Шесть других букв, не соответствующих ни одной северосемитской букве, помещены в конце.
Обычно это озвучивается следующим образом:
Другая вокализация:
Это можно выразить так:
Арабский алфавит всегда курсивный, и буквы различаются по форме в зависимости от их положения в слове. Буквы могут иметь до четырех различных форм, соответствующих начальной, средней (средней), конечной или изолированной позиции ( IMFI ). В то время как некоторые буквы демонстрируют значительные вариации, другие остаются почти идентичными во всех четырех позициях. Как правило, буквы в одном слове связаны друг с другом с обеих сторон короткими горизонтальными линиями, но шесть букв ( و,ز,ر,ذ,د,ا ) могут быть связаны только с предыдущей буквой. Кроме того, некоторые сочетания букв записываются как лигатуры (специальные формы), в частности, lām-alif لا , [6] которая является единственной обязательной лигатурой (нелигатурная комбинация لا считается трудной для чтения).
Примечания
Хамза / ʔ / (гортанная смычка) может быть написана как отдельно, как если бы это была буква, так и с носителем, когда она становится диакритическим знаком . Для правил написания каждой формы см. Хамза .
Ниже приведены не отдельные буквы, а различные контекстные варианты некоторых арабских букв.
Геминация — это удвоение согласной. Вместо того, чтобы писать букву дважды, арабский язык помещает над ней знак в форме буквы W , называемый шадда . Обратите внимание, что если между двумя согласными находится гласная, буква будет просто написана дважды. Диакритический знак появляется только там, где согласная в конце одного слога идентична начальной согласной следующего слога. (Общее название для таких диакритических знаков — харакат ), например , درس darasa (с полными диакритическими знаками: دَرَسَ ) — это глагол формы I, означающий изучать , тогда как درّس darrasa (с полными диакритическими знаками: دَرَّسَ ) — это соответствующий глагол формы II, в котором средняя согласная r удвоена, что означает учить .
Нунация ( араб . تنوين tanwīn ) — это добавление конечного -n к существительному или прилагательному . Гласная перед ней указывает грамматический падеж . В письменном арабском языке нунация обозначается удвоением диакритического знака гласной в конце слова.
Использование лигатуры в арабском языке является обычным. Существует одна обязательная лигатура, которая используется для lām ل + alif ا, которая существует в двух формах. Все остальные лигатуры, которых существует много, [7] являются необязательными.
Для обозначения слова «Аллах» обычно используется более сложная лигатура, объединяющая до семи отдельных компонентов .
Единственная лигатура в первичном диапазоне арабского письма в Unicode (U+06xx) — lām + alif . Это единственная обязательная для шрифтов и текстовой обработки. Другие диапазоны предназначены для совместимости со старыми стандартами и содержат другие лигатуры, которые являются необязательными.
Примечание: Unicode также имеет в своем диапазоне Presentation Form B FExx код для этой лигатуры. Если ваш браузер и шрифт настроены правильно для арабского языка, лигатура, отображаемая выше, должна быть идентична этой, U+FEFB
АРАБСКАЯ ЛИГАТУРА ЛАМ С ИЗОЛИРОВАННОЙ ФОРМОЙ АЛЕФ:
U+0640
АРАБСКИЙ ТАТУИЛ + лам + алифПримечание: Unicode также имеет в своем диапазоне Presentation Form B U+FExx код для этой лигатуры. Если ваш браузер и шрифт настроены правильно для арабского языка, лигатура, отображаемая выше, должна быть идентична этой:
U+FEFC
АРАБСКАЯ ЛИГАТУРА ЛАМ С АЛЕФ ОКОНЧАТЕЛЬНАЯ ФОРМАДругая лигатура в форме представления Unicode A в диапазоне от U+FB50 до U+FDxx — это специальный код глифа для лигатуры Аллах («Бог»), U+FDF2
АРАБСКАЯ ЛИГАТУРА АЛЛАХ ИЗОЛИРОВАННАЯ ФОРМА:
Это обходной путь для недостатков большинства текстовых процессоров, которые не способны отображать правильные гласные для слова Аллах в Коране . Поскольку арабское письмо используется для записи других текстов, а не только Корана, отображение lām + lām + hā' в качестве предыдущей лигатуры считается неверным.
Этот упрощенный стиль часто предпочитают из-за ясности, особенно в неарабских языках, но он может не считаться подходящим в ситуациях, когда предпочтителен более сложный стиль каллиграфии. – SIL International [9]
Если на компьютере установлен один из ряда шрифтов (Noto Naskh Arab, mry_KacstQurn, KacstOne, Nadeem, DejaVu Sans, Harmattan, Scheherazade, Lateef, Иранский Sans, Baghdad, DecoType Naskh) (иранский Sans поддерживается веб-сайтом Wikimedia). шрифты), слово будет отображаться без диакритических знаков.
U+0651
АРАБСКАЯ ШАДДА +U+0670
АРАБСКАЯ БУКВА АЛЕФ + ха'Попытка отобразить их в неисправных шрифтах без автоматического добавления знака удвоения и надстрочного индекса алиф, хотя это может не отображаться так, как хотелось бы во всех браузерах, заключается в добавлении U+200d
(соединителя нулевой ширины) после первого или второго ляма.
U+200d
СОЕДИНИТЕЛЬ НУЛЕВОЙ ШИРИНЫ + ха'Пользователи арабского языка обычно пишут долгие гласные , но опускают краткие, поэтому читатели должны использовать свои знания языка, чтобы восполнить недостающие гласные. Однако в системе образования и, в частности, на занятиях по арабской грамматике эти гласные используются, поскольку они имеют решающее значение для грамматики. Арабское предложение может иметь совершенно иное значение за счет тонкого изменения гласных. Вот почему в таком важном тексте, как Коран, обязательны три основных знака гласных, такие как арабские диакритические знаки и другие типы знаков, такие как знаки кантилляции .
В арабском почерке повседневного использования, в общих публикациях и на уличных знаках краткие гласные обычно не пишутся. С другой стороны, копии Корана не могут быть одобрены религиозными институтами, которые их рассматривают, если в них не включены диакритические знаки. Детские книги, учебники для начальной школы и грамматики арабского языка в целом будут включать диакритические знаки в той или иной степени. Они известны как « вокализованные » тексты.
Короткие гласные могут быть написаны с диакритическими знаками, расположенными над или под согласной, которая предшествует им в слоге, называемыми харакат . Все арабские гласные, как долгие, так и краткие, следуют за согласной; в арабском языке такие слова, как «Али» или «алиф», например, начинаются с согласной: 'Алийй , алиф .
В полностью огласованном арабском тексте, который можно найти в таких текстах, как Коран, долгое ā, следующее за согласной, отличной от хамзы , пишется с коротким знаком a ( fatḥah ) на согласной плюс ʾalif после нее; долгое ī пишется как знак для короткой i ( kasrah ) плюс yāʾ ; и долгое ū как знак для короткой u ( ḍammah ) плюс wāw . Вкратце, ᵃa = ā ; ⁱy = ī ; и ᵘw = ū . Долгое ā, следующее за хамзой, может быть представлено ʾalif maddah или свободной хамзой, за которой следует ʾalif (два последовательных ʾalif s никогда не допускаются в арабском языке).
В таблице ниже показаны гласные, расположенные над или под пунктирным кругом, заменяющим первичную согласную букву или знак шадда . Для ясности в таблице первичные буквы слева, используемые для обозначения этих долгих гласных, показаны только в изолированной форме. Большинство согласных соединяются слева с ʾalif , wāw и yāʾ, написанными затем с их срединной или конечной формой. Кроме того, буква yāʾ в последнем ряду может соединяться с буквой слева от нее, а затем будет использовать срединную или начальную форму. Используйте таблицу первичных букв, чтобы посмотреть на их фактический глиф и типы соединения.
В неогласованном тексте (в котором краткие гласные не обозначены) долгие гласные представлены рассматриваемой гласной: ʾalif ṭawīlah/maqṣūrah , wāw , или yāʾ . Долгие гласные, написанные в середине слова неогласованного текста, рассматриваются как согласные с sukūn (см. ниже) в тексте, который имеет полные диакритические знаки. Здесь также таблица показывает долгие гласные буквы только в изолированной форме для ясности.
Сочетания وا и يا всегда произносятся как wā и yāʾ соответственно. Исключением является суффикс ـوا۟ в окончаниях глаголов, где ʾalif не произносится, в результате чего получается ū или aw .
Кроме того, при транслитерации имен и заимствованных слов носители арабского языка пишут большинство или все гласные как длинные ( ā с ا ʾalif , ē и ī с ي yaʾ , а ō и ū с و wāw ), что приближает их к настоящему алфавиту.
Дифтонги /aj/ и / aw/ представлены в огласовке следующим образом:
Арабский слог может быть открытым (заканчивающимся на гласную) или закрытым (заканчивающимся на согласную):
Обычный текст состоит только из ряда согласных и букв, удлиняющих гласные; таким образом, слово qalb , «сердце», пишется как qlb , а слово qalaba , «он обернулся», также пишется как qlb .
Чтобы написать «калаба» без этой двусмысленности, мы могли бы указать, что за «л» следует краткая «а» , написав над ней фатху .
Чтобы написать qalb , мы вместо этого обозначим, что за l не следует гласная, с помощью диакритического знака, называемого сукун ( ْ ), например: قلْب .
Это на один шаг ниже полной огласовки, где гласная после q также обозначается фатхой : قَلْب .
Коран традиционно пишется полной вокализацией .
Долгий звук i в некоторых изданиях Корана пишется с помощью kasrah, за которым следует y без диакритического знака , а долгий u — с помощью dammah, за которым следует просто w . В других изданиях эти y и w несут sukūn . За пределами Корана последнее соглашение встречается крайне редко, вплоть до того, что y с sukūn будет однозначно читаться как дифтонг /aj/ , а w с sukūn будет читаться /aw/ .
Например, буквы myl можно прочитать как английские meel или mail , или (теоретически) также как mayyal или mayil . Но если сукун добавляется к y, то m не может иметь сукун (потому что две буквы подряд не могут быть сукун ated), не может иметь дамму (потому что в арабском языке никогда не бывает звука uy , если только после y нет другой гласной ), и не может иметь касры (потому что касра перед сукун ated y никогда не встречается за пределами Корана ), поэтому она должна иметь фатху , и единственное возможное произношение — /majl/ (что означает миля или даже электронная почта). Подобным же образом, myt с сукуном над y может быть mayt, но не mayyit или meet , а mwt с сукуном над w может быть только mawt , но не moot ( iw невозможно, когда w закрывает слог).
Знаки гласных всегда пишутся так, как будто гласные i'rāb на самом деле произносятся, даже когда их нужно пропустить при фактическом произношении. Так, при написании имени Aḥmad необязательно ставить сукун на ḥ , но сукун запрещен на d , потому что он будет нести дамму , если за ним последует любое другое слово, как в Aḥmadu zawjī «Ахмад — мой муж».
Другой пример: предложение, которое в правильном литературном арабском языке должно произноситься как Aḥmadu zawjun shirrīr «Ахмад — грешный муж», обычно произносится (из-за влияния разговорных арабских вариантов) как Aḥmad zawj shirrīr . Тем не менее, для целей арабской грамматики и орфографии, рассматривается так, как если бы оно не было неправильно произнесено и как если бы за ним следовало еще одно слово, т. е. если добавляются какие-либо гласные знаки, они должны быть добавлены так, как если бы произношение было Aḥmadu zawjun sharrīrun с tanwīn 'un' в конце. Таким образом, правильно добавлять знак un tanwīn на конечной r , но на самом деле его произнесение было бы гиперкоррекцией. Кроме того, никогда не будет правильным писать сукун над этой буквой r , даже если в фактическом произношении это (и в правильном арабском языке ДОЛЖНО быть) сукун ed.
Конечно, если правильный ираб — сукун , его можно написать по желанию.
ٰٰ Сукун также используется для транслитерации слов в арабскую письменность. Английское имя «Mark» пишется как مارك , например, может быть написано с сукуном над ر , чтобы обозначить, что между этой буквой и ك нет гласного звука .
Некоторые буквы в определенных регионах имеют традиционно иную форму:
Некоторые измененные буквы используются для представления неродных звуков в современном стандартном арабском языке. Эти буквы используются как факультативная альтернатива в транслитерированных именах, заимствованных словах и диалектных словах. Использование этих букв зависит от автора и страны их происхождения, например, / ɡ / считается родной фонемой в большинстве арабских диалектов как отражение ج, как в Нижнем Египте, некоторых частях Омана и некоторых частях Йемена (например, جمل [gamal] ) или ق, как в большей части Аравийского полуострова, Ираке, Судане и некоторых частях Египта, Леванта и Северной Африки (например, قال [gaːl] ), но в заимствованных словах и топонимах она может быть написана либо стандартными буквами ج , غ , ق , и ك , либо нестандартными буквами ڨ (используется только в Тунисе и Алжире), ڭ (используется только в Марокко) и گ (используется в основном в регионе Персидского залива , за исключением Саудовской Аравии и Омана), например, « Golf », произносимый как /ɡoːlf/, может быть написан как جولف , غولف , قولف , كولف или ڨولف , ڭولف или گولف в зависимости от автора и страны его происхождения.
Примечание: Звуки / p / и / v / не являются родными для большинства диалектов арабского языка (за исключением анатолийского арабского языка , где ذِئْب «волк» произносится как vīp [viːp] [11] вместо стандартного арабского языка [ðɪʔb] ), в то время как / g / , / t͡ʃ / и / ʒ / появляются как родные фонемы или аллофоны во многих диалектах.
Существует два основных вида цифр, используемых вместе с арабским текстом: западные арабские цифры и восточные арабские цифры . В большинстве современных стран Северной Африки используются обычные западные арабские цифры. Как и в западных арабских цифрах, в восточных арабских цифрах единицы всегда находятся справа, а наибольшее значение — слева. Восточные арабские цифры пишутся слева направо.
Кроме того, арабский алфавит может использоваться для представления чисел ( чисел Абджад ). Это использование основано на порядке алфавита ʾabjadī . أ ʾalif — 1, ب bāʾ — 2, ج jīm — 3 и так далее, пока ي yāʾ не станет равным 10, ك kāf = 20, ل lām = 30, ..., ر rāʾ = 200, ..., غ ghayn = 1000. Иногда это используется для создания хронограмм .
Арабский алфавит можно проследить до набатейского письма, использовавшегося для записи набатейского арамейского языка . Первый известный текст на арабском алфавите — это надпись конца четвертого века из Джабал-Рама в 50 км к востоку от Акабы в Иордании , но первая датированная — это трехъязычная надпись в Зебеде в Сирии от 512 года. [ требуется ссылка ] Однако эпиграфические записи крайне скудны, сохранилось всего пять несомненно доисламских арабских надписей , хотя некоторые другие могут быть доисламскими. Позже над и под буквами были добавлены точки, чтобы различать их. (В арамейском языке было меньше фонем, чем в арабском, и некоторые изначально отдельные арамейские буквы стали неразличимы по форме, так что в ранних произведениях 14 отдельных буквенных форм должны были выполнять функцию 28 звуков; ср. столь же неоднозначную книгу Пехлеви .)
Первый сохранившийся документ, который определенно использует эти точки, также является первым сохранившимся арабским папирусом ( PERF 558 ), датированным апрелем 643 года, хотя они не стали обязательными до гораздо более позднего времени. Важные тексты часто заучивались и до сих пор заучиваются, особенно при заучивании Корана .
Позже были введены знаки гласных и хамза, начиная с некоторой второй половины VII века, предшествовавшей первому изобретению сирийских и тивериадских огласовок . Первоначально это делалось с помощью системы красных точек, которая, как говорят, была введена в эксплуатацию в эпоху Омейядов Абу аль-Асвадом ад-Дуали , точка сверху = a , точка снизу = i , точка на линии = u , а двойные точки указывали нунацию . Однако это было громоздко и легко спутано с точками, различающими буквы, поэтому примерно 100 лет спустя была принята современная система. Система была окончательно оформлена около 786 года аль-Халилем ибн Ахмадом аль-Фарахиди .
Арабские диалекты были записаны на разных алфавитах до распространения арабского алфавита, который используется в настоящее время. Наиболее важными из этих алфавитов и надписей являются сафаитские надписи, насчитывающие 30 000 надписей, обнаруженных в пустыне Леванта . [15]
В центральной Иордании и на северо-западе Аравийского полуострова имеется около 3700 надписей на хизмайском языке , а также набатейские надписи, наиболее важными из которых являются надпись Умм аль-Джималь I и надпись Нумара . [16]
Средневековая арабская ксилография процветала с X по XIV век. Она была посвящена только очень маленьким текстам, обычно для использования в амулетах .
В 1514 году, после изобретения Иоганном Гутенбергом печатного станка в 1450 году, венецианец Грегорио де Грегори опубликовал целый молитвенник на арабском языке; он назывался Kitab Salat al-Sawa'i и предназначался для восточных христианских общин. [17] Между 1580 и 1586 годами дизайнер шрифтов Роберт Гранжон разработал арабские шрифты для кардинала Фердинандо де Медичи , а издательство Medici Oriental Press опубликовало множество христианских молитв и научных арабских текстов в конце XVI века. [18]
Монахи -марониты в монастыре Маар-Кужай на горе Ливан опубликовали первые арабские книги, написанные подвижным шрифтом на Ближнем Востоке. Монахи транслитерировали арабский язык, используя сирийское письмо.
Хотя Наполеону обычно приписывают введение печатного станка в Египет во время его вторжения в страну в 1798 году, и хотя он действительно привез печатные станки и арабские печатные станки для печати официальной газеты французской оккупации Al-Tanbiyyah («Курьер»), печать на арабском языке началась несколькими столетиями ранее. Ювелир (вроде Гутенберга) спроектировал и внедрил арабский печатный станок с подвижными литерами на Ближнем Востоке. Ливанский монах -мелькит Абдалла Захер установил арабский печатный станок с подвижными литерами в монастыре Святого Иоанна в городе Дхур-эль-Шувайр в горах Ливана, первый самодельный печатный станок в Ливане с использованием арабского письма. Он лично вырезал формы для шрифтов и сделал отливку шрифта. Первая книга вышла из-под его пресса в 1734 году; этот пресс продолжал использоваться до 1899 года. [19]
Арабский алфавит может быть закодирован с использованием нескольких наборов символов , включая ISO-8859-6 , Windows-1256 и Unicode , последний из которых содержит «арабский сегмент», записи U+0600 по U+06FF. Однако ни один из наборов не указывает форму, которую каждый символ должен принимать в контексте. Выбор правильного глифа для отображения для каждого символа остается на усмотрение движка рендеринга .
Каждая буква имеет позиционно-независимую кодировку в Unicode, и программное обеспечение для рендеринга может вывести правильную форму глифа (начальную, срединную, конечную или изолированную) из ее соединительного контекста. Это текущая рекомендация. Однако для совместимости с предыдущими стандартами начальная, срединная, конечная и изолированная формы также могут кодироваться отдельно.
Начиная с Unicode 16.0, арабская письменность содержится в следующих блоках : [20]
Базовый арабский диапазон кодирует стандартные буквы и диакритические знаки, но не кодирует контекстные формы (U+0621-U+0652 напрямую основаны на ISO 8859-6 ). Он также включает наиболее распространенные диакритические знаки и арабо-индийские цифры . U+06D6 - U+06ED кодируют знаки коранических аннотаций, такие как «конец аята » ۖ и «начало руб эль-хизба » ۞. Арабский дополнительный диапазон кодирует варианты букв, в основном используемые для написания африканских (неарабских) языков. Арабский расширенный диапазон-A кодирует дополнительные коранические аннотации и варианты букв, используемые для различных неарабских языков.
Диапазон арабских презентационных форм-A кодирует контекстные формы и лигатуры вариантов букв, необходимых для персидского, урду , синдхи и центральноазиатских языков. Диапазон арабских презентационных форм-B кодирует формы пробелов арабских диакритических знаков и более контекстные формы букв. Блок арабских математических алфавитных символов кодирует символы, используемые в арабских математических выражениях.
См. также примечания к разделу об измененных письмах.
Клавиатуры, разработанные для разных стран, имеют разные раскладки, поэтому владение одним стилем клавиатуры, например, иракским, не переносится на владение другим стилем, например, саудовским. Различия могут включать расположение неалфавитных символов.
Все арабские клавиатуры позволяют вводить латинские символы, например, для URL в веб-браузере . Таким образом, каждая арабская клавиатура имеет как арабские, так и латинские символы, нанесенные на клавиши. Обычно латинские символы арабской клавиатуры соответствуют раскладке QWERTY , но в Северной Африке , где французский является наиболее распространенным языком, набираемым с использованием латинских символов, арабские клавиатуры имеют раскладку AZERTY .
Для кодирования определенной письменной формы символа в Unicode предусмотрены дополнительные кодовые точки, которые можно использовать для выражения точной желаемой письменной формы. Диапазон арабских форм представления A (от U+FB50 до U+FDFF) содержит лигатуры, в то время как диапазон арабских форм представления B (от U+FE70 до U+FEFF) содержит позиционные варианты. Эти эффекты лучше достигаются в Unicode с помощью объединения нулевой ширины и необъединения нулевой ширины , поскольку эти формы представления устарели в Unicode и, как правило, должны использоваться только внутри программного обеспечения для рендеринга текста; при использовании Unicode в качестве промежуточной формы для преобразования между кодировками символов; или для обратной совместимости с реализациями, которые полагаются на жесткое кодирование форм глифов.
Наконец, кодировка арабского языка Unicode имеет логический порядок , то есть символы вводятся и сохраняются в памяти компьютера в том порядке, в котором они пишутся и произносятся, не беспокоясь о направлении, в котором они будут отображаться на бумаге или на экране. Опять же, это оставляется на усмотрение движка рендеринга, чтобы представить символы в правильном направлении, используя двунаправленные текстовые функции Unicode. В связи с этим, если арабские слова на этой странице написаны слева направо, это является признаком того, что движок рендеринга Unicode, используемый для их отображения, устарел. [21] [22]
Существуют конкурирующие онлайн-инструменты, например, редактор Yamli, которые позволяют вводить арабские буквы без установленной на ПК поддержки арабского языка и без знания раскладки арабской клавиатуры. [23]
Первая в мире программа такого рода, которая распознает арабский почерк в режиме реального времени, была разработана исследователями из Университета Бен-Гуриона (BGU).
Прототип позволяет пользователю писать арабские слова вручную на электронном экране, который затем анализирует текст и переводит его в печатные арабские буквы за тысячную долю секунды. По словам доктора Джихада Эль-Саны с кафедры компьютерных наук BGU, который разработал систему вместе со студентом магистратуры Фади Биадси, уровень ошибок составляет менее трех процентов. [24]