stringtranslate.com

Транслитерация Баквалтера

Транслитерация арабского языка Баквалтера была разработана в рамках проекта ALPNET Arabic Project, которым руководил Кен Бисли в 1988 году .

Начинать

Первым аналитиком арабского языка для проекта был студент бакалавриата BYU по имени Дерек Фоксли, нанятый на неполный рабочий день. В то время Фоксли был на 4-м курсе арабского языка в BYU. [1] Тим Бакволтер был нанят несколько месяцев спустя в качестве штатного сотрудника ALPNET. В то время Бакволтер также был аспирантом по арабскому языку. Одной из его задач в проекте было сотрудничество и назначение заданий по арабскому языку для неполный рабочий день, Фоксли.

Бисли был наставником Баквалтера и Фоксли в некоторых тонких деталях лингвистики, и однажды у доски Бисли подтолкнул Фоксли и Баквалтера придумать схему транслитерации в тот момент. Фоксли вводил большую часть данных на том этапе проекта, поэтому был готов заняться этим. Тем не менее, в тесном сотрудничестве с Баквалтером он придумал почти все символы, используемые для таблицы транслитерации. Баквалтер курировал арабские задания Фоксли и вносил окончательные корректировки и уточнения в таблицу транслитерации. В то время у нее не было названия, однако Баквалтер в течение нескольких лет после проекта ввел тысячи текстовых элементов, используя схему транслитерации, и представил ее, а также отстаивал ее много раз. Поэтому она была названа в его честь.

В то время такая транслитерация букв один к одному не использовалась, или, по крайней мере, о ней не было известно команде.

Позже Бисли перешел в Xerox, которая купила права на данные ALPNET в 1990-х годах. Это задокументировано в нескольких других статьях, которые Бисли представил на протяжении многих лет.

Комментарий к системе

Транслитерация Buckwalter — это схема транслитерации, работающая только с ASCII , представляющая арабскую орфографию строго один к одному, в отличие от более распространенных схем романизации , которые добавляют морфологическую информацию, не выраженную в арабском письме. Так, например, wāw будет транслитерироваться как w независимо от того, реализуется ли он как гласный /uː/ или согласный /w/ . Только когда wāw модифицируется хамзой ( ؤ ) , транслитерация меняется на & . Это позволяет пользователю вводить или конвертировать текст точно так, как он отображается.

Однако схема транслитерации подверглась некоторой критике. Некоторые пользователи утверждают, что немодифицированные буквы легко читаются (за исключением * = dhaal и E = ayin, v = thaa), но транслитерации букв с диакритическими знаками и харакат требуют некоторого времени, чтобы привыкнуть, например, нунированные -un, -an, -in отображаются как N, F, K , а sukūn («без гласной») как o . Taʾ marbūṭah ة отображается как p . Вероятно, трудности возникли из-за того, что обычно транслитерация Buckwalter используется и/или представляется без обоснования букв. Хотя эти конкретные буквы кажутся случайными, на самом деле они мнемонически связаны с исходной буквой.

Кроме того, с момента разработки оригинальной схемы Баквалтера появилось несколько других вариантов, хотя не все они стандартизированы. Транслитерация Баквалтера несовместима с XML, поэтому версии «XML safe» часто изменяют следующие символы: < > & (أ إ и ؤ соответственно; Баквалтер предлагает транслитерировать их как IOW соответственно). Полностью «безопасные» схемы транслитерации заменяют все небуквенно-цифровые символы (такие как $';*) на буквенно-цифровые символы. [2]

При транслитерации арабского текста может возникнуть несколько других проблем. Во-первых, некоторые арабские символы не указаны в таблице транслитерации, включая неалфавитные символы, такие как ۞ и ۝ , знаки препинания, такие как ؛ ؟, и восточно-арабские цифры . Аналогично, иногда арабские предложения заимствуют неарабские буквы из персидского языка, некоторые из которых определены в полной таблице Баквалтера. [3] Символы, которые не определены в таблице транслитерации, могут быть удалены, сохранены как нелатинские символы, встроенные в транслитерированный текст, или транслитерированы в другие (неконфликтующие) латинские символы. (Например, легко преобразовать цифры хинди в арабские цифры.) Другая возникающая проблема заключается в том, как обрабатывать транслитерацию арабского текста со встроенным текстом ASCII; например, арабское предложение, которое ссылается на «IBM» или арабское предложение, которое включает цитату на английском языке. Если латинский текст явно не обозначен, сложно отличить транслитерированный арабский от латинского. Если транслитерированный текст со встроенной латиницей позже транслитерируется обратно на арабский, латинский текст будет транслитерирован на мусорный арабский. Наконец, еще одно важное решение, которое нужно принять, — это то, насколько должна быть выполнена нормализация арабского текста во время транслитерации. Это может включать удаление кашиды , удаление коротких гласных и/или других диакритических знаков и/или нормализацию орфографии. [2]

С другой стороны, все типичные обозначения, которые можно было бы ожидать использовать при написании - !@#%?.,;:()[]+= не использовались, поскольку они также используются в арабском тексте. Таким образом, если английское IBM действительно появилось в английском языке, в арабском тексте оно в исходной концепции должно было быть отмечено помещением двойных кавычек вокруг него: ""IBM"". Этот механизм позволяет выполнять автоматическую языковую обработку, оставляя неарабский текст как есть, необработанным, когда он видит двойные кавычки. Первоначально даже < > и не использовались, особенно < >, которые являются заимствованными из французского кавычками, поскольку они иногда используются в арабском тексте. Они были добавлены позже по необходимости. Их XML-безопасные версии соответствуют разработанному мнемоническому устройству (и обсуждаемому ниже) в том, что IOW соответствуют (хотя и неточно) каждому из произнесенных звуков.

Ключевые понятия в разработке таблицы

В схеме транслитерации использовались три ключевые концепции:

Первое — каждая арабская буква (звук) может соответствовать только одному символу английского языка. Некоторые арабские буквы при написании дают звук, который соответствует двум английским буквам. Поэтому для них пришлось бы использовать одну букву или общий символ.

Вторая концепция заключалась в использовании знакомого, если это возможно. Если арабская буква всегда ассоциировалась с буквой «s» в английском языке, например, то ее было бы легче запомнить, если бы ее можно было сохранить таким образом.

Третьей ключевой концепцией было то, что таблица должна была быть полностью и легко мнемонической. Поэтому каждый отдельный элемент соотносится в следующем порядке предпочтения: а) со звучанием арабской буквы, или б) с физическим аспектом исходной арабской буквы, или в) с именем, которым она называется.

Механика

Предпочтение отдавалось строчным буквам. Однако, когда было несколько арабских букв, имеющих похожие звуки, то для более открытых звуков использовалась строчная буква, а для более закрытых/ограниченных звуков использовалась заглавная буква. Например, в арабском языке есть 2 буквы, похожие на [d] в английском звуке. Простому звуку была присвоена маленькая «d», а выразительному звуку [dˤ] была присвоена заглавная «D».

Другими словами, заглавная буква указывает на то, что буква похожа на строчную букву, но имеет некоторое качественное отличие.

Таблица транслитерации Баквалтера

хамза
  • одинокий хамза: '
  • хамза на алифе: >
  • хамза ниже алифа: <
  • хамза он ва: &
  • хамза на йа: }
алиф
  • мадда на алифе: |
  • алиф аль-васла: {
  • кинжал алиф : `
  • алиф максура: Y
харакат
  • фатха: а
  • дамма: у
  • касра: я
  • фататайн: F
  • дамматайн: N
  • касратаин К
  • Шадда: ~
  • сукун: о
та марбута: п
татвиль: _

Мнемоника

Первоначальная команда ALPNET быстро приняла эту схему. Несмотря на то, что у Бисли не было опыта работы с арабским языком, он быстро смог понять и использовать ее. Сила транслитерации Баквалтера в том, что каждая арабская буква представлена ​​отчетливо. Тем не менее, ее опора на традиционные транслитерации или мнемонические приемы для чего-либо нетрадиционного делает ее очень простой для изучения.

Образец

Первая статья Всеобщей декларации прав человека :

Текст на арабском языке

Дэвид Дэниел Кейлз и его коллеги из США ٱلْحُقُوقِ. وَقَدْ وُهِبُوا عَقْلًا وَضَمِيرًا وَعَلَيْهِمْ يُعَامِلَ Написано Джоном Бэнном Уилсоном. [5]

Транслитерация Баквалтера

yuwladu jamiyEu {ln~aAsi >aHoraArFA mutasaAwiyna fiy {lokaraAmapi wa{loHuquwqi. waqado wuhibuwA EaqolFA waDamiyrFA waEalayohimo >ano yuEaAmila baEoDuhumo baEoDFA biruwHi {lo<ixaA'i.

ДИН 31635

Юладу Хамиу н-наси Шахраран мутасавина фи л-карамати ва-ль-хукук. Ва-кад вухибу аклан ва-Дамиран ва-алайхим ан юамила бадухум бадан би-рухи л-ихаи.

Текст на английском языке

Все люди рождаются свободными и равными в своем достоинстве и правах. Они наделены разумом и совестью и должны поступать в отношении друг друга в духе братства. [6]

Примечания

  1. ^ (см. первую страницу одной из первых презентаций, сделанных доктором Бисли в 1989 году в Университете Юты, в сносках перечислены авторы в порядке до этого момента) .[1]
  2. ^ ab Полное описание различных схем Баквалтера, а также более подробное обсуждение компромиссов между различными схемами см. в книге Хабаша, Низара. Введение в обработку арабского естественного языка. Морган и Клейпул, 2010.
  3. ^ Баквалтер, Тим. Таблица транслитерации арабского языка Баквалтера.
  4. ^ В Египте, Судане и иногда в других регионах конечная форма иногда — ی (без точек).
  5. ^ «Всеобщая декларация прав человека — арабский (Аларабия)». ohchr.org . УВКПЧ. 2016. Получено 22 октября 2016 г.
  6. ^ «Всеобщая декларация прав человека — английский». ohchr.org . УВКПЧ. 2016. Получено 22 октября 2016 г.

Внешние ссылки