Перекодировка IPA в ASCII
Фонетический алфавит расширенных методов оценки речи ( X-SAMPA ) — это вариант SAMPA, разработанный в 1995 году Джоном К. Уэллсом , профессором фонетики в Университетском колледже Лондона . [1] Он разработан для объединения алфавитов SAMPA отдельных языков и расширения SAMPA для охвата всего диапазона символов в версии Международного фонетического алфавита (IPA) 1993 года. Результатом является вдохновленное SAMPA перераспределение IPA в 7-битный ASCII .
SAMPA была разработана как хак для обхода неспособности текстовых кодировок представлять символы IPA. Позже, когда поддержка Unicode для символов IPA стала более распространенной, необходимость в отдельной, машиночитаемой системе для представления IPA в ASCII уменьшилась. Однако X-SAMPA по-прежнему полезна в качестве основы для метода ввода для настоящего IPA.
Краткое содержание
Примечания
- Символы IPA, представляющие собой обычные строчные буквы, имеют в X-SAMPA то же значение, что и в IPA.
- X-SAMPA использует обратные косые черты в качестве модифицирующих суффиксов для создания новых символов. Например,
O
является отличным от звука звуком O\
, к которому он не имеет никакого отношения. Такое использование символа обратной косой черты может быть проблемой, поскольку многие программы интерпретируют его как экранирующий символ для символа, следующего за ним. Например, такие символы X-SAMPA не работают в EMU, поэтому обратные косые черты должны быть заменены каким-либо другим символом (например, звездочкой : '*') при добавлении фонематической транскрипции в речевую базу данных EMU. Обратная косая черта не имеет фиксированного значения. - Диакритические знаки X-SAMPA следуют за символами, которые они модифицируют. За исключением назализации, слогообразования , ретрофлексии и ротацизации
~
, диакритические знаки присоединяются к символу с помощью символа подчеркивания .=
`
_
- Символ подчеркивания также используется для кодирования символа IPA :
k_p
кодирует /k͡p/ . - Цифры
_1
to _6
— это зарезервированные диакритические знаки, служащие для сокращения номеров тонов, специфичных для языка. - Реестр языковых тегов IETF назначил
fonxsamp
в качестве подтега текст, транскрибированный в X-SAMPA. [2]
Строчные символы
Заглавные символы
Другие символы
Диакритические знаки
Диаграммы
Согласные
- Звездочки (*) обозначают звуки, не имеющие символов X-SAMPA. Крестики (†) обозначают символы IPA, которые недавно были добавлены в Unicode . С апреля 2008 года последний случай относится к губно-зубному лоскуту , который в IPA обозначается правой буквой v :. В X-SAMPA пока не существует соглашения о применении губно-зубного лоскута.
Гласные
Смотрите также
Ссылки
- ^ Уэллс, Дж. К. «Компьютерное кодирование МФА: предлагаемое расширение SAMPA» (PDF) . Фонетика и лингвистика UCL . Университетский колледж Лондона . Получено 16 марта 2016 г. .
- ^ "Language Subtag Registry" (текст) . IETF. 2022-08-08 . Получено 12 ноября 2022 г.
- ↑ Краткое описание SAMPROSA см. в Wells, JC (19 сентября 1995 г.). "SAMPROSA (SAM Prosodic Transcription)". Фонетика и лингвистика UCL . Университетский колледж Лондона . Получено 23 октября 2021 г.
Внешние ссылки
- Компьютерное кодирование IPA: предлагаемое расширение SAMPA
- Конвертер X-SAMPA в IPA в CXS
- Веб-переводчик для документов X-SAMPA. Создает текст Unicode, текст XML, PostScript, PDF или LaTeX TIPA.
- Z-SAMPA, обратно совместимое расширение X-SAMPA, иногда используемое для конлангов