Транскрипция в лингвистическом смысле — это систематическое представление устной речи в письменной форме. Источником могут быть как высказывания ( речь или язык жестов ), так и уже существующий текст в другой системе письма .
Транскрипцию не следует путать с переводом , который означает передачу смысла текста с исходного языка на целевой язык (например, Los Angeles (с исходного испанского языка) означает The Angels на целевом английском языке); или с транслитерацией , которая означает передачу написания текста из одного алфавита в другой.
В академической дисциплине лингвистики транскрипция является неотъемлемой частью методологий (среди прочих) фонетики , анализа разговора , диалектологии и социолингвистики . Она также играет важную роль в нескольких подобластях речевых технологий . Распространенными примерами транскрипций за пределами академической среды являются протоколы судебных слушаний, таких как уголовный процесс (репортером суда ) или записанные голосовые заметки врача ( медицинская транскрипция ). В этой статье основное внимание уделяется транскрипции в лингвистике.
Существует два основных типа лингвистической транскрипции. Фонетическая транскрипция фокусируется на фонетических и фонологических свойствах устной речи. Таким образом, системы фонетической транскрипции предоставляют правила для отображения отдельных звуков или фонов в письменные символы. Системы орфографической транскрипции , напротив, состоят из правил для отображения устных слов в письменные формы, как предписано орфографией данного языка. Фонетическая транскрипция работает со специально определенными наборами символов, обычно с Международным фонетическим алфавитом .
Тип выбранной транскрипции в основном зависит от контекста использования. Поскольку фонетическая транскрипция строго выдвигает на первый план фонетическую природу языка, она в основном используется для фонетического или фонологического анализа. Однако орфографическая транскрипция имеет морфологический и лексический компоненты наряду с фонетическим компонентом (какой аспект представлен в какой степени, зависит от языка и орфографии). Таким образом, эта форма транскрипции более удобна везде, где транскрибируются семантические аспекты разговорной речи. Фонетическая транскрипция более систематична в научном смысле, но ее также сложнее изучить, она требует больше времени для выполнения и менее широко применяется, чем орфографическая транскрипция.
Отображение устной речи на письменные символы не такой простой процесс, как может показаться на первый взгляд. Письменная речь — это идеализация, состоящая из ограниченного набора четко различимых и дискретных символов. Устная речь, с другой стороны, — это непрерывное (в отличие от дискретного) явление, состоящее из потенциально неограниченного числа компонентов. Не существует предопределенной системы для различения и классификации этих компонентов и, следовательно, нет предопределенного способа отображения этих компонентов на письменные символы.
Литература относительно последовательно указывает на ненейтральность практик транскрипции. Нейтральной системы транскрипции не существует и быть не может. Знание социальной культуры напрямую входит в создание транскрипции. Они фиксируются в текстуре транскрипции (Baker, 2005).
Системы транскрипции — это наборы правил, которые определяют, как устная речь должна быть представлена в письменных символах. Большинство систем фонетической транскрипции основаны на Международном фонетическом алфавите или, особенно в речевых технологиях, на его производном SAMPA .
Примерами систем орфографической транскрипции (все из области анализа разговора или смежных областей) являются:
Вероятно, первая система такого рода, первоначально описанная в (Sacks et al. 1978), позже адаптированная для использования в компьютерных корпусах как CA-CHAT (MacWhinney 2000). Область анализа разговора сама по себе включает ряд различных подходов к транскрипции и наборов соглашений о транскрипции. К ним относится, среди прочего, нотация Джефферсона. Для анализа разговора записанные данные обычно транскрибируются в письменную форму, которая согласуется с аналитиками. Существует два распространенных подхода. Первый, называемый узкой транскрипцией, фиксирует детали разговорного взаимодействия, такие как то, какие конкретные слова ударяются, какие слова произносятся с повышенной громкостью, точки, в которых череды речи перекрываются, как артикулируются конкретные слова и так далее. Если такие подробности менее важны, возможно, потому, что аналитика больше интересует общая структура разговора или относительное распределение реплик среди участников, то может быть достаточным второй тип транскрипции, известный как широкая транскрипция (Williamson, 2009).
Система транскрипции Джефферсона — это набор символов, разработанный Гейл Джефферсон , который используется для транскрибирования разговоров. Имея некоторый предыдущий опыт транскрибирования, когда она была нанята в 1963 году в качестве клерка-машинистки в Департамент общественного здравоохранения Калифорнийского университета в Лос-Анджелесе для транскрибирования сеансов обучения чувствительности для тюремных охранников, Джефферсон начала транскрибировать некоторые записи, которые послужили материалами, из которых были разработаны самые ранние лекции Харви Сакса. За четыре десятилетия, в течение большинства из которых она не занимала университетской должности и не получала зарплату, исследования Джефферсон в области разговора во взаимодействии установили стандарт для того, что стало известно как анализ разговора (CA). Ее работа оказала большое влияние на социологическое изучение взаимодействия, а также на дисциплины за его пределами, особенно на лингвистику, коммуникацию и антропологию. [1] Эта система используется повсеместно теми, кто работает с точки зрения CA, и считается, что она стала почти глобализированным набором инструкций по транскрипции. [2]
Система, описанная в (DuBois et al. 1992), использовалась для транскрипции Корпуса разговорного американского английского языка Санта-Барбары [3] (SBCSAE), позднее получившая дальнейшее развитие в DT2 .
Система, описанная в (Selting et al. 1998), позже развитая в GAT2 (Selting et al. 2009), широко используется в немецкоязычных странах для просодически- ориентированного анализа разговора и интерактивной лингвистики. [4] [5]
Вероятно, это первая система такого рода, первоначально описанная в (Ehlich and Rehbein 1976) – см. (Ehlich 1992) для справки на английском языке – адаптированная для использования в компьютерно-читаемых корпусах как (Rehbein et al. 2004), и широко используемая в функциональной прагматике . [6] [7] [8]
Транскрипция изначально была процессом, выполняемым вручную, т. е. карандашом и бумагой, с использованием аналоговой звукозаписи, хранящейся, например, на компакт-кассете. В настоящее время большая часть транскрипции выполняется на компьютерах. Записи обычно представляют собой цифровые аудиофайлы или видеофайлы , а транскрипции представляют собой электронные документы . Существует специализированное компьютерное программное обеспечение, помогающее транскрибатору эффективно создавать цифровую транскрипцию из цифровой записи.
Для содействия процессу транскрипции можно использовать два типа программного обеспечения для транскрипции: одно, которое облегчает ручную транскрипцию, и другое — автоматизированную транскрипцию. В первом случае работа по-прежнему в значительной степени выполняется человеком-транскрибатором, который слушает запись и набирает то, что слышится, на компьютере, и этот тип программного обеспечения часто представляет собой мультимедийный проигрыватель с такими функциями, как воспроизведение или изменение скорости. В последнем случае автоматизированная транскрипция достигается с помощью движка преобразования речи в текст , который преобразует аудио- или видеофайлы в электронный текст. Некоторые из программ также включают функцию аннотации . [9]
{{cite web}}
: CS1 maint: unfit URL (link)