В музыке транскрипция — это практика записи нотами произведения или звука, которые ранее не были записаны и/или не пользовались популярностью в качестве письменной музыки, например, джазовой импровизации или саундтрека к видеоигре . Когда музыканту поручают создать ноты из записи, и он записывает ноты, составляющие произведение, в нотной записи , говорят, что он создал музыкальную транскрипцию этой записи. Транскрипция может также означать переписывание музыкального произведения, как сольного, так и ансамблевого , для другого инструмента или других инструментов, чем те, для которых оно изначально предназначалось. Симфонии Бетховена , транскрибированные для фортепиано соло Францем Листом, являются примером. Транскрипция в этом смысле иногда называется аранжировкой , хотя, строго говоря, транскрипции являются точным приспособлением, тогда как аранжировки изменяют существенные аспекты оригинального произведения.
Другие примеры музыкальной транскрипции включают этномузыкологическую запись устных традиций народной музыки, например, коллекции национальной народной музыки Венгрии и Англии Белы Бартока и Ральфа Воана Уильямса соответственно. Французский композитор Оливье Мессиан транскрибировал пение птиц в дикой природе и включал его во многие свои композиции, например, в свой Catalogue d'oiseaux для фортепиано соло. Транскрипция такого рода включает распознавание ступеней гаммы и гармонический анализ, для исполнения которых транскрибатору понадобится относительный или абсолютный слух .
В популярной музыке и роке существует две формы транскрипции. Отдельные исполнители копируют нота в ноту гитарное соло или другую мелодическую линию. Кроме того, музыкальные издатели транскрибируют целые записи гитарных соло и басовых партий и продают ноты в переплетенных книгах. Музыкальные издатели также публикуют транскрипции популярной музыки PVG (фортепиано/вокал/гитара), где транскрибируется мелодическая линия, а затем аккомпанемент на записи аранжируется как партия фортепиано. Гитарный аспект лейбла PVG достигается с помощью гитарных аккордов, написанных над мелодией. Тексты песен также включаются под мелодией.
Некоторые композиторы отдавали дань уважения другим композиторам, создавая «идентичные» версии произведений более ранних композиторов, добавляя при этом свое собственное творчество посредством использования совершенно новых звуков, возникающих из-за разницы в инструментовке. Наиболее широко известным примером этого является аранжировка Равеля для оркестра фортепианной пьесы Мусоргского « Картинки с выставки» . Веберн использовал свою транскрипцию для оркестра шестичастного ричеркара из «Музыкального приношения» Баха , чтобы проанализировать структуру произведения Баха, используя разные инструменты для исполнения различных второстепенных мотивов тем и мелодий Баха.
В транскрипции этой формы новое произведение может одновременно имитировать оригинальные звуки, перекомпоновывая их со всеми техническими навыками опытного композитора таким образом, что кажется, что произведение изначально было написано для нового носителя. Но некоторые транскрипции и аранжировки были сделаны по чисто прагматическим или контекстуальным причинам. Например, во времена Моцарта увертюры и песни из его популярных опер были транскрибированы для небольшого духового ансамбля просто потому, что такие ансамбли были обычным способом предоставления народного развлечения в общественных местах. Сам Моцарт делал это в своей опере «Дон Жуан» , транскрибируя для небольшого духового ансамбля несколько арий из других опер, включая одну из его собственной оперы « Женитьба Фигаро» . Более современным примером является транскрипция Стравинского для фортепиано в четыре руки « Весны священной» , которая будет использоваться на репетициях балета. Сегодня музыканты, которые играют в кафе или ресторанах, иногда играют транскрипции или аранжировки произведений, написанных для большего состава инструментов.
Другие примеры такого типа транскрипций включают аранжировку Баха концертов Вивальди для четырех скрипок для четырех клавишных инструментов и оркестра; аранжировку Моцартом некоторых фуг Баха из «Хорошо темперированного клавира» для струнного трио ; аранжировку Бетховена его Большой фуги , изначально написанной для струнного квартета , для фортепианного дуэта и его аранжировку его Скрипичного концерта как фортепианного концерта ; фортепианные аранжировки Ференца Листа произведений многих композиторов, включая симфонии Бетховена ; аранжировку Чайковским четырех фортепианных пьес Моцарта в оркестровую сюиту под названием « Моцартиана »; реоркестровку Малером симфоний Шумана; а также аранжировку Шенберга для оркестра фортепианного квинтета Брамса и прелюдии и фуги Баха «Святая Анна» для органа.
С тех пор как фортепиано стало популярным инструментом, появилась обширная литература транскрипций и аранжировок для фортепиано произведений для оркестра или камерного ансамбля. Иногда их называют « фортепианными сокращениями », поскольку множественность оркестровых партий — в оркестровой пьесе может быть до двух десятков отдельных инструментальных партий, исполняемых одновременно — должна быть сведена к тому, что может сыграть один пианист (или иногда два пианиста на одном или двух фортепиано, например, различные аранжировки для « Рапсодии в стиле блюз » Джорджа Гершвина ) .
Фортепианная обработка часто используется для оркестрового сопровождения хоровых произведений в целях репетиций или исполнения только на клавиатуре.
Многие оркестровые произведения были переложены для концертного состава .
С появлением настольных издательских систем музыканты могут приобрести программное обеспечение для нотной записи , которое может получать мысленный анализ нот пользователя, а затем сохранять и форматировать эти ноты в стандартную нотную запись для личной печати или профессиональной публикации нот. Некоторое программное обеспечение для нотной записи может принимать стандартный файл MIDI (SMF) или исполнение MIDI в качестве входных данных вместо ручного ввода нот. Эти приложения для нотной записи могут экспортировать свои партитуры в различные форматы, такие как EPS , PNG и SVG . Часто программное обеспечение содержит звуковую библиотеку, которая позволяет приложению воспроизводить партитуру пользователя вслух для проверки.
До изобретения цифровых средств транскрипции музыканты замедляли пластинку или запись на пленку, чтобы иметь возможность услышать мелодические линии и аккорды в более медленном, более усваиваемом темпе. Проблема с этим подходом заключалась в том, что он также изменял высоту тона, поэтому после того, как произведение было транскрибировано, его затем приходилось транспонировать в правильную тональность. Программное обеспечение, предназначенное для замедления темпа музыки без изменения высоты тона, может быть очень полезным для распознавания высоты тона, мелодий, аккордов, ритмов и текстов при транскрибировании музыки. Однако, в отличие от эффекта замедления проигрывателя, высота тона и исходная октава нот останутся прежними, а не понизятся по высоте. Эта технология достаточно проста, чтобы быть доступной во многих бесплатных программных приложениях.
Программное обеспечение обычно выполняет двухэтапный процесс для достижения этого. Во-первых, аудиофайл воспроизводится с более низкой частотой дискретизации, чем у исходного файла. Это имеет тот же эффект, что и воспроизведение кассеты или виниловой пластинки на более низкой скорости — высота тона понижается, что означает, что музыка может звучать так, как будто она в другой тональности. Вторым шагом является использование цифровой обработки сигнала (или DSP) для смещения высоты тона обратно к исходному уровню высоты тона или музыкальной тональности.
Как упоминалось в разделе Автоматическая музыкальная транскрипция, некоторые коммерческие программы могут приблизительно отслеживать высоту тона доминирующих мелодий в полифонических музыкальных записях. Сканирование нот не является точным, и часто пользователю необходимо вручную редактировать его перед сохранением в файл либо в собственном формате файла, либо в стандартном формате MIDI- файла. Некоторые программы для отслеживания высоты тона также позволяют анимировать списки отсканированных нот во время воспроизведения аудио.
Термин «автоматическая музыкальная транскрипция» был впервые использован исследователями аудио Джеймсом А. Мурером, Мартином Пищальски и Бернардом Галлером в 1977 году. Благодаря своим знаниям в области цифровой аудиотехники эти исследователи считали, что компьютер можно запрограммировать для анализа цифровой записи музыки таким образом, чтобы можно было обнаружить высоту тона мелодических линий и аккордовых схем, а также ритмические акценты ударных инструментов. Задача автоматической музыкальной транскрипции касается двух отдельных действий: анализа музыкального произведения и распечатки партитуры на основе этого анализа. [1]
Это была не простая цель, но та, которая будет поощрять академические исследования по крайней мере еще три десятилетия. Из-за тесной научной связи речи с музыкой, многие академические и коммерческие исследования, которые были направлены на более финансово обеспеченную технологию распознавания речи , будут переработаны в исследования технологии распознавания музыки. Хотя многие музыканты и педагоги настаивают на том, что ручное выполнение транскрипций является ценным упражнением для развития музыкантов, мотивация для автоматической транскрипции музыки остается той же, что и мотивация для нот: музыканты, у которых нет интуитивных навыков транскрипции, будут искать ноты или таблицу аккордов, чтобы они могли быстро научиться играть песню. Коллекция инструментов, созданная в ходе этого продолжающегося исследования, может оказать большую помощь музыкантам. Поскольку для многих записанных музыкальных произведений нет доступных нот, автоматическое устройство транскрипции также может предложить транскрипции, которые в противном случае были бы недоступны в нотах. На сегодняшний день ни одно программное приложение не может полностью соответствовать определению Джеймса Мурера автоматической транскрипции музыки. Однако стремление к автоматической транскрипции музыки породило создание множества программных приложений, которые могут помочь в ручной транскрипции. Некоторые могут замедлять музыку, сохраняя при этом исходную высоту тона и октаву, некоторые могут отслеживать высоту тона мелодии, некоторые могут отслеживать смену аккордов, а другие могут отслеживать ритм музыки.
Автоматическая транскрипция в основном включает определение высоты тона и длительности исполняемых нот. Это влечет за собой отслеживание высоты тона и определение начала нот. После фиксации этих физических измерений эта информация отображается в традиционной музыкальной нотации, т. е. в нотных листах.
Цифровая обработка сигналов — это отрасль инженерии, которая предоставляет инженерам-программистам инструменты и алгоритмы, необходимые для анализа цифровой записи с точки зрения высоты тона (обнаружение нот мелодических инструментов) и энергетического содержания нетональных звуков (обнаружение ударных инструментов). Музыкальные записи сэмплируются с заданной скоростью записи, а данные о ее частоте сохраняются в любом цифровом волновом формате на компьютере. Такой формат представляет звук посредством цифровой сэмплировки .
Обнаружение высоты тона часто представляет собой обнаружение отдельных нот , которые могут составлять мелодию в музыке, или нот в аккорде . Когда нажимается одна клавиша на пианино, мы слышим не просто одну частоту звуковой вибрации, а совокупность нескольких звуковых вибраций, происходящих на разных математически связанных частотах. Элементы этой совокупности вибраций на разных частотах называются гармониками или парциалами.
Например, если воспроизводится нота A 3 (220 Гц), отдельные частоты гармонического ряда композита начнутся с 220 Гц в качестве основной частоты : 440 Гц будет второй гармоникой, 660 Гц будет третьей гармоникой, 880 Гц будет четвертой гармоникой и т. д. Это целые кратные основной частоты (например, дважды 220 будет 440, вторая гармоника). Хотя для слышимого воссоздания ноты действительно необходимо всего около восьми гармоник, общее количество гармоник в этом математическом ряду может быть большим, хотя чем выше номер гармоники, тем слабее величина и вклад этой гармоники. [ необходима цитата ] Вопреки интуиции, музыкальная запись на самом низком физическом уровне не является набором отдельных нот , а на самом деле является набором отдельных гармоник. Вот почему очень похожие по звучанию записи могут быть созданы с различными наборами инструментов и назначенными им нотами. Пока общие гармоники записи воссоздаются в какой-то степени, не имеет значения, какие инструменты или какие ноты использовались.
Первым шагом в обнаружении нот является преобразование цифровых данных звукового файла из временной области в частотную область , что позволяет измерять различные частоты с течением времени. Графическое изображение аудиозаписи в частотной области называется спектрограммой или сонограммой. Музыкальная нота, как композиция различных гармоник , отображается на спектрограмме как вертикально расположенная гребенка , при этом отдельные зубцы гребенки представляют различные гармоники и их различные значения частот. Преобразование Фурье — это математическая процедура, которая используется для создания спектрограммы из цифровых данных звукового файла.
Задачей многих алгоритмов обнаружения нот является поиск в спектрограмме появления таких гребенчатых узоров (композиции гармоник), вызванных отдельными нотами. После обнаружения узора конкретной гребенчатой формы гармоник ноты, высота тона ноты может быть измерена по вертикальному положению гребенчатого узора на спектрограмме .
В основном существуют два разных типа музыки, которые предъявляют совершенно разные требования к алгоритму определения высоты тона : монофоническая музыка и полифоническая музыка. Монофоническая музыка — это отрывок, в котором только один инструмент играет одну ноту за раз, в то время как полифоническая музыка может включать несколько инструментов и вокалов одновременно. Определение высоты тона на монофонической записи было относительно простой задачей, и ее технология позволила изобрести гитарные тюнеры в 1970-х годах. Однако определение высоты тона на полифонической музыке становится гораздо более сложной задачей, поскольку изображение ее спектрограммы теперь выглядит как нечеткое облако из-за множества перекрывающихся гребневых узоров, вызванных множественными гармониками каждой ноты .
Другой метод определения высоты тона был изобретен Мартином Пищальским совместно с Бернардом Галлером в 1970-х годах [2] и с тех пор широко применяется. [3] Он нацелен на монофоническую музыку. Центральным в этом методе является то, как высота тона определяется человеческим ухом . [4] Процесс пытается приблизительно имитировать биологию человеческого внутреннего уха , находя только несколько самых громких гармоник в данный момент. Этот небольшой набор найденных гармоник , в свою очередь, сравнивается со всеми возможными результирующими гармоническими наборами высот, чтобы выдвинуть гипотезу о том, какой наиболее вероятный тон может быть задан этим конкретным набором гармоник.
На сегодняшний день полное распознавание нот полифонических записей остается загадкой для звукорежиссеров, хотя они продолжают добиваться прогресса, изобретая алгоритмы, которые могут частично распознавать некоторые ноты полифонической записи, такие как мелодия или басовая партия.
Отслеживание ритма — это определение повторяющегося временного интервала между воспринимаемыми импульсами в музыке. Ритм также можно описать как «постукивание ногой» или «хлопанье руками» в такт музыке. Ритм часто является предсказуемой базовой единицей времени для музыкального произведения и может лишь немного меняться во время исполнения. Песни часто измеряются по их количеству ударов в минуту (BPM) для определения темпа музыки, будь то быстрый или медленный.
Поскольку ноты часто начинаются с такта или простого подразделения временного интервала такта, программное обеспечение для отслеживания тактов имеет потенциал для лучшего разрешения начал нот, которые могли быть обнаружены грубым способом. Отслеживание тактов часто является первым шагом в обнаружении ударных инструментов.
Несмотря на интуитивную природу «отбивания ногой», на которую способны большинство людей, разработка алгоритма для обнаружения этих ударов является сложной задачей. Большинство современных программных алгоритмов для обнаружения ударов используют групповую конкурирующую гипотезу для ударов в минуту, поскольку алгоритм постепенно находит и разрешает локальные пики громкости, примерно соответствующие отбиваниям ногой музыки.
Для автоматической транскрипции музыки необходимо решить несколько проблем:
1. Ноты должны быть распознаны — это обычно делается путем перехода из временной области в частотную. Это может быть достигнуто с помощью преобразования Фурье . Компьютерные алгоритмы для этого широко распространены. Алгоритм быстрого преобразования Фурье вычисляет частотное содержимое сигнала и полезен при обработке музыкальных отрывков.
2. Необходимо определить такт и темп ( определение такта ) – это сложная, многогранная проблема. [5]
Метод, предложенный в Costantini et al. 2009 [6], фокусируется на событиях нот и их основных характеристиках: момент атаки, высота тона и момент финала. Обнаружение начала использует двоичное представление времени-частоты аудиосигнала. Классификация нот и обнаружение смещения основаны на преобразовании константы Q (CQT) и опорных векторных машинах (SVM).
Это, в свою очередь, приводит к «контуру высоты тона», а именно непрерывно изменяющейся во времени линии, которая соответствует тому, что люди называют мелодией. Следующий шаг — сегментировать этот непрерывный мелодический поток, чтобы определить начало и конец каждой ноты. После этого каждая «единица ноты» выражается в физических терминах (например, 4402 Гц, 0,52 секунды). Последний шаг — затем отобразить эту физическую информацию в знакомых терминах, похожих на музыкальную нотацию, для каждой ноты (например, A4, четвертная нота).
С точки зрения фактической компьютерной обработки, основные шаги заключаются в следующем: 1) оцифровать исполняемую аналоговую музыку, 2) выполнить последовательное краткосрочное быстрое преобразование Фурье (БПФ) для получения изменяющихся во времени спектров, 3) идентифицировать пики в каждом спектре, 4) проанализировать спектральные пики для получения кандидатов высоты тона, 5) соединить самые сильные отдельные кандидаты высоты тона для получения наиболее вероятного изменяющегося во времени контура высоты тона, 6) сопоставить эти физические данные с наиболее близкими терминами нотной записи. Эти фундаментальные шаги, созданные Пищальским в 1970-х годах, стали основой автоматической транскрипции музыки. [2]
Самый спорный и сложный шаг в этом процессе — определение высоты тона. [7] Наиболее успешные методы высоты тона работают в частотной области, а не во временной области. Хотя были предложены методы временной области, они могут сломаться для реальных музыкальных инструментов, на которых играют в типично реверберирующих помещениях.
Метод обнаружения высоты тона, изобретенный Пищальским [4], снова имитирует человеческий слух. Он следует за тем, как только определенные наборы частичных тонов «сливаются» вместе при человеческом слушании. Это наборы, которые создают восприятие только одной высоты тона. Слияние происходит только тогда, когда два частичных тона находятся в пределах 1,5% от идеальной гармонической пары (т. е. их частоты приближаются к набору пар с низким целым числом, такому как 1:2, 5:8 и т. д.). Это почти гармоническое соответствие требуется для всех частичных тонов, чтобы человек слышал их только как одну высоту тона.
{{cite web}}
: CS1 maint: дата и год ( ссылка )