Вычислительное музыковедение — это междисциплинарная область исследований между музыковедением и компьютерными науками . [1] Вычислительное музыковедение включает в себя любые дисциплины, которые используют вычисления для изучения музыки. Оно включает в себя такие субдисциплины, как математическая теория музыки, компьютерная музыка , систематическое музыковедение , поиск музыкальной информации , цифровое музыковедение, звуковые и музыкальные вычисления и музыкальная информатика . [2] Поскольку эта область исследований определяется инструментами, которые она использует, и ее предметом, исследования в области вычислительного музыковедения пересекаются как с гуманитарными , так и с естественными науками . Использование компьютеров для изучения и анализа музыки в целом началось в 1960-х годах, [3] хотя музыканты использовали компьютеры для помощи себе в сочинении музыки, начиная с 1950-х годов. Сегодня вычислительное музыковедение охватывает широкий спектр исследовательских тем, связанных с различными способами представления музыки. [4]
Эта история вычислительного музыковедения в целом началась в середине 20-го века. Обычно эта область считается продолжением гораздо более долгой истории интеллектуальных исследований в музыке, которая пересекается с наукой, математикой, технологией [5] и архивированием.
Ранние подходы к вычислительному музыковедению появились в начале 1960-х годов и были полностью разработаны к 1966 году. [6] [3] В то время ввод данных осуществлялся в основном с помощью бумажной ленты или перфокарт [3] и был ограничен в вычислительном отношении. Из-за высокой стоимости этого исследования, чтобы получить финансирование, проекты часто имели тенденцию задавать глобальные вопросы и искать глобальные решения. [3] Одной из самых ранних схем символического представления была Цифровая альтернативная репрезентация музыки или DARMS. Проект поддерживался Колумбийским университетом и Фондом Форда в период с 1964 по 1976 год. [7] Проект был одним из первых крупномасштабных проектов по разработке схемы кодирования, которая включала полноту, объективность и управляемость кодировщиком. [7] Другие работы в это время в Принстонском университете , в основном проводимые Артуром Менделем и реализованные Майклом Касслером [8] и Эриком Регенером, помогли продвинуть вперед языки Intermediary Musical Language (IML) и Music Information Retrieval (MIR), которые позже потеряли популярность в конце 1970-х годов. 1960-е годы также ознаменовались временем документирования библиографических инициатив, таких как Repertoire International de Literature Musicale (RILM), созданный Барри Бруком в 1967 году.
В отличие от глобальных исследовательских интересов 1960-х годов, цели в вычислительном музыковедении в 1970-х годах были обусловлены выполнением определенных задач. [3] Эта мотивация, обусловленная задачами, привела к разработке MUSTRAN для анализа музыки под руководством Джерома Венкера и Дороти Гросс в Университете Индианы . Подобные проекты, такие как SCORE (SCORE-MS) в Стэнфордском университете, были разработаны в первую очередь для целей печати.
1980-е годы стали первым десятилетием, когда произошел отход от централизованных вычислений и переход к персонализированным вычислениям. Этот перенос ресурсов привел к росту в этой области в целом. Джон Уолтер Хилл начал разрабатывать коммерческую программу под названием Savy PC , которая должна была помочь музыковедам анализировать лирическое содержание в музыке. Результаты исследований музыки Хилла позволили обнаружить закономерности в преобразованиях священных и светских текстов, где были изменены только первые строки текстов. [3] В соответствии с глобальными вопросами, которые доминировали в 1960-х годах, Хельмут Шаффрат начал свою Essen Folk Collection, закодированную в Essen Associative Code (ESAC), которая с тех пор была преобразована в рутинную нотацию. [9] Используя программное обеспечение, разработанное в то время, Сандра Пинегар исследовала рукописи по теории музыки 13-го века в своей докторской работе в Колумбийском университете, чтобы получить доказательства датировки и авторства текстов. [10] 1980-е годы также представили нотацию MIDI .
Вычислительное музыковедение можно в целом разделить на три основные ветви, связанные с тремя способами представления музыки компьютером: данные нот, символические данные и аудиоданные. Данные нот относятся к графическому представлению музыки с помощью символов, которое может быть прочитано человеком. Примерами этого направления исследований могут служить оцифровка партитур от неуменальной нотации 15-го века до современной западной музыкальной нотации . Как и данные нот, символические данные относятся к музыкальной нотации в цифровом формате, но символические данные не являются читаемыми человеком и кодируются для того, чтобы их мог проанализировать компьютер. Примерами этого типа кодирования являются piano roll , kern [11] и MIDI- представления. Наконец, аудиоданные относятся к записи представлений акустической волны или звука, которые возникают в результате изменений колебаний давления воздуха. [12] Примерами этого типа кодирования являются файлы MP3 или WAV .
Ноты предназначены для чтения музыкантом или исполнителем. Как правило, этот термин относится к стандартизированной номенклатуре, используемой культурой для документирования их музыкальной нотации. В дополнение к музыкальной грамотности, нотная запись также требует выбора от исполнителя. Например, нотация раг индуизма начинается с алапа , который не требует строгого соблюдения такта или пульса , но остается на усмотрение исполнителя. [13] Нотная запись фиксирует последовательность жестов, которые исполнитель должен делать в рамках музыкальной культуры, но никоим образом не фиксирована на этих исполнительских выборах.
Символические данные относятся к музыкальному кодированию, которое может быть проанализировано компьютером. В отличие от данных нот, любой тип формата цифровых данных может рассматриваться как символический из-за того, что система, которая его представляет, генерируется из конечной серии символов. Символические данные обычно не имеют какого-либо рода перформативного выбора, требуемого со стороны исполнителя. [4] Два наиболее распространенных выбора программного обеспечения для анализа символических данных — это Humdrum Toolkit Дэвида Хьюрона [14] и music21 Майкла Скотта Катберта. [15]
Аудиоданные обычно концептуализируются как существующие на континууме функций, варьирующихся от аудиофункций низшего до высшего уровня. Аудиофункции низкого уровня относятся к громкости , спектральному потоку и кепстру . Аудиофункции среднего уровня относятся к высоте тона , началам и ударам. Примерами аудиофункций высокого уровня являются стиль , исполнитель , настроение и тональность . [16]
Одним из самых ранних приложений в вычислительном музыковедении было создание и использование музыкальных баз данных . Ввод, использование и анализ больших объемов данных может быть очень хлопотным при использовании ручных методов, тогда как использование компьютеров может значительно облегчить такие задачи.
Для анализа музыкальных данных были разработаны различные компьютерные программы. Форматы данных варьируются от стандартной нотации до необработанного аудио. Анализ форматов, основанных на сохранении всех свойств каждой ноты, например MIDI , использовался изначально и до сих пор является одним из самых распространенных методов. Значительные успехи в анализе необработанных аудиоданных были достигнуты только недавно.
Различные алгоритмы могут использоваться как для создания полных композиций , так и для импровизации музыки . Одним из методов, с помощью которых программа может научиться импровизации, является анализ выборов, которые делает человек-исполнитель во время импровизации. Искусственные нейронные сети широко используются в таких приложениях.
Одной из развивающихся социомузыкологических теорий в вычислительном музыковедении является «Дискурсивная гипотеза», предложенная Кристоффером Йенсеном и Дэвидом Г. Хебертом , которая предполагает, что «поскольку и музыка, и язык являются культурными дискурсами (которые могут отражать социальную реальность схожими ограниченными способами), может быть выявлена связь между траекториями значимых особенностей музыкального звука и лингвистического дискурса относительно социальных данных». [17] Согласно этой точке зрения, анализ « больших данных » может улучшить наше понимание того, как определенные особенности музыки и общества взаимосвязаны и изменяются аналогичным образом с течением времени, поскольку значимые корреляции все чаще выявляются в музыкально-лингвистическом спектре слуховой коммуникации человека. [18]
Стратегии вычислительного музыковедения в последнее время применяются для анализа музыки в различных частях мира. Например, профессора, связанные с Технологическим институтом Бирла в Индии, провели исследования гармонических и мелодических тенденций (в структуре рага ) индуистской классической музыки . [19]
База данных RISM (Répertoire International des Sources Musicales) является одной из крупнейших в мире баз данных музыки, содержащей более 700 000 ссылок на музыкальные рукописи. Любой может использовать ее поисковую систему для поиска композиций. [20]
Центр истории и анализа записанной музыки (CHARM) разработал проект «Мазурка» [21] , который предлагает «загружаемые записи... аналитическое программное обеспечение и учебные материалы, а также разнообразные ресурсы, связанные с историей звукозаписи».
Исследования в области вычислительного музыковедения иногда оказываются в центре внимания популярной культуры и крупных новостных агентств. Примерами этого являются репортажи в The New Yorker о том, что музыковеды Николас Кук и Крейг Сапп во время работы в Центре истории и анализа записанной музыки (CHARM) в Лондонском университете обнаружили мошенническую запись пианиста Джойса Хатто . [22] В 334-й день рождения Иоганна Себастьяна Баха Google отпраздновал это событие с помощью Google Doodle, который позволял людям вводить собственную партитуру в интерфейс, а затем модель машинного обучения под названием Coconet [23] гармонизировала мелодию. [24]
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ){{citation}}
: CS1 maint: другие ( ссылка )