Поиск музыкальной информации

Поиск музыкальной информации ( MIR ) — междисциплинарная наука извлечения информации из музыки . Те, кто занимается MIR, могут иметь опыт в академическом музыковедении , психоакустике , психологии , обработке сигналов , информатике , машинном обучении , оптическом распознавании музыки , вычислительном интеллекте или в некоторой комбинации этих областей.

Приложения

Поиск музыкальной информации используется предприятиями и учеными для категоризации, обработки и даже создания музыки.

Классификация музыки

Одной из классических тем исследований MIR является жанровая классификация, которая относит музыкальные произведения к одному из предопределенных жанров, таких как классика , джаз , рок и т. д. Также популярными темами являются классификация по настроению , классификация исполнителей, идентификация инструментов и музыкальные теги.

Разделение источников музыки и распознавание инструментов

Разделение источника музыки заключается в разделении исходных сигналов от смешанного аудиосигнала . Распознавание инструментов заключается в идентификации инструментов, задействованных в музыке. Были разработаны различные системы MIR, которые могут разделять музыку на ее составляющие треки без доступа к мастер-копии. Таким образом, например, треки караоке могут быть созданы из обычных музыкальных треков, хотя этот процесс пока не идеален из-за того, что вокал занимает часть того же частотного пространства, что и другие инструменты.

Автоматическая транскрипция музыки

Автоматическая музыкальная транскрипция — это процесс преобразования аудиозаписи в символическую нотацию, такую как партитура или MIDI-файл . ^[1] Этот процесс включает в себя несколько задач аудиоанализа, которые могут включать в себя обнаружение нескольких тонов, обнаружение начала , оценку длительности, идентификацию инструмента и извлечение гармонической , ритмической или мелодической информации. Эта задача становится сложнее с большим количеством инструментов и большим уровнем полифонии .

Музыкальное поколение

Автоматическая генерация музыки является целью многих исследователей MIR. Попытки были сделаны с ограниченным успехом с точки зрения человеческой оценки результатов.

Используемые методы

Источник данных

Партитуры дают четкое и логичное описание музыки, с которой можно работать, но доступ к нотам , будь то цифровые или иные, часто непрактичен. Музыка MIDI также использовалась по аналогичным причинам, но некоторые данные теряются при преобразовании в MIDI из любого другого формата, если только музыка не была написана с учетом стандартов MIDI, что бывает редко. Цифровые аудиоформаты , такие как WAV , mp3 и ogg, используются, когда само аудио является частью анализа. Форматы с потерями, такие как mp3 и ogg, хорошо работают с человеческим ухом, но могут не содержать важных данных для изучения. Кроме того, некоторые кодировки создают артефакты, которые могут ввести в заблуждение любой автоматический анализатор. Несмотря на это, повсеместное распространение mp3 означало, что многие исследования в этой области используют их в качестве исходного материала. Все чаще метаданные , извлеченные из Интернета, включаются в MIR для более полного понимания музыки в ее культурном контексте, и в последнее время это состоит из анализа социальных тегов для музыки.

Представление функций

Анализ часто может потребовать некоторого обобщения, ^[2] и для музыки (как и для многих других форм данных) это достигается путем извлечения признаков , особенно когда анализируется сам аудиоконтент и должно применяться машинное обучение . Цель состоит в том, чтобы сократить чистое количество данных до управляемого набора значений, чтобы обучение могло быть выполнено в разумные сроки. Одной из распространенных извлеченных особенностей является коэффициент мел-частотного кепстрального сигнала (MFCC), который является мерой тембра музыкального произведения . Другие особенности могут использоваться для представления тональности , аккордов , гармоний , мелодии , основной высоты тона , ударов в минуту или ритма в произведении. Существует ряд доступных инструментов извлечения аудиопризнаков ^[3] Доступно здесь

Статистика и машинное обучение

Вычислительные методы для классификации, кластеризации и моделирования — извлечение музыкальных признаков для моно- и полифонической музыки, сходство и сопоставление с образцом , поиск
Формальные методы и базы данных — приложения автоматизированной идентификации и распознавания музыки , такие как отслеживание партитуры , автоматический аккомпанемент, маршрутизация и фильтрация музыки и музыкальных запросов, языки запросов, стандарты и другие метаданные или протоколы для обработки и поиска музыкальной информации , многоагентные системы , распределенный поиск)
Программное обеспечение для поиска музыкальной информации — Семантическая паутина и музыкальные цифровые объекты, интеллектуальные агенты , программное обеспечение для совместной работы , веб-поиск и семантический поиск, поиск по напеву / поиск по звуку , акустическая дактилоскопия
Анализ музыки и представление знаний — автоматическое реферирование , цитирование, выдержки, понижение уровня, преобразование, формальные модели музыки, цифровые партитуры и представления, индексация музыки и метаданные .

Другие вопросы

Взаимодействие человека с компьютером и интерфейсы — многомодальные интерфейсы , пользовательские интерфейсы и удобство использования , мобильные приложения , поведение пользователя
Восприятие музыки, познание, аффект и эмоции — метрики сходства музыки , синтаксические параметры, семантические параметры, музыкальные формы, структуры, стили и методологии музыкальной аннотации
Музыкальные архивы, библиотеки и цифровые коллекции — музыкальные цифровые библиотеки , открытый доступ к музыкальным архивам, эталонным и исследовательским базам данных
Права интеллектуальной собственности и музыка — национальные и международные вопросы авторского права , управление цифровыми правами , идентификация и прослеживаемость
Социология и экономика музыки — музыкальная индустрия и использование MIR в цепочке производства, распространения, потребления, профилирование пользователей, валидация, потребности и ожидания пользователей, оценка систем музыкальной IR, создание тестовых коллекций, экспериментальный дизайн и метрики

Академическая деятельность

Конференция Международного общества поиска музыкальной информации (ISMIR) является ведущей площадкой для исследований в области поиска музыкальной информации.
Международная конференция по акустике, речи и обработке сигналов (ICASSP) также является весьма актуальным мероприятием.

Смотрите также

Ссылки

^ Редакторы А. Клапури и М. Дэви. Методы обработки сигналов для музыкальной транскрипции. Springer-Verlag, Нью-Йорк, 2006.
^ Эйденбергер, Хорст (2011). «Фундаментальное понимание медиа», atpress. ISBN 978-3-8423-7917-6 .
^ Дэвид Моффат, Дэвид Ронан и Джошуа Д. Рейсс. «Оценка наборов инструментов для извлечения аудиохарактеристик». В трудах Международной конференции по цифровым аудиоэффектам (DAFx), 2016.

Майкл Фингерхут (2004). «Поиск музыкальной информации, или как искать (и, возможно, находить) музыку и избавиться от инципитов», Конгресс IAML-IASA , Осло (Норвегия), 8–13 августа 2004 г.

Внешние ссылки

Международное общество поиска музыкальной информации
Исследование поиска музыкальной информации
М. Шедл, Э. Гомес и Х. Урбано: Поиск музыкальной информации: последние разработки и приложения
Интеллектуальные аудиосистемы: основы и применение поиска музыкальной информации, вводный курс в Центре компьютерных исследований в области музыки и акустики Стэнфордского университета
Мишлин Лесаффр: Поиск музыкальной информации: концептуальная основа, аннотация и поведение пользователя.
Imagine Research: разрабатывает платформу и программное обеспечение для приложений MIR
AudioContentAnalysis.org: ресурсы MIR и код Matlab
Минц Вон, Янне Спейкервет и Кеунву Чой: Учебное пособие — Классификация музыки: за пределами контролируемого обучения, на пути к реальному применению

Примеры приложений MIR

Musipedia — поисковая система мелодий, предлагающая несколько режимов поиска, включая свист, постукивание, клавиатуру фортепиано и код Парсонса.
Peachnote — поисковая система мелодий и средство просмотра n-грамм, осуществляющее поиск по оцифрованным музыкальным партитурам.