Базовый формат медиафайлов ISO ( ISOBMFF ) — это формат файла-контейнера , который определяет общую структуру файлов, содержащих мультимедийные данные с привязкой ко времени, такие как видео и аудио. [4] [5] Он стандартизирован в ISO / IEC 14496-12, также известном как MPEG-4, часть 12, и ранее также публиковался как ISO/IEC 15444-12, также известный как JPEG 2000, часть 12.
Он разработан как гибкий, расширяемый формат, который облегчает обмен, управление, редактирование и представление мультимедийных данных. Презентация может быть локальной, через сеть или другой механизм доставки потока. Формат файла разработан таким образом, чтобы быть независимым от какого-либо конкретного сетевого протокола, но при этом обеспечивать их поддержку в целом. [5]
Этот формат стал очень широко использоваться для хранения медиафайлов и в качестве основы для различных других форматов медиафайлов (например, форматов контейнеров MP4 и 3GP ), а его широкое использование было отмечено премией « Эмми в области технологий и инженерии», врученной 4 ноября 2021 года организацией Национальная академия телевизионных искусств и наук . [6] [7] [8]
Базовый формат медиафайлов ISO напрямую основан на формате контейнера Apple QuickTime . [9] [10] [11] [12] [13] Он был разработан MPEG (в ISO/IEC JTC 1/SC 29 , первоначально Рабочая группа 11 MPEG, в настоящее время Рабочая группа 3 MPEG Systems). Первая спецификация формата файла MP4 была создана на основе спецификации формата QuickTime, опубликованной в 2001 году. [14] Формат файла MP4, известный как «версия 1», был опубликован в 2001 году как ISO/IEC 14496-1:2001 как пересмотренная версия MPEG-4 Часть 1: Системы. [15] [16] [17] В 2003 году первая версия формата файла MP4 была пересмотрена и заменена MPEG-4 Part 14: формат файла MP4 (ISO/IEC 14496-14:2003), широко известный как MPEG- 4 файла формата «версия 2». [18]
Формат файла MP4 был обобщен в базовый формат медиафайлов ISO (ISO/IEC 14496-12:2004 или ISO/IEC 15444-12:2004), который определяет общую структуру медиафайлов с временной привязкой. Он используется в качестве основы для других форматов файлов этого семейства, таких как MP4, 3GP и Motion JPEG 2000 ). [9]
Исторически текст также публиковался как ISO/IEC 15444-12 (JPEG 2000, часть 12), хотя версия стандарта JPEG 2000 была отозвана в январе 2017 года, поскольку она была избыточной по сравнению с публикацией MPEG-4. [19] [20]
Базовый формат медиафайлов ISO разработан как расширяемый формат файлов. Список всех зарегистрированных расширений базового формата медиафайлов ISO опубликован на официальном веб-сайте органа регистрации www.mp4ra.org. [35] Органом регистрации кодовых точек (значений идентификаторов) в файлах «семейства MP4» является компания Apple Inc., название которой указано в Приложении D (справочное) к MPEG-4, часть 12. [10] Разработчики кодеков должны регистрировать коды. они изобретают, но регистрация не является обязательной [36] и некоторые из изобретенных и используемых кодовых точек не регистрируются. [37] Когда кто-то создает новую спецификацию, основанную на базовом формате медиафайлов ISO, все существующие спецификации должны использоваться как в качестве примеров, так и в качестве источника определений и технологий. Если существующая спецификация уже описывает, как определенный тип мультимедиа хранится в формате файла (например, аудио MPEG-4 или видео в MP4), следует использовать это определение, а не изобретать новое. [10]
MPEG стандартизировал ряд спецификаций, расширяющих базовый формат медиафайлов ISO: Формат файлов MP4 (ISO/IEC 14496-14) определил некоторые расширения базового формата медиафайлов ISO для поддержки визуальных/аудиокодеков MPEG-4 и различных MPEG-4. Системные функции, такие как дескрипторы объектов и описания сцен. Стандарт MPEG-4 Part 3 (MPEG-4 Audio) также определяет хранение некоторых форматов сжатия звука. Хранение аудио MPEG-1/2 ( MP3 , MP2 , MP1 ) в базовом формате медиафайлов ISO было определено в ISO/IEC 14496-3:2001/Amd 3:2005. [38] Формат файлов Advanced Video Coding (AVC) (ISO/IEC 14496-15) определяет поддержку сжатия видео H.264/MPEG-4 AVC . [39] Высокоэффективный формат файлов изображений (HEIF) представляет собой формат контейнера изображений, в основе которого лежит базовый формат медиафайлов ISO. Хотя HEIF можно использовать с любым форматом сжатия изображений, он, в частности, включает поддержку изображений с внутренним кодированием HEVC и последовательностей изображений с кодированием HEVC, использующих преимущества межкадрового предсказания.
Некоторые из вышеупомянутых расширений стандарта MPEG используются другими форматами, основанными на базовом формате медиафайлов ISO (например, 3GP). [34] Спецификация формата файла 3GPP (.3gp) также определила расширения для поддержки видео H.263 , AMR-NB , AMR-WB , аудио AMR-WB+ и синхронизированного текста 3GPP в файлах на основе базового формата медиафайлов ISO. [40] Формат файла 3GPP2 (.3g2) определяет расширения для использования форматов сжатия голоса EVRC , SMV или 13K ( QCELP ). [34] Спецификация JPEG 2000 (ISO/IEC 15444-3) определяет использование сжатия видео Motion JPEG 2000 и несжатого звука ( PCM ) в базовом формате медиафайлов ISO (.mj2). «Формат файла DVB» (.dvb), определенный проектом DVB, позволял хранить службы DVB в базовом формате медиафайлов ISO. Он позволяет хранить аудио, видео и другой контент любым из трех основных способов: инкапсулировать в транспортный поток MPEG , хранить в виде дорожки подсказки приема; инкапсулируется в поток RTP , сохраняется как дорожка подсказки о приеме или сохраняется непосредственно как дорожки мультимедиа. [41] [42] Формат файла MPEG-21 (.m21, .mp21) определял хранение цифрового объекта MPEG-21 в базовом формате медиафайла ISO с некоторыми или всеми его вспомогательными данными (такими как фильмы, изображения или другие данные, отличные от XML) в одном файле. [43] [44] Спецификация формата контента OMA DRM (.dcf) от Open Mobile Alliance определила формат контента для зашифрованных медиа-объектов, защищенных DRM , и связанных с ними метаданных. [45] [46] Существуют также другие расширения, такие как спецификация ISMA ISMACryp для зашифрованного/защищенного аудио и видео, [47] [48] спецификация сжатия звука G.719 , [49] сжатие звука AC3 и E-AC-3. , [50] Сжатие звука DTS , [51] Сжатие видео Dirac , [52] [53] Спецификация сжатия видео VC-1 и другие, названия которых указаны на веб-сайте органа регистрации MP4. [35]
Существуют некоторые расширения базового формата медиафайлов ISO, которые не были зарегистрированы органом регистрации MP4. Adobe Systems представила формат файлов F4V для Flash Video в 2007 году и заявила, что он основан на базовом формате медиафайлов ISO. Формат файла F4V не был зарегистрирован органом регистрации MP4, но техническая спецификация F4V общедоступна. Этот формат может содержать сжатие видео H.264 и сжатие аудио MP3 или AAC. Кроме того, формат файла F4V может содержать данные, соответствующие формату сообщения ActionScript , а также неподвижный кадр видеоданных с использованием форматов изображений GIF , JPEG и PNG. [37] [54] [55] В 2009 году корпорация Microsoft анонсировала формат файлов, основанный на базовом формате мультимедийных файлов ISO, под названием ISMV (формат плавной потоковой передачи), также известный как защищенный совместимый формат файлов (PIFF). Как было объявлено, этот формат может, например, содержать форматы сжатия VC-1, WMA , H.264 и AAC. [56] В 2010 году Microsoft опубликовала спецификацию защищенного взаимодействующего формата файлов (PIFF). Она определила еще один вариант использования нескольких систем шифрования и DRM в одном файловом контейнере. [57] [58] Бренд PIFF был зарегистрирован органом регистрации MP4 в 2010 году. Некоторые расширения, используемые в этом формате (например, для поддержки WMA), не были зарегистрированы. Использование формата сжатия WMA в базовом формате медиафайлов ISO не было публично задокументировано. [59]
Базовый формат медиафайлов ISO включает в себя синхронизацию, структуру и медиаинформацию для синхронизированных последовательностей медиаданных, таких как аудиовизуальные презентации. Структура файла объектно-ориентированная. Файл очень просто можно разложить на базовые объекты, причем структура объектов вытекает из их типа.
Файлы, соответствующие базовому формату медиафайлов ISO, формируются как серия объектов, называемых «коробками». Все данные содержатся в полях, других данных в файле нет. Сюда входит любая первоначальная подпись, необходимая для конкретного формата файла. «Коробка» — это объектно-ориентированный строительный блок, определяемый уникальным идентификатором типа и длиной. В некоторых спецификациях (например, в первом определении формата файла MP4) его называли «атомом». [4]
Презентация (последовательность движений) может содержаться в нескольких файлах. Вся информация о времени и кадре (положение и размер) должна находиться в базовом медиафайле ISO, а вспомогательные файлы могут использовать практически любой формат. [4]
Чтобы определить спецификации, которым соответствует файл, основанный на базовом формате медиафайла ISO, в качестве идентификаторов в формате файла используются «бренды». Они устанавливаются в поле с именем «box type of file» («ftyp»), которое должно быть размещено в начале файла. Он в некоторой степени аналогичен так называемому коду fourcc , используемому с аналогичной целью для носителей, встроенных в формат контейнера AVI . [60] Торговая марка может указывать тип используемой кодировки, способ хранения данных каждой кодировки, ограничения и расширения, применяемые к файлу, совместимость или предполагаемое использование файла. Бренды представляют собой печатные четырехзначные коды. Поле типа файла содержит два типа брендов. Одним из них является «major_brand», который определяет спецификацию наилучшего использования файла. За ним следует «minor_version», информативное 4-байтовое целое число для второстепенной версии основного бренда. Второй тип бренда — «совместимые_бренды», который идентифицирует несколько спецификаций, которым соответствует файл. Все файлы должны содержать поле типа файла, но по соображениям совместимости с более ранней версией спецификации файлы могут соответствовать базовому формату медиафайлов ISO/IEC и не содержать поля типа файла. В этом случае их следует читать так, как если бы они содержали ftyp с основным и совместимым брендом «mp41» (MP4 v1 – ISO 14496-1, глава 13). [4] Некоторые используемые бренды (ftyps) не зарегистрированы, и их можно найти на некоторых веб-страницах. [37]
Мультимедийный файл, структурированный на основе базового формата медиафайла ISO/IEC, может быть совместим с более чем одной конкретной спецификацией, и поэтому не всегда возможно говорить об одном «типе» или «марке» файла. В связи с этим несколько снижается полезность типа «Многоцелевое расширение почты Интернета» и расширения имени файла. Несмотря на это, при написании производной спецификации будет использоваться новое расширение файла, новый тип MIME и новый тип файла Macintosh. [4]
Базовый формат медиафайлов ISO/IEC поддерживает потоковую передачу мультимедийных данных по сети, а также локальное воспроизведение. Файл, поддерживающий потоковую передачу, включает в себя информацию о единицах данных для потоковой передачи (как обслуживать данные элементарного потока в файле по протоколам потоковой передачи). Эта информация помещается в дополнительные дорожки файла, называемые дорожками-подсказками. В один и тот же файл могут быть включены отдельные треки «подсказок» для разных протоколов. Медиафайлы будут воспроизводиться по всем таким протоколам без создания каких-либо дополнительных копий или версий медиаданных. Существующие медиафайлы можно легко сделать потоковыми для других конкретных протоколов, добавив соответствующие дорожки подсказок. Сами медиаданные не нуждаются в каком-либо переформатировании. Потоки, отправляемые серверами под управлением треков подсказок, не должны содержать никаких следов информации, специфичной для файла. Если презентация воспроизводится локально (не в потоковом режиме), дорожки-подсказки могут игнорироваться. Дорожки подсказок могут быть созданы с помощью инструмента создания подсказок или могут быть добавлены в существующий файл (презентацию) с помощью инструмента подсказок. [4] В носителях, созданных для последовательной загрузки, поле moov , содержащее индекс кадров, должно предшествовать полю mdat данных фильма . [61]
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ){{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ){{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ){{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка )