MUSE ( Multiple sub-Nyquist Sampling Encoding ), [1] коммерчески известная как Hi-Vision (сокращение от HI gh-definition tele VISION ) [1] была японской аналоговой телевизионной системой высокой четкости , разработка которой началась в 1979 году. [2]
Он использовал чересстрочную развертку и цифровое видеосжатие для доставки сигналов 1125 строк, 60 полей в секунду (1125i60) [2] в дом. Система была стандартизирована как рекомендация ITU -R BO.786 [3] и специфицирована SMPTE 260M, [4] используя матрицу колориметрии, специфицированную SMPTE 240M. [5] Как и в других аналоговых системах, не все строки несут видимую информацию. В MUSE имеется 1035 активных чересстрочных строк, поэтому эта система иногда также упоминается как 1035i . [6] MUSE использовала 2-мерную фильтрацию, чересстрочную развертку, компенсацию вектора движения и последовательное кодирование цвета со сжатием по времени, чтобы «сложить» или сжать исходный сигнал источника Hi-Vision с полосой пропускания 30 МГц всего до 8,1 МГц.
Япония начала вещание широкополосных аналоговых сигналов HDTV в декабре 1988 года, [7] изначально с соотношением сторон 2:1. Видеосистема высокой четкости Sony HDVS использовалась для создания контента для системы MUSE, но не записывала сигналы MUSE. [2] Она записывала сигналы Hi-Vision, которые не были сжаты. К моменту его коммерческого запуска в 1991 году цифровое HDTV уже находилось в стадии разработки в Соединенных Штатах . Hi-Vision MUSE в основном транслировался NHK через их спутниковый телеканал BShi , хотя другие каналы, такие как WOWOW, TV Asahi, Fuji Television, TBS Television, Nippon Television и TV Tokyo, также вещали в MUSE. [8] [9] [10]
20 мая 1994 года компания Panasonic выпустила первый проигрыватель MUSE LaserDisc . [11] Также были доступны несколько проигрывателей от других брендов, таких как Pioneer и Sony .
Hi-Vision продолжал вещание в аналоговом формате через NHK до 2007 года. Другие каналы прекратили вещание вскоре после 1 декабря 2000 года, поскольку они перешли на цифровые сигналы HD в ISDB, японском стандарте цифрового вещания. [12]
MUSE была разработана научно-исследовательскими лабораториями NHK в 1980-х годах как система сжатия сигналов Hi-Vision HDTV.
«1125 строк» MUSE — это аналоговое измерение, которое включает в себя строки сканирования, не относящиеся к видео, которые появляются, когда электронный луч ЭЛТ возвращается в верхнюю часть экрана, чтобы начать сканирование следующего поля. Только 1035 строк содержат информацию об изображении. Цифровые сигналы учитывают только строки (строки пикселей), которые имеют фактическую детализацию, поэтому 525 строк NTSC становятся 486i (округленными до 480 для совместимости с MPEG), 625 строк PAL становятся 576i, а MUSE будет 1035i. Чтобы преобразовать полосу пропускания Hi-Vision MUSE в «обычные» строки горизонтального разрешения (как это используется в мире NTSC), умножьте 29,9 строк на МГц полосы пропускания. (NTSC и PAL/SECAM имеют 79,9 строк на МГц) — этот расчет 29,9 строк работает для всех современных систем HD, включая Blu-ray и HD-DVD. Итак, для MUSE во время неподвижного изображения строки разрешения будут: 598 строк разрешения яркости на высоту изображения. Разрешение цветности: 209 строк. Горизонтальное измерение яркости приблизительно соответствует вертикальному разрешению чересстрочного изображения 1080, если принять во внимание фактор Келла и фактор чересстрочной развертки. 1125 строк были выбраны в качестве компромисса между разрешением в строках NTSC и PAL и последующим удвоением этого числа. [21]
MUSE использует интеграцию сжатия по времени (TCI), что является другим термином для мультиплексирования с разделением по времени, которое используется для передачи яркости, цветности, аудио PCM и сигналов синхронизации на одном несущем сигнале/на одной несущей частоте. Однако TCI достигает мультиплексирования путем сжатия содержимого во временном измерении, другими словами, передавая кадры видео, которые разделены на области с цветностью, сжатой в левой части кадра, и яркостью, сжатой в правой части кадра, которые затем должны быть расширены и наложены слоями для создания видимого изображения. [14] Это отличает его от NTSC, который передает яркость, аудио и цветность одновременно на нескольких несущих частотах. [22] [23] Сигналы Hi-Vision представляют собой аналоговые компонентные видеосигналы с 3 каналами, которые изначально были RGB, а позже YP b P r . Стандарт Hi-Vision нацелен на работу как с сигналами RGB, так и с сигналами YP b P r . [14] [24] [25]
Основные характеристики системы MUSE:
Сигнал яркости MUSE кодируется как следующая смесь исходных цветовых каналов RGB: [3]
Сигнал цветности кодирует и разностные сигналы. Используя эти три сигнала ( , и ), приемник MUSE может извлечь исходные компоненты цвета RGB, используя следующую матрицу: [3]
Система использовала колориметрическую матрицу, определенную SMPTE 240M [5] [26] [27] (с коэффициентами, соответствующими основным цветам SMPTE RP 145, также известным как SMPTE-C , использовавшимся во время создания стандарта). [28] Хроматичности основных цветов и точки белого следующие: [27] [5]
Функция яркости ( ) определяется как: [5]
Разница синего цвета ( ) масштабируется по амплитуде ( ), согласно: [5]
Разница красного цвета ( ) масштабируется по амплитуде ( ), согласно: [5]
MUSE — это система из 1125 строк (1035 видимых), которая несовместима по импульсу и синхронизации с цифровой системой из 1080 строк, используемой современным HDTV. Первоначально это была система из 1125 строк, чересстрочная, 60 Гц, с соотношением сторон 5:3 [14] (1,66:1) и оптимальным расстоянием просмотра примерно 3,3H. В 1989 году соотношение сторон было изменено на 16:9. [29] [30] [31]
Для наземной передачи MUSE была разработана система FM с ограниченной полосой пропускания. Спутниковая система передачи использует несжатый FM.
Перед сжатием MUSE полоса пропускания сигнала Hi-Vision уменьшается с 30 МГц для яркости и цветности до полосы пропускания до сжатия 20 МГц для яркости, а полоса пропускания до сжатия для цветности составляет несущую 7,425 МГц.
Первоначально японцы исследовали идею частотной модуляции традиционно сконструированного композитного сигнала. Это создало бы сигнал, аналогичный по структуре композитному видеосигналу NTSC — с ( яркостью ) на нижних частотах и ( цветностью ) выше. Потребовалось бы около 3 кВт мощности, чтобы получить отношение сигнал/шум 40 дБ для композитного FM-сигнала в диапазоне 22 ГГц. Это было несовместимо с методами спутникового вещания и полосой пропускания.
Чтобы преодолеть это ограничение, было решено использовать раздельную передачу и . Это уменьшает эффективный диапазон частот и снижает требуемую мощность. Примерно 570 Вт (360 для и 210 для ) потребовалось бы для того, чтобы получить отношение сигнал/шум 40 дБ для отдельного FM-сигнала в спутниковом диапазоне 22 ГГц. Это было осуществимо.
Есть еще одна экономия энергии, которая вытекает из характера человеческого глаза. Отсутствие визуальной реакции на низкочастотный шум позволяет значительно снизить мощность транспондера, если более высокие видеочастоты подчеркиваются до модуляции на передатчике, а затем ослабляются на приемнике. Этот метод был принят, с частотами кроссовера для усиления/уменьшения усиления на 5,2 МГц для и 1,6 МГц для . При этом требования к мощности снижаются до 260 Вт мощности (190 для и 69 для ).
Подвыборка в видеосистеме обычно выражается как трехчастное отношение. Три члена отношения: число выборок яркости (luma) , за которым следует число выборок двух цветовых (chroma) компонентов и , для каждой полной области выборки. Традиционно значение яркости всегда равно 4, а остальные значения масштабируются соответствующим образом.
Выборка 4:4:4 указывает на то, что все три компонента полностью выбраны. Например, выборка 4:2:0 указывает на то, что два компонента цветности выбраны с частотой, равной половине горизонтальной частоты выборки яркости — горизонтальное разрешение цветности уменьшается вдвое. Это уменьшает полосу пропускания несжатого видеосигнала на одну треть.
MUSE реализует похожую систему как средство сокращения полосы пропускания, но вместо статической выборки фактическое соотношение меняется в зависимости от количества движения на экране. На практике выборка MUSE будет варьироваться от приблизительно 4:2:1 до 4:0,5:0,25 в зависимости от количества движения. Таким образом, красно-зеленый компонент цветности имеет от половины до одной восьмой разрешения выборки компонента яркости , а сине-желтый компонент цветности имеет половину разрешения красно-зеленого.
MUSE имела дискретную 2- или 4-канальную цифровую аудиосистему под названием « DANCE », что расшифровывалось как Digital Audio Near-instantaneous Compression and Expansion (почти мгновенное сжатие и расширение цифрового звука) .
Он использовал дифференциальную передачу звука ( дифференциальную импульсно-кодовую модуляцию ), которая не была основана на психоакустике, как MPEG-1 Layer II . Он использовал фиксированную скорость передачи 1350 кбит/с. Как и стереосистема PAL NICAM , он использовал почти мгновенное компандирование (в отличие от силлабического компандирования, которое использует система dbx ) и нелинейное 13-битное цифровое кодирование с частотой дискретизации 32 кГц .
Он также мог работать в 48 кГц 16-битном режиме. Система DANCE была хорошо документирована в многочисленных технических документах NHK и в изданной NHK книге, выпущенной в США под названием Hi-Vision Technology . [32]
Аудиокодек DANCE был заменен Dolby AC-3 (он же Dolby Digital ), DTS Coherent Acoustics (он же DTS Zeta 6x20 или ARTEC), MPEG-1 Layer III (он же MP3), MPEG-2 Layer I, MPEG-4 AAC и многими другими аудиокодеками. Методы этого кодека описаны в статье IEEE: [33]
В отличие от традиционного чересстрочного видео, где чересстрочная развертка выполняется построчно, показывая либо нечетные, либо четные строки видео в любой момент времени, таким образом требуя 2 поля видео для завершения видеокадра, MUSE использовал цикл четырехполевой точечной развертки [34] [14] [35] [36] [37] , то есть для завершения одного кадра MUSE требовалось четыре поля, [38] [39] а точечная развертка — это чересстрочная развертка, которая выполняется попиксельно, разделяя горизонтальное и вертикальное разрешение пополам для создания каждого поля видео, а не построчно, как в традиционном чересстрочном видео, которое уменьшает только вертикальное разрешение для создания каждого видеополя. Таким образом, в MUSE только неподвижные изображения передавались с полным разрешением. [40] [36] [41] [42] Однако, поскольку MUSE снижает горизонтальное и вертикальное разрешение материала, которое сильно меняется от кадра к кадру, движущиеся изображения были размыты. Поскольку MUSE использовала компенсацию движения, все панорамы камеры сохраняли полное разрешение, но отдельные движущиеся элементы могли быть уменьшены до четверти разрешения полного кадра. Поскольку смесь между движением и неподвижностью кодировалась на попиксельной основе, это было не так заметно, как многие могли подумать. Позже NHK придумала обратно совместимые методы кодирования/декодирования MUSE, которые значительно увеличили разрешение в движущихся областях изображения, а также увеличили разрешение цветности во время движения. Эта так называемая система MUSE-III использовалась для трансляций, начиная с 1995 года, и очень немногие из последних лазерных дисков Hi-Vision MUSE использовали ее ( A River Runs Through It — один из лазерных дисков Hi-Vision, который ее использовал). Во время ранних демонстраций системы MUSE были распространены жалобы на большой размер декодера, что привело к созданию миниатюрного декодера. [1]
Тени и многолучевое распространение по-прежнему мешают этому аналоговому режиму частотно-модулированной передачи.
С тех пор Япония перешла на цифровую систему HDTV на основе ISDB , но оригинальный спутниковый канал BS 9 (NHK BS Hi-vision) на базе MUSE транслировался до 30 сентября 2007 года.
MUSE, как его узнала американская общественность, впервые был освещен в журнале Popular Science в середине 1980-х годов. Телевизионные сети США не освещали MUSE в большом объеме до конца 1980-х годов, поскольку за пределами Японии было мало публичных демонстраций системы.
Поскольку в Японии имелись собственные внутренние таблицы распределения частот (которые были более открыты для развертывания MUSE) , к концу 1980-х годов стало возможным вещание этой телевизионной системы с помощью спутниковой технологии Ku-диапазона .
В конце 1980-х годов Федеральная комиссия по связи США (FCC) начала выпускать директивы, разрешающие испытания MUSE в США при условии, что его можно будет вписать в канал System-M шириной 6 МГц .
Европейцы (в лице Европейского вещательного союза (EBU)) были впечатлены MUSE, но так и не смогли принять его, поскольку это телевизионная система с частотой 60 Гц, а не 50 Гц, которая является стандартной в Европе и остальном мире (за исключением Америки и Японии).
Разработка EBU и внедрение B-MAC , D-MAC и гораздо позже HD-MAC стали возможны благодаря техническому успеху Hi-Vision. Во многих отношениях системы передачи MAC лучше, чем MUSE, из-за полного разделения цвета и яркости во временной области в структуре сигнала MAC.
Как и Hi-Vision, HD-MAC не мог передаваться в каналах 8 МГц без существенной модификации – и серьезной потери качества и частоты кадров. Версия Hi-Vision на 6 МГц была опробована в США, [7] но у нее также были серьезные проблемы с качеством, поэтому FCC никогда полностью не санкционировала ее использование в качестве внутреннего стандарта наземного телевидения.
Рабочая группа ATSC США , которая привела к созданию NTSC в 1950-х годах, была возобновлена в начале 1990-х годов из-за успеха Hi-Vision. Многие аспекты стандарта DVB основаны на работе, проделанной рабочей группой ATSC, однако наибольшее влияние оказала поддержка 60 Гц (а также 24 Гц для передачи фильмов), единообразных частот дискретизации и совместимых размеров экрана.
20 мая 1994 года Panasonic выпустила первый проигрыватель MUSE LaserDisc. [11] В Японии было доступно несколько проигрывателей MUSE LaserDisc : Pioneer HLD-XØ, HLD-X9, HLD-1000, HLD-V500, HLD-V700; Sony HIL-1000, HIL-C1 и HIL-C2EX; последние два из которых имеют OEM-версии, сделанные Panasonic, LX-HD10 и LX-HD20. Плееры также поддерживали стандартные NTSC LaserDiscs. Hi-Vision LaserDiscs чрезвычайно редки и дороги. [7]
Видеодисковый рекордер HDL-5800 записывал как неподвижные изображения высокой четкости, так и непрерывное видео на оптический диск и был частью ранней аналоговой широкополосной видеосистемы высокой четкости Sony HDVS , которая поддерживала систему MUSE. Возможность записи неподвижных изображений и видео высокой четкости на оптический диск WHD-3AL0 или WHD-33A0; WHD-3Al0 для режима CLV (до 10 минут видео или 18 000 неподвижных кадров на каждой стороне); WHD-33A0 для режима CAV (до 3 минут видео или 5400 неподвижных кадров на каждой стороне). [43] Эти видеодиски использовались для короткого видеоконтента, такого как реклама и демонстрации продуктов. [44]
HDL-2000 был полнодиапазонным проигрывателем видеодисков высокой четкости. [7]
Для записи сигналов Hi-Vision были выпущены три катушечных аналоговых видеомагнитофона, среди которых Sony HDV-1000, часть линейки HDVS, NEC TT 8-1000 [45] и Toshiba TVR-1000. [46]
Эти аналоговые видеомагнитофоны имели угловую скорость барабана головки 3600 об/мин и были похожи на видеомагнитофоны типа C. Они выводят видеополосу 30 МГц для каналов яркости и 7 МГц для обоих каналов цветности каждый, с отношением сигнал/шум 41 дБ. Они принимают сигналы яркости и цветности с видеополосой до 30 МГц для обоих. Видеополоса измеряется до модуляции FM. Сигналы записываются на ленту с использованием модуляции FM.
Линейная скорость ленты составляет 483,1 мм/с, а скорость записи на головках — 25,9 м/с. Ширина барабана головки составляет 134,5 мм, он имеет 4 головки видеозаписи, 4 головки видеовоспроизведения и 1 головку стирания видео. Он может записывать в течение 45 минут на 10,5-дюймовые катушки. Эти машины, в отличие от обычных видеомагнитофонов типа C, не способны показывать изображения во время паузы или воспроизведения ленты на низкой скорости. Однако они могут быть оснащены кадровым хранилищем для захвата изображений и их отображения во время быстрой перемотки ленты вперед или назад.
Видеоголовки изготовлены из ферритового материала Mn-Zn, те, которые используются для записи, имеют зазор 0,7 мкм и ширину 80 мкм, а те, которые используются для воспроизведения, имеют зазор 0,35 мкм и ширину 70 мкм. Он записывает звук на 3 линейных дорожках и сигналы управления на линейной дорожке. В отличие от обычных видеомагнитофонов типа C, вертикальные интервалы гашения не записываются на ленту. Спиральные дорожки имеют группы из 4 сигналов или каналов, расположенных бок о бок и продольно с красным цветовым сигналом, синим цветовым сигналом и двумя зелеными цветовыми сигналами с информацией о яркости. Две дорожки для зеленого цветового сигнала плюс яркость используются для увеличения полосы пропускания этих сигналов, которые могут быть записаны на ленту. Каждый из этих 4 сигналов имеет видеополосу 10 МГц.
В видеомагнитофоне используется лента из оксида железа с кобальтом для высокой коэрцитивности, с пропускной способностью 40 МГц при скорости барабана головки 3600 об/мин, что достаточно для применения модуляции FM к сигналам 10 МГц. Для одновременной записи 4 каналов на одной спиральной дорожке требуется отдельная независимая видеоголовка для каждого канала, и 4 видеоголовки группируются вместе, что создает одну спиральную дорожку с 4 каналами. [47] [48] [49] [14] [44] [24]
В 1987 году NHK выпустила технические стандарты для цифровой записи сигналов Hi-Vision, а Sony разработала видеомагнитофон HDD-1000 как часть своей линейки HDVS, а Hitachi разработала цифровой катушечный видеомагнитофон HV-1200. Звук записывается в цифровом виде аналогично цифровому аудиомагнитофону DASH ( Digital Audio Stationary Head ), но было внесено несколько изменений для синхронизации звука с видео. Эти цифровые видеомагнитофоны могут записывать 8 каналов цифрового звука на линейных дорожках (горизонтально по всей длине ленты).
Согласно стандартам, эти видеомагнитофоны работают со скоростью барабана головки 7200 об/мин для размещения более высоких полос сигнала цифровой модуляции сигнала на ленте, что также обеспечивается использованием ленты из частиц металлического сплава, имеют битрейт 148,5 Мбит/с на видеоголовку, линейную скорость ленты 805,2 мм/с и скорость записи на головках 51,5 м/с, аналогичны видеомагнитофонам типа C, имеют барабан головки шириной 135 мм, 8 головок воспроизведения видео, 8 головок записи видео и 2 головки стирания видео, с шириной спиральных дорожек 37 микрон. Полоса пропускания выходного сигнала составляет 30 МГц полосы пропускания видео для яркости (Y) и 15 МГц полосы пропускания видео для цветности (P b , P r ).
Аудио записывается с частотой дискретизации 48 кГц, сохраненной в 16 бит на сэмпл на линейных дорожках ленты, частота дискретизации для яркости составляет 74,25 МГц, а для цветности — 37,125 МГц, сохраненной в 8 бит на сэмпл. Отношение сигнал/шум составляет 56 дБ для цветности и яркости. Видеополя разделены на 16 спиральных дорожек на ленте. Общая пропускная способность видео составляет 1,188 гигабит/с. Сигналы меток записываются на 3 линейных дорожки ленты. Видео записывается группами по 4 дорожки или канала, которые расположены бок о бок в продольном направлении внутри каждой спиральной дорожки, чтобы обеспечить параллелизацию: высокие общие скорости передачи данных при относительно низких скоростях передачи данных на головку и снижение линейной скорости ленты. [44] [50] [25]
Цифровые видеосигналы записываются построчно (1 ряд пикселей в каждом кадре видео или 1 строка видео за раз) с ECC (код коррекции ошибок) в конце каждой строки и между несколькими вертикальными строками. Для ECC используется код Рида-Соломона, и каждая строка также имеет идентификационный номер для трюкового воспроизведения, такого как замедленное движение и поиск/перемещение изображения. [14]
Hi-Vision требует дисплея, способного обрабатывать 30 МГц полосы пропускания видео одновременно для каждого из компонентных видеоканалов: R, G, B или Y, P b и P r . Он отображался на цветных ЭЛТ-мониторах прямого просмотра и проекторах ЭЛТ, а плазменные дисплеи и проекторы Talaria исследовались для определения их способности отображать изображения Hi-Vision. [14] [13] Некоторые телевизоры имеют встроенные декодеры MUSE. [51]
Для захвата видеоматериалов в формате Hi-Vision использовались камеры на основе трубок Saticon, Plumbicon, Harpicon и датчиков изображения CCD. [14] [13] [52] Также был создан прототип на основе трубок Vidicon. [53] [54]
Декодер MUSE необходим для приема трансляций MUSE со спутников и для просмотра контента в формате MUSE. Декодер преобразует сигналы формата MUSE в компонентные видеосигналы Hi-Vision, которые затем могут быть показаны на дисплее. [14]
W-VHS позволял записывать программы Hi-Vision в домашних условиях.
Для записи видеосигналов Hi-Vision NHK и 10 японских компаний («NEC, Matsushita Electric Industrial, Toshiba, Sharp, Sony, Hitachi, Sanyo Electric, JVC, Mitsubishi Electric, Canon») [55] в 1989 году выпустили UniHi — профессиональный формат видеокассет. [56] Рекордеры для этого формата производили Panasonic, Sony, NEC, [57] [58] и Toshiba. [59] Эти машины были дешевле своих аналогов Type C. [59] Выпускались как студийные, так и портативные версии.
Головной барабан вращается со скоростью 5400 об/мин и использует ленту шириной 12,65 мм. Он имеет полосу пропускания яркости (Y) 20 МГц и полосу пропускания цветности (P b , P r ) 7 МГц для видеовыхода. Видео записывается в аналоговой форме. Головной барабан имеет ширину 76 мм. Он использует две видеоголовки с азимутальной записью и записывает каждый кадр видео на 12 спиральных дорожек; для каждого видеополя при записи чересстрочного видео необходимо всего 6 дорожек. [14] Звук записывается в цифровом виде как сигнал PCM, как раздел на спиральных дорожках. Скорость записи на головках составляет 21,4 м/с.
Лента также имеет 3 линейные дорожки, по одной для звука, управления и временного кода. Отношение сигнал/шум для яркости составляет 41 дБ, а для цветности — 47 дБ. Лента намотана на 180° вокруг барабана головки. Разработка началась в 1987 году. [44] [60] [61] [62] Используется лента с металлическими частицами. [47] Видео можно записывать в течение 1 часа (63 минуты). [14] [50] [63] Линейная скорость ленты составляет 120 мм/с. [14] Размеры кассеты 205 мм (ширина) x 121 мм (глубина) x 25 мм (высота). Сигналы записываются с использованием временной компрессионной интеграции, группами по два сигнала по длине на каждой спиральной дорожке. Группировка используется для увеличения полосы пропускания, которая может быть записана на ленту. Кассета должна быть герметичной, в отверстии кассеты имеются два клапана для защиты ленты. [14]
Этот формат видеокассет был разработан для того, чтобы уменьшить размер оборудования для записи HD. [44] Версия Sony видеомагнитофона UniHi, HDV-10, стоила более 90 000 долларов США. [59]
Аналоговые телевизионные системы, которые должны были заменить эти системы:
Сопутствующие стандарты: