stringtranslate.com

Преобразование кодирования

Кодирование с преобразованием — это тип сжатия «естественных» данных, таких как аудиосигналы или фотографические изображения . Преобразование обычно происходит без потерь (совершенно обратимо) само по себе, но используется для обеспечения лучшего (более целенаправленного) квантования , что затем приводит к получению копии исходного ввода более низкого качества ( сжатие с потерями ).

При кодировании с преобразованием информация о приложении используется для выбора информации, которую следует отбросить, тем самым снижая пропускную способность . Оставшуюся информацию затем можно сжать различными методами. Когда выходные данные декодируются, результат может не быть идентичен исходному входному, но ожидается, что он будет достаточно близок для целей приложения.

Цветной телевизор

NTSC

Одна из наиболее успешных систем кодирования с преобразованием обычно не упоминается как таковая — например, цветное телевидение NTSC . После обширной серии исследований в 1950-х годах Альда Бедфорд показала, что человеческий глаз имеет высокое разрешение только для черного и белого цветов, несколько меньше для цветов «среднего диапазона», таких как желтый и зеленый, и гораздо меньше для цветов на конце диапазона. спектр, красный и синий.

Использование этих знаний позволило RCA разработать систему, в которой они отбрасывали большую часть синего сигнала после того, как он исходит от камеры, сохраняя большую часть зеленого и только часть красного; это субдискретизация цветности в цветовом пространстве YIQ .

В результате получается сигнал со значительно меньшим содержанием, который вписывается в существующие черно-белые сигналы 6 МГц в качестве фазомодулированного дифференциального сигнала. Средний телевизор отображает эквивалент 350 пикселей в строке, но телевизионный сигнал содержит достаточно информации только для примерно 50 пикселей синего цвета и, возможно, 150 пикселей красного цвета. В большинстве случаев это не очевидно для зрителя, поскольку глаз все равно мало использует «недостающую» информацию.

ПАЛ и СЕКАМ

Системы PAL и SECAM используют почти идентичные или очень похожие методы передачи цвета. В любом случае обе системы являются субдискретными.

Цифровой

Этот термин гораздо чаще используется в цифровых медиа и цифровой обработке сигналов . Наиболее широко используемым методом кодирования с преобразованием в этом отношении является дискретное косинусное преобразование (ДКП), [1] [2], предложенное Насиром Ахмедом в 1972 году, [3] [4] и представленное Ахмедом совместно с Т. Натараджан и К. Р. Рао в 1974. [5] Это ДКП в контексте семейства дискретных косинусных преобразований называется ДКП-II. Это основа общего стандарта сжатия изображений JPEG [6] , который исследует небольшие блоки изображения и преобразует их в частотную область для более эффективного квантования (с потерями) и сжатия данных . При кодировании видео стандарты H.26x и MPEG модифицируют этот метод сжатия изображения DCT по кадрам движущегося изображения с использованием компенсации движения , еще больше уменьшая размер по сравнению с серией JPEG.

При кодировании звука сжатие звука MPEG анализирует преобразованные данные в соответствии с психоакустической моделью , которая описывает чувствительность человеческого уха к частям сигнала, аналогично телевизионной модели. MP3 использует гибридный алгоритм кодирования, сочетающий модифицированное дискретное косинусное преобразование (MDCT) и быстрое преобразование Фурье (FFT). [7] На смену ему пришла технология Advanced Audio Coding (AAC), которая использует чистый алгоритм MDCT для значительного повышения эффективности сжатия. [8]

Основной процесс оцифровки аналогового сигнала — это своего рода кодирование с преобразованием, в котором в качестве преобразования используется выборка в одном или нескольких доменах.

Смотрите также

Рекомендации

  1. ^ Мухахари, Д.; Мондал, Эй Джей; Пармар, РС; Бора, AD; Маджумдер, А. (2015). «Упрощенный подход к проектированию для эффективного расчета DCT». 2015 Пятая Международная конференция по системам связи и сетевым технологиям . стр. 483–487. дои :10.1109/CSNT.2015.134. ISBN 978-1-4799-1797-6. S2CID  16411333.
  2. ^ Чен, Вай Кай (2004). Справочник по электротехнике. Эльзевир . п. 906. ИСБН 9780080477480.
  3. ^ Ахмед, Насир (январь 1991 г.). «Как я придумал дискретное косинусное преобразование». Цифровая обработка сигналов . 1 (1): 4–5. дои : 10.1016/1051-2004(91)90086-Z.
  4. ^ Станкович, Радомир С.; Астола, Яакко Т. (2012). «Воспоминания о ранней работе в DCT: интервью с К.Р. Рао» (PDF) . Отпечатки первых дней информационных наук . 60 . Проверено 13 октября 2019 г.
  5. ^ Ахмед, Насир ; Натараджан, Т.; Рао, КР (январь 1974 г.), «Дискретное косинусное преобразование», Транзакции IEEE на компьютерах , C-23 (1): 90–93, doi : 10.1109/TC.1974.223784, S2CID  149806273
  6. ^ «T.81 – Цифровое сжатие и кодирование неподвижных изображений с непрерывным тоном – Требования и рекомендации» (PDF) . ССИТТ . Сентябрь 1992 года . Проверено 12 июля 2019 г.
  7. ^ Гукерт, Джон (весна 2012 г.). «Использование БПФ и MDCT в сжатии аудио MP3» (PDF) . Университет Юты . Проверено 14 июля 2019 г.
  8. ^ Бранденбург, Карлхайнц (1999). «Объяснение MP3 и AAC» (PDF) . Архивировано (PDF) из оригинала 13 февраля 2017 г.