stringtranslate.com

Насир Ахмед (инженер)

Насир Ахмед (родился в 1940 году) — индийско-американский инженер-электрик и компьютерный учёный. Он является почётным профессором электротехники и вычислительной техники в Университете Нью-Мексико (UNM). Он наиболее известен изобретением дискретного косинусного преобразования (DCT) в начале 1970-х годов. DCT является наиболее широко используемым преобразованием сжатия данных , основой для большинства стандартов цифровых медиа ( изображений , видео и аудио ) и широко используется в цифровой обработке сигналов . Он также описал дискретное синусное преобразование (DST), которое связано с DCT. [1]

Дискретное косинусное преобразование (ДКП)

Дискретное косинусное преобразование (DCT) — это алгоритм сжатия с потерями , который впервые был задуман Ахмедом во время работы в Университете штата Канзас , и он предложил эту технику Национальному научному фонду в 1972 году. Первоначально он предназначал DCT для сжатия изображений . [2] [3] Ахмед разработал рабочий алгоритм DCT со своим аспирантом Т. Натараджаном и другом К. Р. Рао в 1973 году, [2] и они представили свои результаты в статье в январе 1974 года. [4] [5] [6] Он описал то, что сейчас называется DCT типа II (DCT-II), [7] : 51  , а также его обратное, DCT типа III (также известное как IDCT). [4]

Ахмед был ведущим автором эталонной публикации [8] [9] Discrete Cosine Transform (совместно с Т. Натараджаном и К. Р. Рао), [4] , которая упоминалась как фундаментальное развитие во многих работах [10] с момента ее публикации. Основная исследовательская работа и события, которые привели к разработке DCT, были обобщены в более поздней публикации Ахмеда под названием «Как я придумал Discrete Cosine Transform». [2]

DCT широко используется для сжатия цифровых изображений . [11] [12] [13] Это основной компонент технологии сжатия изображений JPEG 1992 года , разработанной рабочей группой JPEG Experts Group [14] и стандартизированной совместно ITU , [ 15] ISO и IEC . Обсуждение руководства по использованию DCT для достижения сжатия цифрового видео в различных международных стандартах, определенных ITU и MPEG (Moving Picture Experts Group), доступно в статье KR Rao и JJ Hwang [16] : JPEG: Глава 8; H.261: Глава 9; MPEG-1: Глава 10; MPEG-2: Глава 11,  которая была опубликована в 1996 году, а обзор был представлен в двух публикациях 2006 года Яо Вана . [17] [18] Свойства сжатия изображений и видео с помощью DCT привели к тому, что он стал неотъемлемым компонентом следующих широко используемых международных стандартных технологий:

Форма DCT, используемая в приложениях сжатия сигналов, иногда упоминается как DCT-2 в контексте семейства дискретных косинусных преобразований [19] или как DCT-II .

Более поздние стандарты использовали целочисленные преобразования, которые имеют схожие свойства с DCT, но явно основаны на целочисленной обработке, а не определяются тригонометрическими функциями. [20] В результате того, что эти преобразования имеют схожие свойства симметрии с DCT и являются, в некоторой степени, приближениями DCT, их иногда называют преобразованиями «целочисленного DCT». Такие преобразования используются для сжатия видео в следующих технологиях, относящихся к более поздним стандартам. Конструкции «целочисленного DCT» концептуально похожи на обычное DCT, но упрощены для обеспечения точно заданного декодирования с уменьшенной вычислительной сложностью .

Вариант DCT, модифицированное дискретное косинусное преобразование (MDCT), используется в современных форматах сжатия звука, таких как MP3 , [21] Advanced Audio Coding (AAC) и Vorbis (OGG).

Дискретное синусоидальное преобразование (DST) выводится из DCT путем замены условия Неймана при x=0 на условие Дирихле . [7] : 35  DST было описано в статье 1974 года Ахмеда, Натараджана и Рао. [4]

Позже Ахмед участвовал в разработке алгоритма сжатия DCT без потерь с Гиридхаром Мандьямом и Нираджем Маготрой в Университете Нью-Мексико в 1995 году. Это позволяет использовать технику DCT для сжатия изображений без потерь. Это модификация оригинального алгоритма DCT, включающая элементы обратного DCT и дельта-модуляции . Это более эффективный алгоритм сжатия без потерь, чем энтропийное кодирование . [22]

Фон

Книги

Массовая культура

В 5 сезоне 8 серии сериала «Это мы» на канале NBC история Ахмеда была рассказана, чтобы подчеркнуть важность передачи изображений и видео через Интернет в современном обществе, особенно во время пандемии COVID-19 . Эпизод заканчивается фотографией Ахмеда и его жены, а также подписями, объясняющими важность его работы, и тем, что продюсеры говорили с парой по видеочату, чтобы понять их историю и включить ее в эпизод. [23]

Ссылки

  1. ^ "Кто такой Насир Ахмед? Реальная история любви индийско-американского инженера из "Это мы", который указан в титрах за алгоритм .jpg". meaww.com . 17 февраля 2021 г. . Получено 8 апреля 2022 г. .
  2. ^ abc Ахмед, Насир (январь 1991). «Как я придумал дискретное косинусное преобразование». Цифровая обработка сигналов . 1 (1): 4–5. Bibcode :1991DSP.....1....4A. doi :10.1016/1051-2004(91)90086-Z.
  3. ^ Станкович, Радомир С.; Астола, Яакко Т. (2012). «Воспоминания о ранней работе в области DCT: интервью с К. Р. Рао» (PDF) . Перепечатки с ранних дней информационных наук . 60. Международный центр обработки сигналов в Тампере. ISBN 978-9521528187. ISSN  1456-2774. Архивировано (PDF) из оригинала 30 декабря 2021 г. . Получено 30 декабря 2021 г. – через ETHW .
  4. ^ abcd —; Натараджан, Т. Радж; Рао, КР (1 января 1974 г.). «Дискретное косинусное преобразование». Транзакции IEEE на компьютерах . С-23 (1). Компьютерное общество IEEE: 90–93. дои : 10.1109/TC.1974.223784. eISSN  1557-9956. ISSN  0018-9340. LCCN  75642478. OCLC  1799331. S2CID  39023640.
  5. ^ Рао, К. Рамамохан ; Йип, Патрик К. (11 сентября 1990 г.). Дискретное косинусное преобразование: алгоритмы, преимущества, приложения . Обработка сигналов, изображений и речи. Academic Press . arXiv : 1109.0337 . doi : 10.1016/c2009-0-22279-3. ISBN 978-0125802031. LCCN  89029800. OCLC  1008648293. ОЛ  2207570М. S2CID  12270940.
  6. ^ "T.81 – Цифровое сжатие и кодирование неподвижных изображений с непрерывным тоном – требования и рекомендации" (PDF) . CCITT . Сентябрь 1992 . Получено 12 июля 2019 .
  7. ^ ab Britanak, Владимир; Yip, Патрик C.; Rao, KR (6 ноября 2006 г.). Дискретные косинусные и синусные преобразования: общие свойства, быстрые алгоритмы и целочисленные аппроксимации . Academic Press . ISBN 978-0123736246. LCCN  2006931102. OCLC  220853454. OL  18495589М. S2CID  118873224.
  8. Избранные статьи по визуальной коммуникации: технологии и приложения (издательство SPIE Press), редакторы Т. Рассел Хсинг и Эндрю Г. Тешер, апрель 1990 г., стр. 145-149 [1].
  9. Избранные статьи и учебник по цифровой обработке и анализу изображений, том 1, Цифровая обработка и анализ изображений , (IEEE Computer Society Press), редакторы Р. Челлаппа и А.А. Савчук, июнь 1985 г., стр. 47.
  10. ^ Цитаты DCT через Google Scholar [2].
  11. ^ Эндрю Б. Уотсон (1994). «Сжатие изображений с использованием дискретного косинусного преобразования» (PDF) . Mathematica Journal . 4 (1): 81–88.
  12. ^ сжатие изображения .
  13. ^ Преобразование кодирования .
  14. ^ Уоллес, Г. К. (февраль 1992 г.). «Стандарт сжатия неподвижных изображений JPEG» (PDF) . Труды IEEE по потребительской электронике . 38 (1). doi :10.1109/30.125072..
  15. ^ МККТТ 1992 [3].
  16. ^ Рао, KR ; Хванг, JJ (18 июля 1996 г.). Методы и стандарты кодирования изображений, видео и аудио . Prentice Hall. ISBN 978-0133099072. LCCN  96015550. OCLC  34617596. OL  978319M. S2CID  56983045.
  17. ^ Яо Ван, Стандарты кодирования видео: Часть I, 2006
  18. ^ Яо Ван, Стандарты кодирования видео: Часть II, 2006
  19. ^ Гилберт Стрэнг (1999). «Дискретное косинусное преобразование» (PDF) . Обзор SIAM . 41 (1): 135–147. Bibcode : 1999SIAMR..41..135S. doi : 10.1137/S0036144598336745 .
  20. ^ Ли, Джэ-Бом; Калва, Хари (2008). Стандарты сжатия видео VC-1 и H.264 для широкополосных видеоуслуг . Springer Science+Business Media, LLC. С. 217–245.
  21. ^ Гукерт, Джон (весна 2012 г.). «Использование FFT и MDCT в сжатии аудио MP3» (PDF) . Университет Юты . Получено 14 июля 2019 г. .
  22. ^ Mandyam, Giridhar D.; Ahmed, Nasir; Magotra, Neeraj (17 апреля 1995 г.). Rodriguez, Arturo A.; Safranek, Robert J.; Delp, Edward J. (ред.). "Схема на основе DCT для сжатия изображений без потерь". Цифровое видеосжатие: алгоритмы и технологии 1995 г. 2419 г. SPIE : 474–478. Bibcode :1995SPIE.2419..474M. doi :10.1117/12.206386. S2CID  13894279.
  23. ^ Мизогучи, Карен (16 февраля 2021 г.). «Как This Is Us почтили память реального «гения», который помог Пирсонам оставаться на связи во время COVID». People.com . Получено 21 марта 2022 г.

Внешние ссылки