Компьютерно-генерируемые изображения ( CGI ) — это специфическая технология или применение компьютерной графики для создания или улучшения изображений в искусстве , печатных изданиях , симуляторах , видео и видеоиграх. Эти изображения являются либо статическими (т. е. неподвижными изображениями ), либо динамическими (т. е. движущимися изображениями). CGI относится как к 2D-компьютерной графике, так и (чаще) к 3D-компьютерной графике с целью проектирования персонажей, виртуальных миров или сцен и спецэффектов (в фильмах , телевизионных программах, рекламных роликах и т. д.). Применение CGI для создания/улучшения анимаций называется компьютерной анимацией или CGI-анимацией .
Первым художественным фильмом, в котором использовалась CGI, а также композиция фильма с живыми актерами с CGI, был Vertigo , [1] в начальных титрах которого использовалась абстрактная компьютерная графика Джона Уитни . Первым художественным фильмом, в котором CGI использовалась с живыми актерами в сюжетной линии фильма, был фильм 1973 года Westworld . [2] Другие ранние фильмы, в которых использовалась CGI, включают в себя «Звездные войны: Эпизод IV» (1977), [2] «Трон» (1982), «Звездный путь 2: Гнев Хана» (1982), [2] «Голго 13: Профессионал» (1983), [3] «Последний звездный боец» (1984 ), [4] «Молодой Шерлок Холмс» (1985), «Бездна» (1989), «Терминатор 2: Судный день» (1991), «Парк Юрского периода» (1993) и «История игрушек» (1995). Первым музыкальным клипом , в котором использовалась компьютерная графика, был «Adventures in Success » Уилла Пауэрса (1983). [5]
До того, как CGI стала широко распространенной в кино, виртуальной реальности, персональных компьютерах и играх, одним из первых практических применений CGI была авиационная и военная подготовка, а именно летные симуляторы . Визуальные системы, разработанные в летных симуляторах, также были важными предшественниками трехмерной компьютерной графики и систем компьютерной генерации изображений (CGI) сегодня. А именно потому, что целью летной симуляции было воспроизведение на земле поведения самолета в полете. Большая часть этого воспроизведения была связана с правдоподобным визуальным синтезом, который имитировал реальность. [6] Цифровой генератор изображений Link (DIG) компании Singer (Singer-Link) считался одной из первых в мире систем CGI. [7] Это была система реального времени с поддержкой 3D, день/сумерки/ночь, которая использовалась шаттлами NASA для F-111, Black Hawk и B-52. Цифровой генератор изображений Link имел архитектуру, обеспечивающую визуальную систему, которая реалистично соответствовала виду пилота. [8] Базовая архитектура DIG и последующие усовершенствования содержали менеджер сцен, за которым следовали геометрический процессор, видеопроцессор и дисплей с конечной целью создания визуальной системы, которая обрабатывала реалистичные текстуры, затенение, возможности полупрозрачности и была свободна от наложения спектров. [9]
В сочетании с необходимостью сочетать виртуальный синтез с требованиями обучения на военном уровне, технологии CGI, применяемые в симуляции полета, часто опережали на годы то, что было доступно в коммерческих вычислениях или даже в высокобюджетных фильмах. Ранние системы CGI могли отображать только объекты, состоящие из плоских полигонов. Достижения в области алгоритмов и электроники в визуальных системах симуляторов полета и CGI в 1970-х и 1980-х годах повлияли на многие технологии, которые все еще используются в современной CGI, добавив возможность накладывать текстуру на поверхности, а также плавно переходить от одного уровня детализации к другому. [10]
Развитие CGI привело к появлению виртуальной кинематографии в 1990-х годах, где видение имитируемой камеры не ограничено законами физики. Доступность программного обеспечения CGI и возросшая скорость компьютеров позволили отдельным художникам и небольшим компаниям производить профессиональные фильмы, игры и произведения изобразительного искусства на своих домашних компьютерах.
Не только анимированные изображения являются частью компьютерных изображений; естественно выглядящие ландшафты (например, фрактальные ландшафты ) также генерируются с помощью компьютерных алгоритмов . Простой способ создания фрактальных поверхностей — использовать расширение метода треугольной сетки , полагаясь на построение некоторого особого случая кривой де Рама , например, смещения средней точки . [11] Например, алгоритм может начинаться с большого треугольника, затем рекурсивно увеличивать масштаб, разделяя его на четыре меньших треугольника Серпинского , затем интерполировать высоту каждой точки от ее ближайших соседей. [11] Создание броуновской поверхности может быть достигнуто не только путем добавления шума по мере создания новых узлов, но и путем добавления дополнительного шума на нескольких уровнях сетки. [11] Таким образом, топографическая карта с различными уровнями высоты может быть создана с помощью относительно простых фрактальных алгоритмов. Некоторые типичные, легко программируемые фракталы, используемые в CGI, — это плазменный фрактал и более драматичный фрактал разлома . [12]
Было исследовано и разработано множество специальных методов для создания узконаправленных компьютерных эффектов — например, использование специальных моделей для представления химического выветривания камней с целью моделирования эрозии и создания «состаренного вида» для заданной поверхности на основе камня. [13]
Современные архитекторы пользуются услугами фирм, занимающихся компьютерной графикой, для создания трехмерных моделей как для клиентов, так и для строителей. Эти компьютерные модели могут быть точнее традиционных чертежей. Архитектурная анимация (которая предоставляет анимированные фильмы зданий, а не интерактивные изображения) также может использоваться для того, чтобы увидеть возможные отношения, которые здание будет иметь по отношению к окружающей среде и окружающим его зданиям. Обработка архитектурных пространств без использования бумаги и карандашных инструментов в настоящее время является широко распространенной практикой с рядом автоматизированных систем архитектурного проектирования. [14]
Инструменты архитектурного моделирования позволяют архитектору визуализировать пространство и выполнять «проходы» в интерактивной манере, тем самым обеспечивая «интерактивную среду» как на городском, так и на строительном уровне. [15] Конкретные приложения в архитектуре включают не только спецификацию строительных конструкций (таких как стены и окна) и проходы, но и эффекты света и то, как солнечный свет будет влиять на определенный дизайн в разное время дня. [16] [17]
Архитектурные инструменты моделирования теперь все больше базируются на Интернете. Однако качество систем, базирующихся на Интернете, все еще отстает от сложных внутренних систем моделирования. [18]
В некоторых приложениях компьютерные изображения используются для «обратного проектирования» исторических зданий. Например, компьютерная реконструкция монастыря в Георгентале в Германии была получена из руин монастыря, но при этом предоставляет зрителю «вид и ощущение» того, как здание выглядело бы в свое время. [19]
Компьютерные модели, используемые в скелетной анимации, не всегда анатомически верны. Однако такие организации, как Scientific Computing and Imaging Institute, разработали анатомически верные компьютерные модели. Компьютерные анатомические модели могут использоваться как в учебных, так и в операционных целях. На сегодняшний день большое количество медицинских изображений, созданных художниками , продолжают использоваться студентами-медиками, например, изображения Фрэнка Х. Неттера , например, изображения сердца. Однако становится доступным ряд онлайн-анатомических моделей.
Рентгеновский снимок отдельного пациента не является сгенерированным компьютером изображением, даже если он оцифрован. Однако в приложениях, включающих КТ-сканирование, трехмерная модель автоматически создается из множества однослойных рентгеновских снимков, создавая «сгенерированное компьютером изображение». Приложения, включающие магнитно-резонансную томографию, также объединяют несколько «снимков» (в данном случае с помощью магнитных импульсов) для создания составного внутреннего изображения.
В современных медицинских приложениях пациент-специфичные модели строятся в «компьютерной хирургии». Например, при полной замене коленного сустава построение подробной пациент-специфичной модели может использоваться для тщательного планирования операции. [20] Эти трехмерные модели обычно извлекаются из нескольких КТ-сканов соответствующих частей собственной анатомии пациента. Такие модели также могут использоваться для планирования имплантации аортального клапана , одной из распространенных процедур лечения заболеваний сердца . Учитывая, что форма, диаметр и положение коронарных отверстий могут сильно различаться от пациента к пациенту, извлечение (из КТ-сканов ) модели, которая очень похожа на анатомию клапана пациента, может быть весьма полезным при планировании процедуры. [21]
Модели тканей обычно делятся на три группы:
На сегодняшний день создание одежды цифрового персонажа, автоматически складывающейся естественным образом, остается сложной задачей для многих аниматоров. [23]
Помимо использования в кино, рекламе и других видах публичной демонстрации, компьютерные изображения одежды теперь регулярно используются ведущими фирмами по дизайну одежды. [24]
Проблема визуализации изображений кожи человека включает три уровня реалистичности:
Самые мелкие видимые особенности, такие как мелкие морщины и поры кожи, имеют размер около 100 мкм или 0,1 миллиметра . Кожу можно смоделировать как 7- мерную двунаправленную текстурную функцию (BTF) или набор двунаправленных функций распределения рассеяния (BSDF) по поверхностям цели.
Интерактивная визуализация — это визуализация данных, которые могут динамически меняться и позволяют пользователю просматривать данные с разных точек зрения. Области применения могут значительно различаться, начиная от визуализации схем потоков в динамике жидкости и заканчивая конкретными приложениями автоматизированного проектирования . [26] Отображенные данные могут соответствовать определенным визуальным сценам, которые изменяются по мере взаимодействия пользователя с системой — например, симуляторы, такие как симуляторы полетов , широко используют методы CGI для представления мира. [27]
На абстрактном уровне интерактивный процесс визуализации включает в себя «конвейер данных», в котором необработанные данные обрабатываются и фильтруются в форму, которая делает их пригодными для рендеринга. Это часто называют «данными визуализации» . Затем данные визуализации сопоставляются с «представлением визуализации», которое может быть передано в систему рендеринга. Это обычно называют «рендерабельным представлением» . Затем это представление отображается как отображаемое изображение. [27] Когда пользователь взаимодействует с системой (например, используя элементы управления джойстиком для изменения своего положения в виртуальном мире), необработанные данные передаются через конвейер для создания нового визуализированного изображения, что часто делает вычислительную эффективность в реальном времени ключевым фактором в таких приложениях. [27] [28]
В то время как компьютерные изображения ландшафтов могут быть статичными, компьютерная анимация применяется только к динамическим изображениям, которые напоминают фильм. Однако, в целом, термин компьютерная анимация относится к динамическим изображениям, которые не допускают взаимодействия с пользователем, а термин виртуальный мир используется для интерактивных анимированных сред.
Компьютерная анимация по сути является цифровым преемником искусства покадровой анимации 3D-моделей и покадровой анимации 2D-иллюстраций. Компьютерная анимация более контролируема, чем другие, более физически обоснованные процессы, такие как создание миниатюр для эффектных кадров или найм статистов для массовых сцен, и потому что она позволяет создавать изображения, которые были бы невозможны с использованием любой другой технологии. Она также может позволить одному графическому художнику создавать такой контент без использования актеров, дорогостоящих декораций или реквизита.
Для создания иллюзии движения изображение выводится на экран компьютера и многократно заменяется новым изображением, которое похоже на предыдущее, но немного смещено вперед во времени (обычно со скоростью 24 или 30 кадров в секунду). Эта техника идентична тому, как иллюзия движения достигается в телевидении и кино .
Модель преобразования текста в изображение — это модель машинного обучения , которая принимает входное описание на естественном языке и создает изображение, соответствующее этому описанию.
Модели преобразования текста в изображение начали разрабатываться в середине 2010-х годов во время начала бума ИИ в результате достижений в области глубоких нейронных сетей . В 2022 году результаты современных моделей преобразования текста в изображение, таких как DALL-E 2 от OpenAI , Imagen от Google Brain , Stable Diffusion от Stability AI и Midjourney , стали считаться приближающимися по качеству к реальным фотографиям и нарисованным человеком произведениям искусства .
Модели преобразования текста в изображение обычно являются моделями скрытой диффузии , которые объединяют языковую модель , которая преобразует входной текст в скрытое представление , и генеративную модель изображения , которая создает изображение, обусловленное этим представлением. Наиболее эффективные модели обычно обучались на огромных объемах данных изображений и текста, полученных из сети . [29]Виртуальный мир — это основанная на агентах и смоделированная среда, позволяющая пользователям взаимодействовать с искусственно анимированными персонажами (например, программным агентом ) или с другими физическими пользователями посредством использования аватаров . Виртуальные миры предназначены для того, чтобы пользователи могли в них жить и взаимодействовать, и этот термин сегодня стал в значительной степени синонимом интерактивных трехмерных виртуальных сред, где пользователи принимают форму аватаров, видимых другим графически. [30] Эти аватары обычно изображаются как текстовые, двухмерные или трехмерные графические представления, хотя возможны и другие формы [31] (например, слуховые [32] и тактильные ощущения). Некоторые, но не все, виртуальные миры допускают наличие нескольких пользователей.
Компьютерные изображения использовались в залах суда, в основном с начала 2000-х годов. Однако некоторые эксперты утверждают, что это наносит ущерб. Они используются, чтобы помочь судьям или присяжным лучше визуализировать последовательность событий, доказательств или гипотез. [33] Однако исследование 1997 года показало, что люди — плохие интуитивные физики и легко поддаются влиянию компьютерных изображений. [34] Таким образом, важно, чтобы присяжные и другие лица, принимающие юридические решения, знали, что такие экспонаты являются всего лишь представлением одной потенциальной последовательности событий.
Визуализация погоды была первым применением CGI на телевидении. Одной из первых компаний, предложивших компьютерные системы для создания погодной графики, была ColorGraphics Weather Systems в 1979 году с "LiveLine", основанной на компьютере Apple II , а более поздние модели от ColorGraphics использовали компьютеры Cromemco, оснащенные их видеокартой Dazzler .
В настоящее время в прогнозах погоды стало обычным делом показывать полноценные видеокадры изображений, снятых в реальном времени с нескольких камер и других устройств обработки изображений. В сочетании с трехмерными графическими символами и сопоставленными с общей виртуальной геопространственной моделью эти анимированные визуализации представляют собой первое настоящее применение CGI на ТВ.
CGI стало обычным явлением в спортивном телевещании. Спортивные и развлекательные заведения снабжаются прозрачным и наложенным контентом через отслеживаемые каналы камер для улучшенного просмотра аудиторией. Примерами являются желтая линия « первого дауна », которую можно увидеть в телевизионных трансляциях игр в американский футбол, показывающая линию, которую должна пересечь нападающая команда, чтобы получить первый даун. CGI также используется в связи с футболом и другими спортивными мероприятиями для показа коммерческой рекламы, наложенной на вид игровой площадки. Участки полей для регби и крикета также демонстрируют спонсируемые изображения. Телетрансляции по плаванию часто добавляют линию поперек дорожек, чтобы указать положение текущего рекордсмена по мере продвижения гонки, чтобы позволить зрителям сравнивать текущую гонку с лучшими результатами. Другие примеры включают отслеживание хоккейной шайбы и аннотации производительности гоночных автомобилей [35] и траектории мячей для снукера. [36] [37] Иногда CGI на ТВ с правильным выравниванием относительно реального мира называют дополненной реальностью .
Компьютерная графика часто используется в сочетании с технологией захвата движения , чтобы лучше скрыть недостатки, присущие компьютерной графике и анимации.Компьютерные изображения ограничены в своем практическом применении тем, насколько реалистично они могут выглядеть. Нереалистичные или плохо управляемые компьютерные изображения могут привести к эффекту зловещей долины . [38] Этот эффект относится к способности человека распознавать вещи, которые выглядят жутко похожими на людей, но немного не такими. Такая способность является недостатком обычных компьютерных изображений, которые из-за сложной анатомии человеческого тела часто не могут идеально воспроизвести их. Художники могут использовать захват движения, чтобы получить кадры человека, выполняющего действие, а затем идеально воспроизвести их с помощью компьютерных изображений, чтобы они выглядели нормально.
Отсутствие анатомически правильных цифровых моделей обуславливает необходимость захвата движения, поскольку он используется с компьютерными изображениями. Поскольку компьютерные изображения отражают только внешнюю часть или кожу визуализируемого объекта, они не могут захватить бесконечно малые взаимодействия между взаимосвязанными группами мышц, используемыми в мелкой моторике, например, в говорении. Постоянное движение лица, когда оно издает звуки с помощью сформированных губ и движения языка, а также выражения лица, которые сопровождают речь, трудно воспроизвести вручную. [39] Захват движения может улавливать основные движения лицевых мышц и лучше воспроизводить визуальное, которое сопровождает звук.
{{cite book}}
: CS1 maint: multiple names: authors list (link){{cite journal}}
: CS1 maint: multiple names: authors list (link){{cite web}}
: CS1 maint: multiple names: authors list (link)