Компьютерное стереозрение — это извлечение трехмерной информации из цифровых изображений, например, полученных с помощью камеры CCD . Сравнивая информацию о сцене с двух точек зрения, можно извлечь трехмерную информацию, исследуя относительное положение объектов на двух панелях. Это похоже на биологический процесс стереопсиса .
В традиционном стереозрении две камеры, смещенные горизонтально друг от друга, используются для получения двух разных изображений сцены, аналогично бинокулярному зрению человека . Сравнивая эти два изображения, информацию об относительной глубине можно получить в виде карты несоответствия , которая кодирует разницу в горизонтальных координатах соответствующих точек изображения. Значения в этой карте несоответствия обратно пропорциональны глубине сцены в соответствующем местоположении пикселя.
Чтобы человек мог сравнить два изображения, они должны быть наложены друг на друга в стереоскопическом устройстве, при этом изображение с правой камеры будет показано правому глазу наблюдателя, а изображение с левой — левому глазу.
В системе компьютерного зрения требуется несколько этапов предварительной обработки. [1]
Активное стереозрение — это форма стереозрения, в которой активно используется свет, такой как лазер или структурированный свет, для упрощения задачи стереосопоставления. Противоположный термин - пассивное стереозрение.
3D -стереодисплеи находят множество применений в сфере развлечений, передачи информации и автоматизированных системах. Стереозрение очень важно в таких областях, как робототехника, для извлечения информации об относительном положении трехмерных объектов вблизи автономных систем. Другие приложения для робототехники включают распознавание объектов , [5] где информация о глубине позволяет системе отделять закрывающие компоненты изображения, например, один стул перед другим, которые в противном случае робот не сможет отличить как отдельный объект от любого другого. критерии.
Научные применения цифрового стереовидения включают извлечение информации из аэрофотосъемки для расчета контурных карт или даже извлечение геометрии для трехмерного картографирования зданий, фотограмметрического спутникового картографирования или расчета трехмерной гелиографической информации, например, полученной в рамках проекта НАСА STEREO .
Пиксель записывает цвет в определенной позиции. Положение идентифицируется по положению в сетке пикселей (x, y) и глубине до пикселя z.
Стереоскопическое зрение дает два изображения одной и той же сцены с разных позиций. На соседней диаграмме свет из точки A передается через точки входа камер-обскуров в точках B и D на экраны изображений в точках E и H.
На прилагаемой диаграмме расстояние между центрами двух объективов камеры равно BD = BC + CD . Треугольники подобны,
Итак, если предположить, что камеры расположены ровно, а плоскости изображения лежат в одной плоскости, смещение по оси Y между одними и теми же пикселями на двух изображениях составит:
Где k — расстояние между двумя камерами, умноженное на расстояние от объектива до изображения.
Компонент глубины на двух изображениях равен и , определяется выражением:
Эти формулы позволяют закрывать вокселы , видимые на одном изображении на поверхности объекта, более близкими вокселами , видимыми на другом изображении, на поверхности объекта.
Если плоскости изображения не копланарны, требуется коррекция изображения , чтобы настроить изображения так, как если бы они были копланарными. Этого можно достичь с помощью линейного преобразования.
Изображения также могут нуждаться в исправлении, чтобы каждое изображение было эквивалентно изображению, полученному с помощью камеры-обскуры и проецируемому на плоскую плоскость.
Гладкость – это мера сходства цветов. Учитывая предположение, что отдельный объект имеет небольшое количество цветов, пиксели одинакового цвета с большей вероятностью принадлежат одному объекту, чем нескольким объектам.
Описанный выше метод оценки гладкости основан на теории информации и предположении, что влияние цвета воксела влияет на цвет соседних вокселов согласно нормальному распределению по расстоянию между точками. Модель основана на приблизительных предположениях о мире.
Другой метод, основанный на предшествующих предположениях о гладкости, — это автокорреляция.
Гладкость — это свойство мира, а не внутреннее свойство изображения. Изображение, состоящее из случайных точек, не будет иметь гладкости, и выводы о соседних точках будут бесполезны.
В принципе, гладкости, как и другим свойствам мира, следует учиться. Похоже, именно это и делает система человеческого зрения. [ нужна цитата ]
Нормальное распределение
Вероятность связана с информационным содержанием, описываемым длиной сообщения L ,
так,
Для целей сравнения стереоскопических изображений имеет значение только относительная длина сообщения. Исходя из этого, информационная мера I , называемая суммой квадратов разностей (SSD), равна:
где,
Из-за затрат времени на обработку возведения чисел в SSD во многих реализациях в качестве основы для вычисления меры информации используется сумма абсолютной разности (SAD). Другие методы используют нормализованную кросскорреляцию (NCC).
Мера наименьших квадратов может использоваться для измерения информационного содержания стереоскопических изображений [6] с учетом глубины в каждой точке . Сначала извлекается информация, необходимая для выражения одного образа через другой. Это называется .
Для точного измерения разницы между цветами следует использовать функцию цветового различия . Функция цветового различия записывается cd следующим образом. Мера информации, необходимой для записи соответствия цветов между двумя изображениями, равна:
Сделано предположение о плавности изображения. Предположим, что два пикселя с большей вероятностью будут иметь один и тот же цвет, чем ближе расположены воксели, которые они представляют. Эта мера предназначена для того, чтобы схожие цвета группировались на одной глубине. Например, если объект впереди закрывает область неба позади, мера сглаживания благоприятствует тому, чтобы все синие пиксели были сгруппированы вместе на одной и той же глубине.
Общая мера гладкости использует расстояние между вокселами в качестве оценки ожидаемого стандартного отклонения цветовой разницы.
Тогда общее содержание информации представляет собой сумму
Компонент z каждого пикселя должен выбираться так, чтобы обеспечить минимальное значение информационного содержания. Это даст наиболее вероятную глубину в каждом пикселе. Минимальная общая мера информации равна
Функции глубины для левого и правого изображений представляют собой пару:
Задача минимизации является NP-полной . Это означает, что для достижения общего решения этой проблемы потребуется много времени. Однако для компьютеров существуют методы, основанные на эвристике , которые аппроксимируют результат за разумное время. Также существуют методы, основанные на нейронных сетях . [7] Эффективная реализация стереоскопического зрения является областью активных исследований.
{{cite journal}}
: CS1 maint: numeric names: authors list (link)