Модель камеры-обскуры

Модель камеры-обскуры описывает математическую связь между координатами точки в трехмерном пространстве и ее проекцией на плоскость изображения идеальной камеры-обскуры , где апертура камеры описывается как точка и для фокусировки света не используются линзы. Модель не учитывает, например, геометрические искажения или размытие несфокусированных объектов, вызванные линзами и апертурами конечного размера. ^[1] Также не учитывается, что большинство практичных камер имеют только дискретные координаты изображения. Это означает, что модель камеры-обскуры можно использовать только в качестве аппроксимации первого порядка преобразования трехмерной сцены в двухмерное изображение . Его достоверность зависит от качества камеры и, как правило, уменьшается от центра изображения к краям по мере увеличения эффекта искажения объектива.

Некоторые эффекты, которые не учитывает модель камеры-обскуры, можно компенсировать, например, путем применения подходящих преобразований координат к координатам изображения; другие эффекты достаточно малы, чтобы ими можно было пренебречь, если используется высококачественная камера. Это означает, что модель камеры-обскуры часто можно использовать в качестве разумного описания того, как камера отображает трехмерную сцену, например, в компьютерном зрении и компьютерной графике .

Геометрия

Геометрия , связанная с отображением камеры-обскуры, показана на рисунке. На рисунке присутствуют следующие основные объекты:

Трехмерная ортогональная система координат с началом в O . Здесь же находится апертура камеры . Три оси системы координат обозначаются как X1, X2, X3. Ось X3 указывает в направлении обзора камеры и называется оптической осью , главной осью или главным лучом . Плоскость, охватываемая осями X1 и X2, является передней стороной камеры или главной плоскостью .
Плоскость изображения, в которой трехмерный мир проецируется через апертуру камеры. Плоскость изображения параллельна осям X1 и X2 и расположена на расстоянии от начала координат O в отрицательном направлении оси X3, где f — фокусное расстояние камеры-обскуры. Практическая реализация камеры-обскуры подразумевает, что плоскость изображения расположена так, что она пересекает ось X3 в координате -f , где f > 0 . $е$
Точка R на пересечении оптической оси и плоскости изображения. Эта точка называется главной точкой ^[2] или центром изображения .
Точка P где-то в мире с координатой относительно осей X1, X2 и X3. $(x_{1},x_{2},x_{3})$
Линия проекции точки P на камеру. Это зеленая линия, проходящая через точку P и точку O.
Проекция точки P на плоскость изображения обозначается Q. Эта точка определяется пересечением линии проекции (зеленой) и плоскости изображения. В любой практической ситуации мы можем предположить, что > 0, что означает, что точка пересечения четко определена. $x_{3}$
В плоскости изображения также имеется двумерная система координат с началом координат в R и осями Y1 и Y2, параллельными X1 и X2 соответственно. Координаты точки Q относительно этой системы координат равны . $(y_{1},y_{2})$

Апертура -обскура камеры, через которую должны пройти все проекционные линии, предполагается бесконечно малой, точкой. В литературе эта точка в трехмерном пространстве называется оптическим центром (или центром линзы или камеры) . ^[3]

Формулировка

Далее мы хотим понять, как координаты точки Q зависят от координат точки P. Это можно сделать с помощью следующего рисунка, на котором показана та же сцена, что и на предыдущем рисунке, но теперь сверху, если смотреть вниз в отрицательном направлении оси X2. $(y_{1},y_{2})$ $(x_{1},x_{2},x_{3})$

Геометрия камеры-обскуры, если смотреть по оси X2.

На этом рисунке мы видим два подобных треугольника , у обоих части линии проекции (зеленые) являются гипотенузами . Катеты левого треугольника — и f , катеты правого треугольника — и . Поскольку оба треугольника подобны, отсюда следует, что $-y_{1}$ $x_{1}$ $x_{3}$

{\frac {-y_{1}}{f}}={\frac {x_{1}}{x_{3}}}

или

y_{1}=-{\frac {f\,x_{1}}{x_{3}}}

Аналогичное исследование, если смотреть в отрицательном направлении оси X1, дает

{\frac {-y_{2}}{f}}={\frac {x_{2}}{x_{3}}}

или

y_{2}=-{\frac {f\,x_{2}}{x_{3}}}

Это можно резюмировать как

{\begin{pmatrix}y_{1}\\y_{2}\end{pmatrix}}=- {\frac {f}{x_{3}}}{\begin{pmatrix}x_{1} \\x_{2}\end{pmatrix}}

которое представляет собой выражение, описывающее связь между трехмерными координатами точки P и координатами ее изображения, заданными точкой Q в плоскости изображения. $(x_{1},x_{2},x_{3})$ $(y_{1},y_{2})$

Повернутое изображение и плоскость виртуального изображения

Преобразование 3D-координат в 2D, описываемое камерой-обскурой, представляет собой перспективную проекцию с последующим поворотом на 180° плоскости изображения. Это соответствует тому, как работает настоящая камера-обскура; полученное изображение поворачивается на 180°, и относительный размер проецируемых объектов зависит от их расстояния до фокальной точки, а общий размер изображения зависит от расстояния f между плоскостью изображения и фокальной точкой. Чтобы создать неповернутое изображение, чего мы и ожидаем от камеры, есть две возможности:

Поверните систему координат в плоскости изображения на 180° (в любую сторону). Именно так любая практическая реализация камеры-обскуры могла бы решить проблему; в фотокамере мы поворачиваем изображение перед тем, как на него посмотреть, а в цифровой камере мы считываем пиксели в таком порядке, что оно поворачивается.
Поместите плоскость изображения так, чтобы она пересекала ось X3 в точке f , а не в точке -f , и повторите предыдущие расчеты. Это создаст виртуальную (или фронтальную) плоскость изображения , которую невозможно реализовать на практике, но предоставляет теоретическую камеру, анализировать которую может быть проще, чем реальную.

В обоих случаях результирующее отображение 3D-координат в 2D-координаты изображения задается выражением выше, но без отрицания, таким образом

{\begin{pmatrix}y_{1}\\y_{2}\end{pmatrix}}={\frac {f}{x_{3}}}{\begin{pmatrix}x_{1}\ \x_{2}\end{pmatrix}}

В однородных координатах

Отображение трехмерных координат точек пространства в координаты двумерного изображения также может быть представлено в однородных координатах . Пусть – представление трехмерной точки в однородных координатах (четырехмерный вектор), и пусть – представление изображения этой точки в камере-обскуре (трехмерный вектор). Тогда имеет место следующее соотношение $\mathbf {x}$ $\mathbf {y}$

\mathbf {y} \sim \mathbf {C} \,\mathbf {x}

где – матрица камеры и означает равенство между элементами проективных пространств . Это означает, что левая и правая части равны с точностью до ненулевого скалярного умножения. Следствием этого отношения является то, что его также можно рассматривать как элемент проективного пространства ; две матрицы камеры эквивалентны, если они равны с точностью до скалярного умножения. Такое описание отображения камеры-обскуры как линейного преобразования, а не как доли двух линейных выражений, позволяет упростить многие выводы отношений между трехмерными и двумерными координатами. ^[^{нужна цитата}^] $\mathbf {C}$ $3\times 4$ $\,\sim$ $\mathbf {C}$ $\mathbf {C}$

Смотрите также

Резекция камеры
Уравнение коллинеарности
Входной зрачок — эквивалентное расположение точечного отверстия по отношению к пространству объекта в реальной камере.
Выходной зрачок — эквивалентное расположение точечного отверстия относительно плоскости изображения в реальной камере.
Ибн аль-Хайсам
Камера-обскура , практическая реализация математической модели, описанная в этой статье.
Прямолинейная линза

Библиография

Дэвид А. Форсайт и Жан Понсе (2003). Компьютерное зрение: современный подход . Прентис Холл. ISBN 0-12-379777-2.
Ричард Хартли и Эндрю Зиссерман (2003). Множественная геометрия в компьютерном зрении. Издательство Кембриджского университета. ISBN 0-521-54051-8.
Бернд Йене (1997). Практическое руководство по обработке изображений для научных приложений . ЦРК Пресс. ISBN 0-8493-8906-2.
Линда Г. Шапиро и Джордж К. Стокман (2001). Компьютерное зрение . Прентис Холл. ISBN 0-13-030796-3.
Ган Сюй и Чжэнъю Чжан (1996). Эпиполярная геометрия в стерео, распознавании движения и объектов. Академическое издательство Клювер. ISBN 0-7923-4199-6.
Селиски, Ричард (2022). Компьютерное зрение: алгоритмы и приложения (2-е изд.). Спрингер Природа. п. 925. ИСБН 3030343723. Проверено 30 декабря 2023 г.