Модель трехмерных точек, проецируемых на плоскостное изображение через безлинзовую апертуру
Модель камеры-обскуры описывает математическую связь между координатами точки в трехмерном пространстве и ее проекцией на плоскость изображения идеальной камеры -обскуры , где апертура камеры описывается как точка, и линзы не используются для фокусировки света. Модель не включает, например, геометрические искажения или размытие несфокусированных объектов, вызванные линзами и апертурами конечного размера. [1] Она также не учитывает, что большинство практических камер имеют только дискретные координаты изображения. Это означает, что модель камеры-обскуры может использоваться только как приближение первого порядка отображения трехмерной сцены в двумерное изображение . Ее достоверность зависит от качества камеры и, в общем случае, уменьшается от центра изображения к краям по мере увеличения эффектов искажения линзы.
Некоторые эффекты, которые модель камеры-обскуры не учитывает, можно компенсировать, например, применяя подходящие преобразования координат к координатам изображения; другие эффекты достаточно малы, чтобы ими можно было пренебречь, если используется высококачественная камера. Это означает, что модель камеры-обскуры часто можно использовать в качестве разумного описания того, как камера отображает 3D-сцену, например, в компьютерном зрении и компьютерной графике .
Геометрия
Геометрия , связанная с отображением камеры-обскуры, проиллюстрирована на рисунке. Рисунок содержит следующие основные объекты:
Трехмерная ортогональная система координат с началом в точке O. Там же находится апертура камеры . Три оси системы координат обозначаются как X1, X2, X3. Ось X3 указывает в направлении обзора камеры и называется оптической осью , главной осью или главным лучом . Плоскость, охватываемая осями X1 и X2, является передней стороной камеры или главной плоскостью .
Плоскость изображения, где трехмерный мир проецируется через апертуру камеры. Плоскость изображения параллельна осям X1 и X2 и расположена на расстоянии от начала координат O в отрицательном направлении оси X3, где f — фокусное расстояние камеры-обскуры. Практическая реализация камеры-обскуры подразумевает, что плоскость изображения расположена таким образом, что пересекает ось X3 в точке с координатой -f , где f > 0 .
Точка R на пересечении оптической оси и плоскости изображения. Эта точка называется главной точкой [2] или центром изображения .
Точка P где-то в мире с координатами относительно осей X1, X2 и X3.
Линия проекции точки P в камеру. Это зеленая линия, которая проходит через точку P и точку O.
Проекция точки P на плоскость изображения, обозначенная Q. Эта точка задается пересечением линии проекции (зеленой) и плоскости изображения. В любой практической ситуации мы можем предположить, что > 0, что означает, что точка пересечения хорошо определена.
В плоскости изображения также имеется двумерная система координат с началом в точке R и осями Y1 и Y2, параллельными X1 и X2 соответственно. Координаты точки Q относительно этой системы координат равны .
Отверстие - обскура камеры, через которое должны проходить все линии проекции, предполагается бесконечно малым, точкой. В литературе эта точка в трехмерном пространстве называется оптическим (или линзовым, или камерным) центром . [3]
Формулировка
Далее мы хотим понять, как координаты точки Q зависят от координат точки P. Это можно сделать с помощью следующего рисунка, на котором показана та же сцена, что и на предыдущем рисунке, но теперь сверху, глядя вниз в отрицательном направлении оси X2.
На этом рисунке мы видим два подобных треугольника , оба из которых имеют части проекционной линии (зеленые) в качестве гипотенуз . Катеты левого треугольника равны и , а катеты прямоугольного треугольника равны и . Поскольку два треугольника подобны, следует, что
или
Аналогичное исследование, рассматривая отрицательное направление оси X1, дает
или
Это можно резюмировать следующим образом:
которое представляет собой выражение, описывающее связь между трехмерными координатами точки P и ее координатами изображения, заданными точкой Q в плоскости изображения.
Повернутое изображение и виртуальная плоскость изображения
Отображение координат 3D в 2D, описываемое камерой-обскуром, представляет собой перспективную проекцию с последующим поворотом на 180° в плоскости изображения. Это соответствует тому, как работает настоящая камера-обскура; полученное изображение поворачивается на 180°, а относительный размер проецируемых объектов зависит от их расстояния до фокальной точки, а общий размер изображения зависит от расстояния f между плоскостью изображения и фокальной точкой. Для того чтобы создать не повернутое изображение, чего мы и ожидаем от камеры, есть две возможности:
Повернуть систему координат в плоскости изображения на 180° (в любом направлении). Именно так любая практическая реализация камеры-обскуры решила бы эту проблему; для фотографической камеры мы поворачиваем изображение перед тем, как посмотреть на него, а для цифровой камеры мы считываем пиксели в таком порядке, чтобы оно стало повернутым.
Разместите плоскость изображения так, чтобы она пересекала ось X3 в точке f, а не в точке -f, и переделайте предыдущие вычисления. Это сгенерирует виртуальную (или фронтальную) плоскость изображения , которую невозможно реализовать на практике, но которая обеспечивает теоретическую камеру, анализ которой может быть проще, чем реальной.
В обоих случаях результирующее отображение трехмерных координат в двухмерные координаты изображения задается выражением выше, но без отрицания, таким образом
В однородных координатах
Отображение 3D-координат точек в пространстве в 2D-координаты изображения также может быть представлено в однородных координатах . Пусть будет представлением 3D-точки в однородных координатах (4-мерный вектор), а пусть будет представлением изображения этой точки в камере-обскуре (3-мерный вектор). Тогда справедливо следующее соотношение
где — матрица камеры , а означает равенство между элементами проективных пространств . Это подразумевает, что левая и правая стороны равны с точностью до ненулевого скалярного умножения. Следствием этого отношения является то, что также может рассматриваться как элемент проективного пространства ; две матрицы камеры эквивалентны, если они равны с точностью до скалярного умножения. Это описание отображения камеры-обскуры как линейного преобразования, а не как дроби двух линейных выражений, позволяет упростить многие выводы соотношений между трехмерными и двумерными координатами. [ необходима цитата ]
^ Szeliski, Richard (2022). Computer Vision: Algorithms and Applications (2-е изд.). Springer Nature. стр. 74. ISBN 3030343723. Получено 30 декабря 2023 г. .
^ Карло Томази (2016-08-09). "Простая модель камеры" (PDF) . cs.duke.edu . Получено 2021-02-18 .
Gang Xu и Zhengyou Zhang (1996). Эпиполярная геометрия в стерео, движении и распознавании объектов. Kluwer Academic Publishers. ISBN 0-7923-4199-6.
Селиски, Ричард (2022). Компьютерное зрение: алгоритмы и приложения (2-е изд.). Springer Nature. стр. 925. ISBN 3030343723. Получено 30 декабря 2023 г. .