Модель камеры-обскуры описывает математическую связь между координатами точки в трехмерном пространстве и ее проекцией на плоскость изображения идеальной камеры-обскуры , где апертура камеры описывается как точка и для фокусировки света не используются линзы. Модель не учитывает, например, геометрические искажения или размытие несфокусированных объектов, вызванные линзами и апертурами конечного размера. [1] Также не учитывается, что большинство практичных камер имеют только дискретные координаты изображения. Это означает, что модель камеры-обскуры можно использовать только в качестве аппроксимации первого порядка преобразования трехмерной сцены в двухмерное изображение . Его достоверность зависит от качества камеры и, как правило, уменьшается от центра изображения к краям по мере увеличения эффекта искажения объектива.
Некоторые эффекты, которые не учитывает модель камеры-обскуры, можно компенсировать, например, путем применения подходящих преобразований координат к координатам изображения; другие эффекты достаточно малы, чтобы ими можно было пренебречь, если используется высококачественная камера. Это означает, что модель камеры-обскуры часто можно использовать в качестве разумного описания того, как камера отображает трехмерную сцену, например, в компьютерном зрении и компьютерной графике .
Геометрия
Геометрия камеры-обскуры. Примечание: система координат x 1 x 2 x 3 на рисунке левая, то есть направление оси OZ противоположно той системе, к которой может привыкнуть считыватель.
Геометрия , связанная с отображением камеры-обскуры, показана на рисунке. На рисунке присутствуют следующие основные объекты:
Трехмерная ортогональная система координат с началом в O . Здесь же находится апертура камеры . Три оси системы координат обозначаются как X1, X2, X3. Ось X3 указывает в направлении обзора камеры и называется оптической осью , главной осью или главным лучом . Плоскость, охватываемая осями X1 и X2, является передней стороной камеры или главной плоскостью .
Плоскость изображения, в которой трехмерный мир проецируется через апертуру камеры. Плоскость изображения параллельна осям X1 и X2 и расположена на расстоянии от начала координат O в отрицательном направлении оси X3, где f — фокусное расстояние камеры-обскуры. Практическая реализация камеры-обскуры подразумевает, что плоскость изображения расположена так, что она пересекает ось X3 в координате -f , где f > 0 .
Точка R на пересечении оптической оси и плоскости изображения. Эта точка называется главной точкой [2] или центром изображения .
Точка P где-то в мире с координатой относительно осей X1, X2 и X3.
Линия проекции точки P на камеру. Это зеленая линия, проходящая через точку P и точку O.
Проекция точки P на плоскость изображения обозначается Q. Эта точка определяется пересечением линии проекции (зеленой) и плоскости изображения. В любой практической ситуации мы можем предположить, что > 0, что означает, что точка пересечения четко определена.
В плоскости изображения также имеется двумерная система координат с началом координат в R и осями Y1 и Y2, параллельными X1 и X2 соответственно. Координаты точки Q относительно этой системы координат равны .
Апертура -обскура камеры, через которую должны пройти все проекционные линии, предполагается бесконечно малой, точкой. В литературе эта точка в трехмерном пространстве называется оптическим центром (или центром линзы или камеры) . [3]
Формулировка
Далее мы хотим понять, как координаты точки Q зависят от координат точки P. Это можно сделать с помощью следующего рисунка, на котором показана та же сцена, что и на предыдущем рисунке, но теперь сверху, если смотреть вниз в отрицательном направлении оси X2.
Геометрия камеры-обскуры, если смотреть по оси X2.
На этом рисунке мы видим два подобных треугольника , у обоих части линии проекции (зеленые) являются гипотенузами . Катеты левого треугольника — и f , катеты правого треугольника — и . Поскольку оба треугольника подобны, отсюда следует, что
или
Аналогичное исследование, если смотреть в отрицательном направлении оси X1, дает
или
Это можно резюмировать как
которое представляет собой выражение, описывающее связь между трехмерными координатами точки P и координатами ее изображения, заданными точкой Q в плоскости изображения.
Повернутое изображение и плоскость виртуального изображения
Преобразование 3D-координат в 2D, описываемое камерой-обскурой, представляет собой перспективную проекцию с последующим поворотом на 180° плоскости изображения. Это соответствует тому, как работает настоящая камера-обскура; полученное изображение поворачивается на 180°, и относительный размер проецируемых объектов зависит от их расстояния до фокальной точки, а общий размер изображения зависит от расстояния f между плоскостью изображения и фокальной точкой. Чтобы создать неповернутое изображение, чего мы и ожидаем от камеры, есть две возможности:
Поверните систему координат в плоскости изображения на 180° (в любую сторону). Именно так любая практическая реализация камеры-обскуры могла бы решить проблему; в фотокамере мы поворачиваем изображение перед тем, как на него посмотреть, а в цифровой камере мы считываем пиксели в таком порядке, что оно поворачивается.
Поместите плоскость изображения так, чтобы она пересекала ось X3 в точке f , а не в точке -f , и повторите предыдущие расчеты. Это создаст виртуальную (или фронтальную) плоскость изображения , которую невозможно реализовать на практике, но предоставляет теоретическую камеру, анализировать которую может быть проще, чем реальную.
В обоих случаях результирующее отображение 3D-координат в 2D-координаты изображения задается выражением выше, но без отрицания, таким образом
В однородных координатах
Отображение трехмерных координат точек пространства в координаты двумерного изображения также может быть представлено в однородных координатах . Пусть – представление трехмерной точки в однородных координатах (четырехмерный вектор), и пусть – представление изображения этой точки в камере-обскуре (трехмерный вектор). Тогда имеет место следующее соотношение
где – матрица камеры и означает равенство между элементами проективных пространств . Это означает, что левая и правая части равны с точностью до ненулевого скалярного умножения. Следствием этого отношения является то, что его также можно рассматривать как элемент проективного пространства ; две матрицы камеры эквивалентны, если они равны с точностью до скалярного умножения. Такое описание отображения камеры-обскуры как линейного преобразования, а не как доли двух линейных выражений, позволяет упростить многие выводы отношений между трехмерными и двумерными координатами. [ нужна цитата ]
^ Селиски, Ричард (2022). Компьютерное зрение: алгоритмы и приложения (2-е изд.). Спрингер Природа. п. 74. ИСБН 3030343723. Проверено 30 декабря 2023 г.
^ Карло Томази (9 августа 2016 г.). «Простая модель камеры» (PDF) . cs.duke.edu . Проверено 18 февраля 2021 г.
^ Андреа Фузиелло (27 декабря 2005 г.). «Элементы геометрического компьютерного зрения». Homepages.inf.ed.ac.uk . Проверено 18 декабря 2013 г.
Библиография
Дэвид А. Форсайт и Жан Понсе (2003). Компьютерное зрение: современный подход . Прентис Холл. ISBN 0-12-379777-2.
Ричард Хартли и Эндрю Зиссерман (2003). Множественная геометрия в компьютерном зрении. Издательство Кембриджского университета. ISBN 0-521-54051-8.
Бернд Йене (1997). Практическое руководство по обработке изображений для научных приложений . ЦРК Пресс. ISBN 0-8493-8906-2.
Ган Сюй и Чжэнъю Чжан (1996). Эпиполярная геометрия в стерео, распознавании движения и объектов. Академическое издательство Клювер. ISBN 0-7923-4199-6.
Селиски, Ричард (2022). Компьютерное зрение: алгоритмы и приложения (2-е изд.). Спрингер Природа. п. 925. ИСБН 3030343723. Проверено 30 декабря 2023 г.