В фотограмметрии и компьютерном стереозрении настройка пучка — это одновременное уточнение трехмерных координат , описывающих геометрию сцены, параметры относительного движения и оптические характеристики камеры (камер), используемых для получения изображений, с учетом набора изображений, изображающих ряд трехмерных точек с разных точек зрения . Ее название относится к геометрическим пучкам световых лучей, исходящих из каждой трехмерной особенности и сходящихся в оптическом центре каждой камеры , которые оптимально настраиваются в соответствии с критерием оптимальности, включающим соответствующие проекции изображения всех точек.
Настройка пучка почти всегда [ требуется ссылка ] используется как последний шаг алгоритмов 3D-реконструкции на основе признаков . Это сводится к задаче оптимизации 3D-структуры и параметров просмотра (т. е. позы камеры и, возможно, внутренней калибровки и радиального искажения), чтобы получить реконструкцию, которая является оптимальной при определенных предположениях относительно шума, относящегося к наблюдаемым [1] признакам изображения: Если ошибка изображения является нулевым средним Гауссовским , то настройка пучка является оценщиком максимального правдоподобия . [2] : 2 Настройка пучка была первоначально задумана в области фотограмметрии в 1950-х годах и все чаще использовалась исследователями компьютерного зрения в последние годы. [2] : 2
Настройка пучка сводится к минимизации ошибки перепроецирования между положениями изображения наблюдаемых и прогнозируемых точек изображения, которая выражается как сумма квадратов большого числа нелинейных функций с действительными значениями. Таким образом, минимизация достигается с помощью нелинейных алгоритмов наименьших квадратов . Из них алгоритм Левенберга–Марквардта оказался одним из самых успешных благодаря простоте реализации и использованию эффективной стратегии затухания, которая дает ему возможность быстро сходиться из широкого диапазона начальных предположений. Путем итеративной линеаризации минимизируемой функции в окрестности текущей оценки алгоритм Левенберга–Марквардта включает решение линейных систем, называемых нормальными уравнениями . При решении задач минимизации, возникающих в рамках настройки пучка, нормальные уравнения имеют разреженную блочную структуру из-за отсутствия взаимодействия между параметрами для различных 3D-точек и камер. Это можно использовать для получения огромных вычислительных преимуществ, применяя разреженный вариант алгоритма Левенберга-Марквардта, который явно использует преимущества шаблона нулей нормальных уравнений, избегая хранения и работы с нулевыми элементами. [2] : 3
Настройка пакета сводится к совместному уточнению набора начальных оценок параметров камеры и структуры для нахождения набора параметров, которые наиболее точно предсказывают местоположения наблюдаемых точек в наборе доступных изображений. Более формально, [3] предположим, что 3D-точки видны на видах, и пусть будет проекцией th-й точки на изображении . Пусть обозначают двоичные переменные, которые равны 1, если точка видна на изображении , и 0 в противном случае. Предположим также, что каждая камера параметризована вектором , а каждая 3D-точка — вектором . Настройка пакета минимизирует общую ошибку перепроецирования относительно всех параметров 3D-точки и камеры, в частности
где — прогнозируемая проекция точки на изображение , а — евклидово расстояние между точками изображения, представленными векторами и . Поскольку минимум вычисляется по многим точкам и многим изображениям, корректировка пучка по определению терпима к отсутствующим проекциям изображения, и если метрика расстояния выбрана разумно (например, евклидово расстояние), корректировка пучка также минимизирует физически значимый критерий.