В линейной алгебре ортогональная матрица , или ортонормированная матрица , — это действительная квадратная матрица , столбцы и строки которой являются ортонормированными векторами .
Один из способов выразить это так: Q T — это транспонированная матрица Q , а I — единичная матрица .
Это приводит к эквивалентной характеристике: матрица Q ортогональна , если ее транспонированная матрица равна ее обратной матрице : где Q −1 — обратная матрица Q.
Ортогональная матрица Q обязательно обратима (с обратным Q −1 = Q T ), унитарна ( Q −1 = Q ∗ ), где Q ∗ — эрмитово сопряженное ( сопряженное транспонирование ) Q , и, следовательно, нормальна ( Q ∗ Q = QQ ∗ ) по действительным числам . Определитель любой ортогональной матрицы равен либо +1, либо −1. Как линейное преобразование , ортогональная матрица сохраняет скалярное произведение векторов и, следовательно, действует как изометрия евклидова пространства , такая как вращение , отражение или роторное отражение . Другими словами, это унитарное преобразование .
Множество ортогональных матриц n × n при умножении образует группу O( n ) , известную как ортогональная группа . Подгруппа SO( n ), состоящая из ортогональных матриц с определителем +1, называется специальной ортогональной группой , и каждый ее элемент является специальной ортогональной матрицей. Как линейное преобразование, каждая специальная ортогональная матрица действует как поворот.
Ортогональная матрица является реальной специализацией унитарной матрицы и, таким образом, всегда нормальной матрицей . Хотя мы рассматриваем здесь только действительные матрицы, определение может быть использовано для матриц с записями из любого поля . Однако ортогональные матрицы естественным образом возникают из скалярных произведений и для матриц комплексных чисел, что вместо этого приводит к требованию унитарности. Ортогональные матрицы сохраняют скалярное произведение, [1] так, для векторов u и v в n -мерном действительном евклидовом пространстве , где Q — ортогональная матрица. Чтобы увидеть связь внутреннего произведения, рассмотрим вектор v в n -мерном действительном евклидовом пространстве . Записанный относительно ортонормированного базиса, квадрат длины v равен v T v . Если линейное преобразование в матричной форме Q v сохраняет длины векторов, то
Таким образом, конечномерные линейные изометрии — вращения, отражения и их комбинации — производят ортогональные матрицы. Обратное также верно: ортогональные матрицы подразумевают ортогональные преобразования. Однако линейная алгебра включает ортогональные преобразования между пространствами, которые могут быть ни конечномерными, ни иметь ту же размерность, и они не имеют эквивалента в виде ортогональной матрицы.
Ортогональные матрицы важны по ряду причин, как теоретических, так и практических. Ортогональные матрицы n × n образуют группу при умножении матриц, ортогональную группу, обозначаемую O( n ) , которая — вместе со своими подгруппами — широко используется в математике и физических науках. Например, точечная группа молекулы является подгруппой O(3). Поскольку версии ортогональных матриц с плавающей точкой обладают полезными свойствами, они являются ключевыми для многих алгоритмов в числовой линейной алгебре, таких как QR- разложение . В качестве другого примера, при соответствующей нормализации дискретное косинусное преобразование (используемое при сжатии MP3 ) представляется ортогональной матрицей.
Ниже приведены несколько примеров небольших ортогональных матриц и возможных интерпретаций.
Простейшими ортогональными матрицами являются матрицы 1 × 1 [1] и [−1], которые мы можем интерпретировать как тождество и отражение действительной прямой относительно начала координат.
Матрицы 2 × 2 имеют вид , который по требованиям ортогональности удовлетворяет трем уравнениям
При рассмотрении первого уравнения, без потери общности, пусть p = cos θ , q = sin θ ; тогда либо t = − q , u = p , либо t = q , u = − p . Мы можем интерпретировать первый случай как поворот на θ (где θ = 0 является тождеством), а второй — как отражение относительно прямой под углом θ/2 .
Частный случай матрицы отражения с θ = 90° порождает отражение относительно линии под углом 45°, заданной уравнением y = x , и, следовательно, меняет местами x и y ; это матрица перестановки с одной единицей в каждом столбце и строке (и в противном случае 0):
Тождество также является матрицей перестановок.
Отражение является своим собственным обратным , что подразумевает, что матрица отражения симметрична (равна своей транспонированной), а также ортогональна. Произведение двух матриц вращения является матрицей вращения , а произведение двух матриц отражения также является матрицей вращения.
Независимо от размерности, всегда можно классифицировать ортогональные матрицы как чисто вращательные или нет, но для матриц 3 × 3 и больше невращательные матрицы могут быть сложнее отражений. Например,
представляют собой инверсию относительно начала координат и ротоинверсию , соответственно, вокруг оси z .
Вращательные движения становятся более сложными в более высоких измерениях; они больше не могут быть полностью охарактеризованы одним углом и могут влиять на более чем одно плоское подпространство. Обычно матрицу вращения 3 × 3 описывают в терминах оси и угла , но это работает только в трех измерениях. Выше трех измерений требуются два или более углов, каждый из которых связан с плоскостью вращения .
Однако у нас есть элементарные строительные блоки для перестановок, отражений и вращений, которые применяются в общем случае.
Самая элементарная перестановка — это транспозиция, полученная из единичной матрицы путем обмена двух строк. Любая матрица перестановки n × n может быть построена как произведение не более чем n − 1 транспозиций.
Отражение Хаусхолдера строится из ненулевого вектора v следующим образом:
Здесь числитель — симметричная матрица, а знаменатель — число, квадрат величины v . Это отражение в гиперплоскости, перпендикулярной v (отрицающее любой векторный компонент, параллельный v ). Если v — единичный вектор, то достаточно Q = I − 2 vv T . Отражение Хаусхолдера обычно используется для одновременного обнуления нижней части столбца. Любая ортогональная матрица размера n × n может быть построена как произведение не более n таких отражений.
Вращение Гивенса действует на двумерное (плоское) подпространство, охватываемое двумя осями координат, вращаясь на выбранный угол. Обычно оно используется для обнуления одного поддиагонального элемента. Любая матрица вращения размера n × n может быть построена как произведение не более н ( н − 1)/2 таких вращений. В случае матриц 3 × 3 достаточно трех таких вращений; и, фиксируя последовательность, мы можем таким образом описать все матрицы вращения 3 × 3 (хотя и не однозначно) в терминах трех используемых углов, часто называемых углами Эйлера .
Вращение Якоби имеет ту же форму, что и вращение Гивенса, но используется для обнуления обоих недиагональных элементов симметричной подматрицы 2 × 2 .
Действительная квадратная матрица ортогональна тогда и только тогда, когда ее столбцы образуют ортонормированный базис евклидова пространства R n с обычным евклидовым скалярным произведением , что имеет место тогда и только тогда, когда ее строки образуют ортонормированный базис R n . Может возникнуть соблазн предположить, что матрица с ортогональными (не ортонормированными) столбцами будет называться ортогональной матрицей, но такие матрицы не представляют особого интереса и не имеют специального названия; они удовлетворяют только условию M T M = D , где D — диагональная матрица .
Определитель любой ортогональной матрицы равен +1 или −1. Это следует из основных фактов об определителях, а именно :
Обратное неверно: наличие определителя ±1 не гарантирует ортогональности, даже с ортогональными столбцами, как показано в следующем контрпримере.
В случае матриц перестановки определитель совпадает с сигнатурой , будучи +1 или −1 в зависимости от четности перестановки, поскольку определитель является знакопеременной функцией строк.
Более сильным, чем ограничение определителя, является тот факт, что ортогональную матрицу всегда можно диагонализировать по комплексным числам , чтобы получить полный набор собственных значений , все из которых должны иметь (комплексный) модуль 1.
Обратная матрица каждой ортогональной матрицы снова ортогональна, как и матричное произведение двух ортогональных матриц. Фактически, множество всех ортогональных матриц n × n удовлетворяет всем аксиомам группы . Это компактная группа Ли размерности н ( н − 1)/2 , называемая ортогональной группой и обозначаемая O( n ) .
Ортогональные матрицы, определитель которых равен +1, образуют связную нормальную подгруппу O ( n ) индекса 2 , специальную ортогональную группу SO( n ) вращений. Фактор-группа O( n )/SO( n ) изоморфна O(1) , причем отображение проекции выбирает [+1] или [−1] в соответствии с определителем. Ортогональные матрицы с определителем −1 не включают единицу и, таким образом, не образуют подгруппу, а только смежный класс ; он также (отдельно) связан. Таким образом, каждая ортогональная группа распадается на две части; и поскольку отображение проекции разделяет , O( n ) является полупрямым произведением SO ( n ) на O(1) . С практической точки зрения сопоставимое утверждение заключается в том, что любую ортогональную матрицу можно получить, взяв матрицу вращения и, возможно, отрицая один из ее столбцов, как мы видели с матрицами 2 × 2 . Если n нечетно, то полупрямое произведение на самом деле является прямым произведением , и любая ортогональная матрица может быть получена путем взятия матрицы вращения и, возможно, отрицания всех ее столбцов. Это следует из свойства определителей, что отрицание столбца отрицает определитель, и, таким образом, отрицание нечетного (но не четного) числа столбцов отрицает определитель.
Теперь рассмотрим ортогональные матрицы ( n + 1) × ( n + 1) с нижним правым элементом, равным 1. Остаток последнего столбца (и последней строки) должен быть нулем, а произведение любых двух таких матриц имеет одинаковую форму. Остальная часть матрицы является ортогональной матрицей n × n ; таким образом, O( n ) является подгруппой O( n + 1) (и всех более высоких групп).
Поскольку элементарное отражение в форме матрицы Хаусхолдера может привести любую ортогональную матрицу к этой ограниченной форме, серия таких отражений может привести любую ортогональную матрицу к тождеству; таким образом, ортогональная группа является группой отражений . Последний столбец может быть зафиксирован на любом единичном векторе, и каждый выбор дает другую копию O( n ) в O( n + 1) ; таким образом, O( n + 1) является расслоением над единичной сферой S n со слоем O( n ) .
Аналогично, SO( n ) является подгруппой SO( n + 1) ; и любая специальная ортогональная матрица может быть сгенерирована вращениями плоскости Гивенса с использованием аналогичной процедуры. Структура пучка сохраняется: SO( n ) ↪ SO( n + 1) → S n . Один поворот может произвести ноль в первой строке последнего столбца, а серия из n − 1 поворотов обнулит все, кроме последней строки последнего столбца матрицы поворота n × n . Поскольку плоскости фиксированы, каждое вращение имеет только одну степень свободы, свой угол. По индукции, SO( n ) имеет степени свободы, и O( n ) тоже .
Матрицы перестановок еще проще; они образуют не группу Ли, а только конечную группу, порядка n ! симметрическую группу S n . По тому же типу аргумента, S n является подгруппой S n + 1 . Четные перестановки производят подгруппу матриц перестановок с определителем +1, порядка н !/2 чередующаяся группа .
В более широком смысле, эффект любой ортогональной матрицы разделяется на независимые действия на ортогональных двумерных подпространствах. То есть, если Q является специальным ортогональным, то всегда можно найти ортогональную матрицу P , (вращательное) изменение базиса , которое приводит Q к блочно-диагональной форме:
где матрицы R 1 , ..., R k являются матрицами вращения 2 × 2 , а остальные элементы равны нулю. В исключительных случаях блок вращения может быть диагональным, ± I . Таким образом, отрицая один столбец, если необходимо, и отмечая, что отражение 2 × 2 диагонализируется до +1 и −1, любую ортогональную матрицу можно привести к виду
Матрицы R 1 , ..., R k дают сопряженные пары собственных значений, лежащих на единичной окружности в комплексной плоскости ; таким образом, это разложение подтверждает, что все собственные значения имеют абсолютное значение 1. Если n нечетно, существует по крайней мере одно действительное собственное значение, +1 или −1; для вращения 3 × 3 собственный вектор, связанный с +1, является осью вращения.
Предположим, что элементы Q являются дифференцируемыми функциями t , и что t = 0 дает Q = I. Дифференцирование условия ортогональности дает
Оценка при t = 0 ( Q = I ) тогда подразумевает
В терминах группы Ли это означает, что алгебра Ли ортогональной матричной группы состоит из кососимметричных матриц . Идя в другую сторону, матричная экспонента любой кососимметричной матрицы является ортогональной матрицей (фактически, специальной ортогональной).
Например, трехмерный объект, который физика называет угловой скоростью , является дифференциальным вращением, то есть вектором в алгебре Ли, касательным к SO(3) . При условии, что ω = ( xθ , yθ , zθ ) , а v = ( x , y , z ) — единичный вектор, правильная кососимметричная матричная форма ω имеет вид
Экспонента этого является ортогональной матрицей для вращения вокруг оси v на угол θ ; устанавливая c = cos θ/2 , s = грех θ/2 ,
Численный анализ использует многие свойства ортогональных матриц для числовой линейной алгебры, и они возникают естественным образом. Например, часто желательно вычислить ортонормальный базис для пространства или ортогональное изменение базисов; оба принимают форму ортогональных матриц. Наличие определителя ±1 и всех собственных значений величиной 1 имеет большое преимущество для числовой устойчивости . Одним из следствий является то, что число условий равно 1 (что является минимумом), поэтому ошибки не увеличиваются при умножении на ортогональную матрицу. Многие алгоритмы используют ортогональные матрицы, такие как отражения Хаусхолдера и вращения Гивенса по этой причине. Также полезно то, что ортогональная матрица не только обратима, но и ее обратная матрица доступна по существу бесплатно путем обмена индексами.
Перестановки необходимы для успеха многих алгоритмов, включая рабочую лошадку Гауссова исключения с частичным поворотом (где поворот осуществляется перестановками). Однако они редко появляются явно как матрицы; их особая форма допускает более эффективное представление, например, список из n индексов.
Аналогично, алгоритмы, использующие матрицы Хаусхолдера и Гивенса, обычно используют специализированные методы умножения и хранения. Например, поворот Гивенса влияет только на две строки матрицы, которые он умножает, изменяя полное умножение порядка n 3 на гораздо более эффективный порядок n . Когда использование этих отражений и поворотов вводит нули в матрицу, освобожденного пространства достаточно для хранения достаточного количества данных для воспроизведения преобразования, и для того, чтобы сделать это надежно. (Следуя Стюарту (1976), мы не храним угол поворота, который является и дорогим, и плохо себя ведет.)
Ряд важных матричных разложений (Голуб и Ван Лоан, 1996) включают в себя ортогональные матрицы, в частности:
Рассмотрим переопределенную систему линейных уравнений , которая может возникнуть при повторных измерениях физического явления для компенсации экспериментальных ошибок. Запишем A x = b , где A равно m × n , m > n . QR- разложение сводит A к верхнему треугольному R. Например, если A равно 5 × 3, то R имеет вид
Задача линейного метода наименьших квадратов состоит в том, чтобы найти x , который минимизирует ‖ A x − b ‖ , что эквивалентно проецированию b на подпространство, охватываемое столбцами A . Предполагая, что столбцы A (и, следовательно, R ) независимы, решение проекции находится из A T A x = A T b . Теперь A T A является квадратным ( n × n ) и обратимым, а также равным R T R . Но нижние строки нулей в R являются излишними в произведении, которое, таким образом, уже находится в нижнетреугольной верхнетреугольной факторизованной форме, как в методе исключения Гаусса ( разложении Холецкого ). Здесь ортогональность важна не только для сведения A T A = ( R T Q T ) QR к R T R , но и для возможности решения без увеличения численных задач.
В случае линейной системы, которая недоопределена, или иным образом необратимой матрицы , разложение по сингулярным значениям (SVD) одинаково полезно. При факторизации A как U Σ V T удовлетворительное решение использует псевдообратную матрицу Мура-Пенроуза , V Σ + U T , где Σ + просто заменяет каждый ненулевой диагональный элемент на его обратную величину. Установите x в V Σ + U T b .
Случай квадратной обратимой матрицы также представляет интерес. Предположим, например, что A — это матрица вращения 3 × 3 , которая была вычислена как композиция многочисленных поворотов и изгибов. Плавающая точка не соответствует математическому идеалу действительных чисел, поэтому A постепенно утратила свою истинную ортогональность. Процесс Грама–Шмидта мог бы ортогонализовать столбцы, но это не самый надежный, не самый эффективный и не самый инвариантный метод. Полярное разложение разлагает матрицу на пару, одна из которых является уникальной ближайшей ортогональной матрицей к заданной матрице или одной из самых близких, если заданная матрица является вырожденной. (Близость может быть измерена любой матричной нормой , инвариантной относительно ортогонального изменения базиса, такой как спектральная норма или норма Фробениуса.) Для почти ортогональной матрицы быстрой сходимости к ортогональному множителю можно добиться с помощью подхода « метода Ньютона » Хайэма (1986) (1990), многократно усредняя матрицу с ее обратным транспонированием. Дюбрюлль (1999) опубликовал ускоренный метод с удобным тестом сходимости.
Например, рассмотрим неортогональную матрицу, для которой простой алгоритм усреднения занимает семь шагов и которую ускорение сокращает до двух шагов (при γ = 0,353553, 0,565685).
Метод Грама-Шмидта дает худшее решение, показанное расстоянием Фробениуса 8,28659 вместо минимального 8,12404.
Некоторые числовые приложения, такие как методы Монте-Карло и исследование многомерных пространств данных, требуют генерации равномерно распределенных случайных ортогональных матриц. В этом контексте «равномерный» определяется в терминах меры Хаара , которая по сути требует, чтобы распределение не менялось при умножении на любую свободно выбранную ортогональную матрицу. Ортогонализация матриц с независимыми равномерно распределенными случайными элементами не приводит к равномерно распределенным ортогональным матрицам [ требуется ссылка ] , но QR- разложение независимых нормально распределенных случайных элементов приводит, пока диагональ R содержит только положительные элементы (Mezzadri 2006). Стюарт (1980) заменил это более эффективной идеей, которую Диаконис и Шахшахани (1987) позже обобщили как «алгоритм подгруппы» (в такой форме он работает так же хорошо для перестановок и вращений). Чтобы сгенерировать ортогональную матрицу ( n + 1) × ( n + 1) , возьмите матрицу n × n и равномерно распределенный единичный вектор размерности n + 1. Постройте отражение Хаусхолдера из вектора, затем примените его к меньшей матрице (встроенной в большую матрицу с 1 в правом нижнем углу).
Проблема нахождения ортогональной матрицы Q, ближайшей к заданной матрице M, связана с задачей ортогонального Прокруста . Существует несколько различных способов получить единственное решение, простейший из которых — взять разложение сингулярных значений M и заменить сингулярные значения единицами. Другой метод выражает R явно, но требует использования квадратного корня матрицы : [2]
Это можно объединить с вавилонским методом извлечения квадратного корня из матрицы, чтобы получить рекуррентное соотношение, которое сходится к ортогональной матрице квадратично: где Q 0 = M .
Эти итерации устойчивы при условии , что число обусловленности M меньше трех. [3]
Использование аппроксимации первого порядка обратной функции и той же инициализации приводит к модифицированной итерации:
Тонкая техническая проблема затрагивает некоторые применения ортогональных матриц. Не только компоненты группы с определителем +1 и −1 не связаны друг с другом, даже компонент +1, SO( n ) , не является просто связанным (за исключением SO(1), который тривиален). Таким образом, иногда выгодно или даже необходимо работать с покрывающей группой SO( n ), спиновой группой , Spin( n ) . Аналогично, O( n ) имеет покрывающие группы, пин-группы , Pin( n ). Для n > 2 , Spin( n ) является просто связанным и, таким образом, универсальной покрывающей группой для SO( n ) . Безусловно, самым известным примером спиновой группы является Spin(3) , которая есть не что иное, как SU(2) , или группа единичных кватернионов .
Группы Pin и Spin находятся в алгебрах Клиффорда , которые сами по себе могут быть построены из ортогональных матриц.
Если Q не является квадратной матрицей, то условия Q T Q = I и QQ T = I не эквивалентны. Условие Q T Q = I говорит, что столбцы Q ортонормальны. Это может произойти только если Q является матрицей m × n с n ≤ m (из-за линейной зависимости). Аналогично, QQ T = I говорит, что строки Q ортонормальны, что требует n ≥ m .
Для этих матриц нет стандартной терминологии. Их называют по-разному: «полуортогональные матрицы», «ортонормированные матрицы», «ортогональные матрицы», а иногда просто «матрицы с ортонормированными строками/столбцами».
В случае n ≤ m матрицы с ортонормированными столбцами можно назвать ортогональными k-фреймами , и они являются элементами многообразия Штифеля .