stringtranslate.com

Ортогональная матрица

В линейной алгебре ортогональная матрица или ортонормированная матрица — это действительная квадратная матрица , столбцы и строки которой являются ортонормированными векторами .

Один из способов выразить это

Q Tтранспонирование,Iединичная матрица

Это приводит к эквивалентной характеристике: матрица Q ортогональна, если ее транспонирование равно обратному :

Q −1Q

Ортогональная матрица Q обязательно обратима (с обратным Q −1 = QT ), унитарна ( Q −1 = Q ), где Q эрмитово сопряженное ( сопряженное транспонирование ) матрицы Q , и, следовательно, нормальная ( Q Q = QQ ) над действительными числами . Определитель любой ортогональной матрицы равен +1 или -1 . В качестве линейного преобразования ортогональная матрица сохраняет скалярное произведение векторов и, следовательно, действует как изометрия евклидова пространства , например вращение , отражение или роторное отражение . Другими словами, это унитарное преобразование .

Набор ортогональных матриц размера n × n при умножении образует группу O( n ) , известную как ортогональная группа . Подгруппа SO( n ) , состоящая из ортогональных матриц с определителем +1, называется специальной ортогональной группой , а каждый ее элемент является специальной ортогональной матрицей . В качестве линейного преобразования каждая специальная ортогональная матрица действует как вращение.

Обзор

Визуальное понимание умножения путем транспонирования матрицы. Если A — ортогональная матрица, а B — ее транспонированная, ij-й элемент произведения AA T обратится в нуль, если i≠j, потому что i-я строка A ортогональна j-й строке A.

Ортогональная матрица — это реальная специализация унитарной матрицы и, следовательно, всегда нормальная матрица . Хотя мы рассматриваем здесь только вещественные матрицы, определение можно использовать для матриц с элементами из любого поля . Однако ортогональные матрицы естественным образом возникают из скалярных произведений , а для матриц комплексных чисел это вместо этого приводит к унитарному требованию. Ортогональные матрицы сохраняют скалярное произведение, [1] поэтому для векторов u и v в n -мерном вещественном евклидовом пространстве

Qvnевклидовом пространствеvv T vQ v

Таким образом, конечномерные линейные изометрии — вращения, отражения и их комбинации — создают ортогональные матрицы. Верно и обратное: ортогональные матрицы предполагают ортогональные преобразования. Однако линейная алгебра включает ортогональные преобразования между пространствами, которые не могут быть ни конечномерными, ни иметь одну и ту же размерность, и они не имеют ортогонального матричного эквивалента.

Ортогональные матрицы важны по ряду причин, как теоретических, так и практических. Ортогональные матрицы размера n × n образуют группу при умножении матриц, ортогональную группу, обозначаемую O( n ) , которая вместе со своими подгруппами широко используется в математике и физических науках. Например, точечная группа молекулы является подгруппой O(3). Поскольку версии ортогональных матриц с плавающей запятой обладают выгодными свойствами, они являются ключевыми для многих алгоритмов числовой линейной алгебры, таких как QR- разложение . Другой пример: при соответствующей нормализации дискретное косинусное преобразование (используемое при сжатии MP3 ) представляется ортогональной матрицей.

Примеры

Ниже приведены несколько примеров небольших ортогональных матриц и возможных интерпретаций.

Элементарные конструкции

Нижние размеры

Простейшими ортогональными матрицами являются матрицы 1 × 1 [1] и [−1], которые мы можем интерпретировать как тождество и отражение действительной линии через начало координат.

Матрицы 2 × 2 имеют вид

При рассмотрении первого уравнения без ограничения общности положим p = cos θ , q = sin θ ; тогда либо т знак равно - q , ты знак равно п, либо т знак равно q , ты знак равно - п . Мы можем интерпретировать первый случай как поворот на θ (где θ = 0 — единица), а второй — как отражение через линию под угломθ/2.

Особый случай матрицы отражения с θ = 90° генерирует отражение относительно линии под углом 45°, заданной y = x , и, следовательно, меняет местами x и y ; это матрица перестановок с одной единицей в каждом столбце и строке (в противном случае 0):

Идентичность также является матрицей перестановок.

Отражение — это его собственная инверсия , что означает, что матрица отражения симметрична (равна ее транспонированию), а также ортогональна. Произведение двух матриц вращения является матрицей вращения , а произведение двух матриц отражения также является матрицей вращения.

Высшие измерения

Независимо от размерности всегда можно классифицировать ортогональные матрицы как чисто вращательные или нет, но для матриц 3 × 3 и больше невращательные матрицы могут быть более сложными, чем отражения. Например,

представляют собой инверсию через начало координат и ротоинверсию соответственно вокруг оси z .

Вращение становится более сложным в более высоких измерениях; они больше не могут быть полностью охарактеризованы одним углом и могут влиять на более чем одно плоское подпространство. Матрицу вращения 3 × 3 принято описывать с помощью оси и угла , но это работает только в трех измерениях. Выше трех измерений необходимы два или более углов, каждый из которых связан с плоскостью вращения .

Однако у нас есть элементарные строительные блоки для перестановок, отражений и вращений, которые применимы в целом.

Примитивы

Самая элементарная перестановка — это транспозиция, полученная из единичной матрицы путем замены двух строк. Любая матрица перестановок размера n × n может быть построена как произведение не более чем n − 1 транспозиций.

Отражение Хаусхолдера строится из ненулевого вектора v как

Здесь числитель — симметричная матрица, а знаменатель — число, квадрат величины v . Это отражение в гиперплоскости, перпендикулярной v (отрицающее любую компоненту вектора, параллельную v ). Если v — единичный вектор, то Q = I − 2 vv T достаточно. Отражение Хаусхолдера обычно используется для одновременного обнуления нижней части колонны. Любая ортогональная матрица размера n × n может быть построена как произведение не более n таких отражений.

Вращение Гивенса действует на двумерное (плоское) подпространство, охватываемое двумя координатными осями, вращающееся на выбранный угол. Обычно он используется для обнуления одной субдиагональной записи. Любая матрица вращения размера n × n может быть построена как произведение не болееп ( п - 1)/2такие вращения. В случае матриц 3×3 достаточно трех таких поворотов; и, зафиксировав последовательность, мы можем, таким образом, описать все матрицы вращения 3 × 3 (хотя и не однозначно) в терминах трех используемых углов, часто называемых углами Эйлера .

Вращение Якоби имеет ту же форму, что и вращение Гивенса, но используется для обнуления обоих недиагональных элементов симметричной подматрицы 2 × 2 .

Характеристики

Свойства матрицы

Действительная квадратная матрица ортогональна тогда и только тогда, когда ее столбцы образуют ортонормированный базис евклидова пространства Rn с обычным евклидовым скалярным произведением , что имеет место тогда и только тогда , когда ее строки образуют ортонормированный базис Rn . Может возникнуть соблазн предположить, что матрица с ортогональными (не ортонормированными) столбцами будет называться ортогональной матрицей, но такие матрицы не представляют особого интереса и не имеют специального названия; они удовлетворяют только M T M = D , где D является диагональной матрицей .

Определитель любой ортогональной матрицы равен +1 или -1 . Это следует из следующих основных фактов об детерминантах:

Обратное неверно; наличие определителя ±1 не является гарантией ортогональности даже для ортогональных столбцов, как показывает следующий контрпример.

В матрицах перестановок определитель соответствует сигнатуре и равен +1 или -1, поскольку четность перестановки четная или нечетная, поскольку определитель является альтернативной функцией строк.

Более сильным, чем ограничение на детерминант, является тот факт, что ортогональную матрицу всегда можно диагонализовать по комплексным числам , чтобы получить полный набор собственных значений , каждое из которых должно иметь (комплексный) модуль  1.

Свойства группы

Обратная каждая ортогональная матрица снова ортогональна, как и матричное произведение двух ортогональных матриц. Фактически, набор всех ортогональных матриц размера n × n удовлетворяет всем аксиомам группы . Это компактная группа Ли размерностип ( п - 1)/2, называемая ортогональной группой и обозначаемая O( n ) .

Ортогональные матрицы, определитель которых равен +1, образуют линейно-связную нормальную подгруппу O ( n ) индекса 2 , специальную ортогональную группу SO( n ) вращений. Факторгруппа O( n )/SO( n ) изоморфна O(1) с проекционным отображением, выбирающим [+1] или [−1] в соответствии с определителем. Ортогональные матрицы с определителем −1 не содержат единицы и поэтому не образуют подгруппу, а только смежный класс ; он также (отдельно) подключен. Таким образом, каждая ортогональная группа распадается на две части; и поскольку карта проекции разделяется , O( n ) является полупрямым произведением SO ( n ) на O(1) . С практической точки зрения аналогичное утверждение состоит в том, что любую ортогональную матрицу можно получить, взяв матрицу вращения и, возможно, отрицая один из ее столбцов, как мы видели на примере матриц 2 × 2 . Если n нечетно, то полупрямое произведение на самом деле является прямым произведением , и любую ортогональную матрицу можно получить, взяв матрицу вращения и, возможно, отрицая все ее столбцы. Это следует из свойства определителей, согласно которому отрицание столбца отрицает определитель, и, таким образом, отрицание нечетного (но не четного) числа столбцов отрицает определитель.

Теперь рассмотрим ( n + 1) × ( n + 1) ортогональные матрицы с нижней правой записью, равной 1. Остаток последнего столбца (и последней строки) должен быть нулями, а произведение любых двух таких матриц имеет тот же вид . Остальная часть матрицы представляет собой ортогональную матрицу размера n × n ; таким образом, O( n ) является подгруппой O( n + 1) (и всех более высоких групп).

Поскольку элементарное отражение в форме матрицы Хаусхолдера может привести любую ортогональную матрицу к этой ограниченной форме, серия таких отражений может привести любую ортогональную матрицу к единице; таким образом, ортогональная группа является группой отражения . Последний столбец может быть привязан к любому единичному вектору, и каждый выбор дает другую копию O( n ) в O( n + 1) ; таким образом, O ( n + 1) является расслоением над единичной сферой Sn со слоем O( n ) .

Аналогично, SO( n ) является подгруппой SO( n + 1) ; и любая специальная ортогональная матрица может быть создана путем вращения плоскости Гивенса с использованием аналогичной процедуры. Структура расслоения сохраняется: SO( n ) ↪ SO( n + 1) → S n . Одно вращение может дать ноль в первой строке последнего столбца, а серия из n - 1 вращений обнулит все, кроме последней строки последнего столбца матрицы вращения n × n . Поскольку плоскости фиксированы, каждое вращение имеет только одну степень свободы — угол. Следовательно , по индукции SO( n ) имеет

O( n )

Матрицы перестановок еще проще; они образуют не группу Ли, а только конечную группу порядка n ! симметричная группа S n . По тем же соображениям Sn является подгруппой Sn + 1 . Четные перестановки образуют подгруппу матриц перестановок определителя +1 порядкан !/2 чередующаяся группа .

Каноническая форма

В более широком смысле, эффект любой ортогональной матрицы разделяется на независимые действия на ортогональных двумерных подпространствах. То есть, если Q является специальной ортогональной, то всегда можно найти ортогональную матрицу P , (вращательную) замену базиса , которая приводит Q в блочно-диагональную форму:

где матрицы R 1 , ..., R k представляют собой матрицы вращения 2 × 2 , а остальные элементы равны нулю. В исключительных случаях блок вращения может быть диагональным, ± I. Таким образом, отрицая при необходимости один столбец и отмечая, что отражение 2 × 2 диагонализируется до +1 и -1, любую ортогональную матрицу можно привести к виду

Матрицы R1 , ..., Rk дают сопряженные пары собственных значений , лежащих на единичной окружности комплексной плоскости ; таким образом, это разложение подтверждает, что все собственные значения имеют абсолютное значение 1. Если n нечетно, существует хотя бы одно действительное собственное значение, +1 или -1; для вращения 3 × 3 собственный вектор, связанный с +1, является осью вращения.

Алгебра Ли

Предположим , что элементы Q являются дифференцируемыми функциями t , и что t = 0 дает Q = I. Дифференцирование условия ортогональности

Тогда оценка при t = 0 ( Q = I ) подразумевает

В терминах группы Ли это означает, что алгебра Ли группы ортогональных матриц состоит из кососимметричных матриц . С другой стороны, матричная экспонента любой кососимметричной матрицы является ортогональной матрицей (фактически специальной ортогональной).

Например, физика трехмерных объектов называет угловую скорость дифференциальным вращением, то есть вектором в алгебре Ли , касательным к SO(3) . Учитывая ω = ( , , ) , где v = ( x , y , z ) является единичным вектором, правильная кососимметричная матричная форма ω равна

Экспонента этого является ортогональной матрицей для вращения вокруг оси v на угол θ ; установка c = cosθ/2, s = грехθ/2,

Численная линейная алгебра

Преимущества

Численный анализ использует многие свойства ортогональных матриц числовой линейной алгебры, и они возникают естественным образом. Например, часто желательно вычислить ортонормированный базис пространства или ортогональную замену базисов; оба принимают форму ортогональных матриц. Наличие определителя ±1 и всех собственных значений величины 1 очень полезно для числовой стабильности . Одним из следствий является то, что число обусловленности равно 1 (что является минимумом), поэтому ошибки не увеличиваются при умножении на ортогональную матрицу. По этой причине многие алгоритмы используют ортогональные матрицы, такие как отражения Хаусхолдера и вращения Гивенса . Полезно также то, что ортогональная матрица не только обратима, но и то, что ее обратная матрица доступна практически бесплатно путем обмена индексами.

Перестановки необходимы для успеха многих алгоритмов, включая метод исключения Гаусса с частичным поворотом (когда поворот осуществляется перестановками). Однако они редко появляются явно в виде матриц; их специальная форма обеспечивает более эффективное представление, например, список из n индексов.

Аналогичным образом, алгоритмы, использующие матрицы Хаусхолдера и Гивенса, обычно используют специализированные методы умножения и хранения. Например, вращение Гивенса влияет только на две строки перемножаемой матрицы, изменяя полное умножение порядка n 3 на гораздо более эффективный порядок n . Когда использование этих отражений и вращений приводит к появлению нулей в матрице, освободившегося пространства достаточно для хранения достаточного количества данных для воспроизведения преобразования и для надежного выполнения этого преобразования. (Следуя Стюарту (1976), мы не сохраняем угол поворота, что дорого и плохо ведет себя.)

Разложения

Ряд важных матричных разложений (Golub & Van Loan 1996) используют ортогональные матрицы, в том числе:

QR- разложение
M = QR , Q ортогональный, R верхний треугольный
Разложение по сингулярным значениям
M = U Σ V T , U и V ортогональны, Σ диагональная матрица
Собственное разложение симметричной матрицы (разложение по спектральной теореме )
S = Q Λ Q T , S симметричный, Q ортогональный, Λ диагональный
Полярное разложение
M = QS , Q ортогональный, S симметричный положительно-полуопределенный

Примеры

Рассмотрим переопределенную систему линейных уравнений , что может произойти при повторных измерениях физического явления для компенсации экспериментальных ошибок. Запишите A x знак равно b , где A равно m × n , m > n . QR - разложение сводит A к верхнему треугольному R. Например, если A равно 5 × 3 , то R имеет вид

Линейная задача наименьших квадратов состоит в том, чтобы найти x , который минимизирует A xb , что эквивалентно проецированию b в подпространство, охватываемое столбцами A . Предполагая, что столбцы A (и, следовательно, R ) независимы, проекционное решение находится из AT A x = AT b . Теперь AT A является квадратным ( n × n ) и обратимым, а также равным R T R. Но нижние строки нулей в R являются лишними в произведении, которое, таким образом, уже находится в нижнетреугольной верхнетреугольной факторизованной форме, как при методе исключения Гаусса ( разложение Холецкого ). Здесь ортогональность важна не только для уменьшения AT A = (RT Q T ) QR до R T R , но также для возможности решения без увеличения числовых задач.

В случае линейной системы, которая недоопределена, или иным образом необратимой матрицы , разложение по сингулярным значениям (SVD) одинаково полезно. Если A факторизован как U Σ V T , удовлетворительное решение использует псевдообратное выражение Мура-Пенроуза V Σ + U T , где Σ + просто заменяет каждый ненулевой диагональный элемент на обратный. Установите x на V Σ + U T b .

Интересен также случай квадратной обратимой матрицы. Предположим, например, что A — матрица вращения размером 3 × 3 , которая была вычислена как композиция многочисленных поворотов. Плавающая точка не соответствует математическому идеалу действительных чисел, поэтому A постепенно утратило свою истинную ортогональность. Процесс Грама -Шмидта мог бы ортогонализировать столбцы, но это не самый надежный, не самый эффективный и не самый инвариантный метод. Полярное разложение разлагает матрицу на пару, одна из которых является уникальной ближайшей ортогональной матрицей к данной матрице или одной из ближайших, если данная матрица сингулярна. (Близость может быть измерена с помощью любой матричной нормы, инвариантной относительно ортогональной замены базиса, такой как спектральная норма или норма Фробениуса.) Для почти ортогональной матрицы быстрая сходимость к ортогональному множителю может быть достигнута с помощью «метода Ньютона ». подход Хайэма (1986) (1990), многократно усредняющий матрицу с ее обратным транспонированием. Дубрулль (1999) опубликовал ускоренный метод с удобным тестом сходимости.

Например, рассмотрим неортогональную матрицу, для которой простой алгоритм усреднения занимает семь шагов.

γ

Грам-Шмидт дает худшее решение, демонстрируемое расстоянием Фробениуса 8,28659 вместо минимального 8,12404.

Рандомизация

Некоторые численные приложения, такие как методы Монте-Карло и исследование многомерных пространств данных, требуют создания равномерно распределенных случайных ортогональных матриц. В этом контексте «равномерность» определяется с точки зрения меры Хаара , которая по существу требует, чтобы распределение не менялось при умножении на любую свободно выбранную ортогональную матрицу. Ортогонализация матриц с независимыми равномерно распределенными случайными элементами не приводит к образованию равномерно распределенных ортогональных матриц [ нужна ссылка ] , но QR- разложение независимых нормально распределенных случайных элементов приводит к этому, пока диагональ R содержит только положительные элементы (Mezzadri 2006). Стюарт (1980) заменил это более эффективной идеей, которую Диаконис и Шахшахани (1987) позже обобщили как «алгоритм подгруппы» (в этой форме он так же хорошо работает для перестановок и вращений). Чтобы сгенерировать ортогональную матрицу ( n + 1) × ( n + 1) , возьмите матрицу n × n и равномерно распределенный единичный вектор размерности n + 1 . Постройте отражение Хаусхолдера из вектора, затем примените его к меньшей матрице (встроенной в матрицу большего размера с цифрой 1 в правом нижнем углу).

Ближайшая ортогональная матрица

Проблема нахождения ортогональной матрицы Q, ближайшей к данной матрице M , связана с ортогональной проблемой Прокруста . Существует несколько различных способов получить уникальное решение, самый простой из которых — разложить M по сингулярным значениям и заменить сингулярные значения единицами. Другой метод выражает R явно, но требует использования матричного квадратного корня : [2]

Это можно объединить с вавилонским методом извлечения квадратного корня из матрицы, чтобы получить рекурсию, которая квадратично сходится к ортогональной матрице:

Q 0 = М

Эти итерации стабильны, если число обусловленности M меньше трех. [3]

Использование обратного приближения первого порядка и той же инициализации приводит к модифицированной итерации:

Вращение и булавка

В некоторых случаях использования ортогональных матриц возникает тонкая техническая проблема. Компоненты группы с определителем +1 и −1 не только не связаны друг с другом, но даже компонент +1, SO( n ) , не является односвязным (за исключением SO(1), что тривиально). Таким образом, иногда полезно или даже необходимо работать с покрывающей группой SO( n ), спиновой группой Spin( n ) . Аналогично, O( n ) имеет покрывающие группы, группы выводов Pin( n ). Для n > 2 Spin( n ) односвязен и, следовательно, является универсальной накрывающей группой для SO( n ) . Безусловно, самым известным примером спиновой группы является Spin(3) , которая представляет собой не что иное, как SU(2) или группу единичных кватернионов .

Группы Pin и Spin находятся в алгебрах Клиффорда , которые сами могут быть построены из ортогональных матриц.

Прямоугольные матрицы

Если Q не является квадратной матрицей, то условия Q T Q = I и QQ T = I не эквивалентны. Условие Q T Q = I говорит, что столбцы Q ортонормированы. Это может произойти только в том случае, если Q — матрица размера m × n с nm (из-за линейной зависимости). Аналогично, QQ T = I говорит, что строки Q ортонормированы, что требует nm .

Для этих матриц не существует стандартной терминологии. Их по-разному называют «полуортогональными матрицами», «ортонормированными матрицами», «ортогональными матрицами», а иногда просто «матрицами с ортонормированными строками/столбцами».

В случае nm матрицы с ортонормированными столбцами можно назвать ортогональными k-шкалами и они являются элементами многообразия Штифеля .

Смотрите также

Примечания

  1. ^ «Онлайн-заметки Пола по математике» [ нужна полная ссылка ] , Пол Докинз, Университет Ламара , 2008. Теорема 3(c)
  2. ^ «Нахождение ближайшей ортонормированной матрицы», Бертольд К.П. Хорн , Массачусетский технологический институт .
  3. ^ «Метод Ньютона для квадратного корня матрицы». Архивировано 29 сентября 2011 г. в Wayback Machine , Николас Дж. Хайэм, Математика вычислений, том 46, номер 174, 1986.

Рекомендации

Внешние ссылки