Представление обратимых матриц в виде унитарного оператора, умножающего эрмитов оператор
В математике полярное разложение квадратной действительной или комплексной матрицы представляет собой факторизацию вида , где — унитарная матрица , а — положительно полуопределенная эрмитова матрица ( — ортогональная матрица , а — положительно полуопределенная симметричная матрица в действительном случае ), обе квадратные и одинакового размера. [1]
Если действительная матрица интерпретируется как линейное преобразование -мерного пространства , полярное разложение разделяет его на поворот или отражение и масштабирование пространства вдоль набора ортогональных осей.
Полярное разложение квадратной матрицы всегда существует. Если обратимо , разложение однозначно, и множитель будет положительно-определенным . В этом случае можно однозначно записать в виде , где унитарно, а — уникальный самосопряженный логарифм матрицы . [2] Это разложение полезно при вычислении фундаментальной группы (матричных) групп Ли . [3]
Полярное разложение можно также определить как , где — симметричная положительно определенная матрица с теми же собственными значениями, что и , но с другими собственными векторами.
Полярное разложение матрицы можно рассматривать как матричный аналог полярной формы комплексного числа как , где — его абсолютное значение (неотрицательное действительное число ), а — комплексное число с единичной нормой (элемент группы окружности ) .
Определение может быть расширено до прямоугольных матриц, требуя, чтобы матрица была полуунитарной и была положительно-полуопределенной эрмитовой матрицей. Разложение всегда существует и всегда уникально. Матрица уникальна тогда и только тогда, когда имеет полный ранг. [4]
Геометрическая интерпретация
Действительная квадратная матрица может быть интерпретирована как линейное преобразование , которое переводит вектор-столбец в . Тогда в полярном разложении множитель является действительной ортонормированной матрицей. Полярное разложение тогда можно рассматривать как выражение линейного преобразования, определяемого в масштабирование пространства вдоль каждого собственного вектора на масштабный множитель (действие ), за которым следует вращение (действие ).
В качестве альтернативы, разложение выражает преобразование, определяемое как вращение ( ), за которым следует масштабирование ( ) вдоль определенных ортогональных направлений. Масштабные коэффициенты одинаковы, но направления различны.
Характеристики
Полярное разложение комплексно сопряженного числа задается формулой Примечание, которая дает соответствующее полярное разложение определителя A , поскольку и . В частности, если имеет определитель 1, то и и имеют определитель 1.
Положительно-полуопределенная матрица P всегда уникальна, даже если A является вырожденной , и обозначается как , где обозначает сопряженное транспонирование . Уникальность P гарантирует, что это выражение является корректно определенным. Уникальность гарантируется тем фактом, что является положительно-полуопределенной эрмитовой матрицей и, следовательно, имеет единственный положительно-полуопределенный эрмитов квадратный корень . [5] Если A обратима, то P положительно-определена, следовательно, также обратима, и матрица U однозначно определяется
Отношение к СВД
В терминах разложения по сингулярным значениям (SVD) , , имеем где , , и являются унитарными матрицами (называемыми ортогональными матрицами, если поле является вещественными числами ). Это подтверждает, что является положительно определенным и унитарным. Таким образом, существование SVD эквивалентно существованию полярного разложения.
Можно также разложить в виде Здесь то же самое, что и раньше, и задается как Это известно как левополярное разложение, тогда как предыдущее разложение известно как правополярное разложение. Левополярное разложение также известно как обратнополярное разложение.
Полярное разложение квадратной обратимой действительной матрицы имеет вид
, где — положительно определенная матрица , а — ортогональная матрица.
Отношение к нормальным матрицам
Матрица с полярным разложением является нормальной тогда и только тогда, когда и коммутируют : , или, что эквивалентно, они одновременно диагонализируемы .
Строительство и доказательства существования
Основная идея построения полярного разложения аналогична идее, используемой для вычисления сингулярного разложения .
Вывод для нормальных матриц
Если является нормальной , то она унитарно эквивалентна диагональной матрице: для некоторой унитарной матрицы и некоторой диагональной матрицы . Это делает вывод ее полярного разложения особенно простым, поскольку тогда мы можем записать ,
где является диагональной матрицей, содержащей фазы элементов , то есть, когда , и когда .
Полярное разложение, таким образом, имеет вид , с и диагональю в собственном базисе и имеющим собственные значения, равные фазам и абсолютным значениям собственных значений , соответственно.
Вывод для обратимых матриц
Из разложения по сингулярным значениям можно показать, что матрица обратима тогда и только тогда, когда (эквивалентно, ). Более того, это верно тогда и только тогда, когда все собственные значения не равны нулю. [6]
В этом случае полярное разложение получается непосредственно путем записи
и наблюдения, что является унитарным. Чтобы увидеть это, мы можем использовать спектральное разложение для записи .
В этом выражении является унитарным, поскольку является. Чтобы показать, что также является унитарным, мы можем использовать SVD , чтобы записать , так что
где снова является унитарным по построению.
Еще один способ непосредственно показать унитарность — это отметить, что, записывая SVD в терминах матриц ранга 1 как , где — сингулярные значения , мы имеем
что напрямую подразумевает унитарность, поскольку матрица унитарна тогда и только тогда, когда ее сингулярные значения имеют унитарное абсолютное значение.
Обратите внимание, что из приведенной выше конструкции следует, что унитарная матрица в полярном разложении обратимой матрицы определяется однозначно .
Общий вывод
SVD квадратной матрицы читается как , с унитарными матрицами и диагональной положительно полуопределенной матрицей. Просто вставляя дополнительную пару s или s, мы получаем две формы полярного разложения : В более общем случае, если — некоторая прямоугольная матрица, ее SVD можно записать как , где теперь и — изометрии с размерами и , соответственно, где , и — снова диагональная положительно полуопределенная квадратная матрица с размерами . Теперь мы можем применить те же рассуждения, которые использовались в приведенном выше уравнении, чтобы записать , но теперь в общем случае не является унитарным. Тем не менее, имеет тот же носитель и диапазон , что и , и удовлетворяет и . Это превращает в изометрию, когда ее действие ограничено носителем , то есть это означает, что является частичной изометрией .
В качестве явного примера этого более общего случая рассмотрим SVD следующей матрицы: Тогда мы имеем , которая является изометрией, но не унитарной. С другой стороны, если мы рассмотрим разложение , мы найдем , которая является частичной изометрией (но не изометрией).
Ограниченные операторы в гильбертовом пространстве
Полярное разложение любого ограниченного линейного оператора A между комплексными гильбертовыми пространствами представляет собой каноническую факторизацию как произведение частичной изометрии и неотрицательного оператора.
Полярное разложение для матриц обобщается следующим образом: если A — ограниченный линейный оператор, то существует единственная факторизация A как произведения A = UP , где U — частичная изометрия, P — неотрицательный самосопряженный оператор, а исходное пространство U является замыканием области значений P.
Оператор U должен быть ослаблен до частичной изометрии, а не унитарной, из-за следующих проблем. Если A — односторонний сдвиг на l 2 ( N ), то | A | = { A * A } 1/2 = I . Таким образом, если A = U | A |, U должен быть A , что не является унитарным.
Существование полярного разложения является следствием леммы Дугласа :
Лемма — Если A , B — ограниченные операторы в гильбертовом пространстве H , и A * A ≤ B * B , то существует стягивание C такое, что A = CB . Более того, C является единственным, если ker( B * ) ⊂ ker( C ).
Оператор C может быть определен как C ( Bh ) := Ah для всех h в H , расширенный по непрерывности до замыкания Ran ( B ) и нулем на ортогональном дополнении ко всем H . Лемма тогда следует, поскольку A * A ≤ B * B влечет ker( B ) ⊂ ker( A ).
В частности. Если A * A = B * B , то C является частичной изометрией, которая единственна, если ker( B * ) ⊂ ker( C ). В общем случае для любого ограниченного оператора A ,
где ( A * A ) 1/2 является единственным положительным квадратным корнем из A * A , заданным обычным функциональным исчислением . Таким образом, по лемме,
для некоторой частичной изометрии U , которая единственна, если ker( A * ) ⊂ ker( U ). Возьмем P равным ( A * A ) 1/2 , и получим полярное разложение A = UP . Обратите внимание, что аналогичный аргумент можно использовать для доказательства A = P'U ' , где P' является положительным, а U ' является частичной изометрией.
Когда H конечномерен, U можно расширить до унитарного оператора; в общем случае это неверно (см. пример выше). В качестве альтернативы полярное разложение можно показать с помощью операторной версии сингулярного разложения .
По свойству непрерывного функционального исчисления | A | находится в C*-алгебре, порожденной A. Аналогичное, но более слабое утверждение справедливо для частичной изометрии: U находится в алгебре фон Неймана, порожденной A. Если A обратим, полярная часть U также будет находиться в C*-алгебре .
Неограниченные операторы
Если A — замкнутый, плотно определенный неограниченный оператор между комплексными гильбертовыми пространствами, то он все еще имеет (единственное) полярное разложение
, где | A | — (возможно, неограниченный) неотрицательный самосопряженный оператор с той же областью определения, что и A , а U — частичная изометрия, исчезающая на ортогональном дополнении области действия ran(| A |).
Доказательство использует ту же лемму, что и выше, которая действует для неограниченных операторов в общем случае. Если dom( A * A ) = dom( B * B ) и A * Ah = B * Bh для всех h ∈ dom( A * A ), то существует частичная изометрия U такая, что A = UB . U уникально, если ran( B ) ⊥ ⊂ ker( U ). Замкнутость и плотность определения оператора A гарантирует, что оператор A * A является самосопряженным (с плотной областью определения) и, следовательно, позволяет определить ( A * A ) 1/2 . Применение леммы дает полярное разложение.
Если неограниченный оператор A присоединен к алгебре фон Неймана M , и A = UP — его полярное разложение, то U принадлежит M , как и спектральная проекция P , 1 B ( P ), для любого борелевского множества B из [0, ∞) .
Кватернионное полярное разложение
Полярное разложение кватернионов с ортонормированным базисом кватернионов зависит от единичной 2-мерной сферы квадратных корней из минус одного , известных как правые версоры . При любом на этой сфере и угле − π < a ≤ π версор находится на единичной 3-сфере Для a = 0 и a = π версор равен 1 или −1, независимо от того, какой r выбран. Норма t кватерниона q — это евклидово расстояние от начала координат до q . Когда кватернион — это не просто действительное число , то существует уникальное полярное разложение:
Здесь r , a , t определяются однозначно, так что r является правым вектором ( r 2 = –1 ), a удовлетворяет 0 < a < π и t > 0 .
Альтернативные планарные разложения
В декартовой плоскости альтернативные плоские кольцевые разложения возникают следующим образом:
- Если x ≠ 0 , z = x (1 + ε( y / x )) является полярным разложением дуального числа z = x + yε , где ε 2 = 0 ; т. е. ε нильпотентно . В этом полярном разложении единичная окружность заменена прямой x = 1 , полярный угол — наклоном y / x , а радиус x отрицателен в левой полуплоскости.
- Если x 2 ≠ y 2 , то единичная гипербола x 2 − y 2 = 1 и ее сопряженная x 2 − y 2 = −1 могут быть использованы для формирования полярного разложения на основе ветви единичной гиперболы через (1, 0) . Эта ветвь параметризуется гиперболическим углом a и записывается
где j 2 = +1 и используется арифметика [7] расщепленных комплексных чисел . Ветвь через (−1, 0) отслеживается − e aj . Поскольку операция умножения на j отражает точку через прямую y = x , сопряженная гипербола имеет ветви, отслеживаемые je aj или − je aj . Поэтому точка в одном из квадрантов имеет полярное разложение в одной из форм:
Множество { 1, −1, j , − j } имеет произведения, которые делают его изоморфным четверной группе Клейна . Очевидно, полярное разложение в этом случае включает элемент из этой группы.
Численное определение полярного разложения матрицы
Для вычисления приближения полярного разложения A = UP обычно аппроксимируется унитарный множитель U. [8] [9] Итерация основана на методе Герона для квадратного корня из 1 и вычисляет, начиная с , последовательность
Комбинация инверсии и эрмитового сопряжения выбирается таким образом, чтобы в сингулярном разложении унитарные множители оставались прежними, а итерация сводилась к методу Герона на сингулярных значениях.
Эту базовую итерацию можно усовершенствовать для ускорения процесса:
- На каждом шаге или через регулярные интервалы оценивается диапазон сингулярных значений , а затем матрица масштабируется для центрирования сингулярных значений вокруг 1 . Коэффициент масштабирования вычисляется с использованием матричных норм матрицы и ее обратной матрицы. Примерами таких оценок масштаба являются:
с использованием норм матриц
суммы строк и суммы столбцов или
с использованием нормы Фробениуса . Включая масштабный коэффициент, итерация теперь
- QR -разложение можно использовать на подготовительном этапе для сведения сингулярной матрицы A к меньшей регулярной матрице, а также на каждом этапе для ускорения вычисления обратной матрицы.
- Метод Герона для вычисления корней можно заменить методами более высокого порядка, например, на основе метода Галлея третьего порядка, что приводит к
Эту итерацию можно снова объединить с масштабированием. Эта конкретная формула имеет то преимущество, что она применима также к сингулярным или прямоугольным матрицам A .
Смотрите также
Ссылки
- ^ Холл 2015 Раздел 2.5
- ^ Холл 2015 Теорема 2.17
- ^ Холл 2015 Раздел 13.3
- ^ Хайэм, Николас Дж.; Шрайбер, Роберт С. (1990). «Быстрое полярное разложение произвольной матрицы». SIAM J. Sci. Stat. Comput . 11 (4). Филадельфия, Пенсильвания, США: Общество промышленной и прикладной математики: 648–655. CiteSeerX 10.1.1.111.9239 . doi :10.1137/0911038. ISSN 0196-5204. S2CID 14268409.
- ^ Холл 2015 Лемма 2.18
- ^ Обратите внимание, что из положительности следует , что все собственные значения действительны и строго положительны.
- ^ Собчик, Г. (1995) «Гиперболическая числовая плоскость», College Mathematics Journal 26:268–80
- ^ Хайэм, Николас Дж. (1986). «Вычисление полярного разложения с приложениями». SIAM J. Sci. Stat. Comput . 7 (4). Филадельфия, Пенсильвания, США: Общество промышленной и прикладной математики: 1160–1174. CiteSeerX 10.1.1.137.7354 . doi :10.1137/0907079. ISSN 0196-5204.
- ^ Байерс, Ральф; Хунго Сюй (2008). «Новое масштабирование итераций Ньютона для полярного разложения и его обратная устойчивость». SIAM J. Matrix Anal. Appl . 30 (2). Филадельфия, Пенсильвания, США: Общество промышленной и прикладной математики: 822–843. CiteSeerX 10.1.1.378.6737 . doi :10.1137/070699895. ISSN 0895-4798.
- Conway, JB : Курс функционального анализа. Graduate Texts in Mathematics . New York: Springer 1990
- Дуглас, РГ : О мажорировании, факторизации и включении диапазона операторов в гильбертовом пространстве. Proc. Amer. Math. Soc. 17 , 413–415 (1966)
- Холл, Брайан С. (2015), Группы Ли, алгебры Ли и представления: элементарное введение , Graduate Texts in Mathematics, т. 222 (2-е изд.), Springer, ISBN 978-3319134666.
- Хельгасон, Сигурдур (1978), Дифференциальная геометрия, группы Ли и симметричные пространства , Academic Press, ISBN 0-8218-2848-7