stringtranslate.com

Квадратный корень матрицы

В математике квадратный корень матрицы расширяет понятие квадратного корня с чисел на матрицы . Матрица B называется квадратным корнем A , если произведение матриц BB равно A. [1]

Некоторые авторы используют название квадратный корень или обозначение A 1/2 только для особого случая, когда A является положительно полуопределенной , для обозначения уникальной матрицы B, которая является положительно полуопределенной и такой, что BB = B T B = A (для вещественных матриц, где B T является транспонированной матрицей B ) .

Реже название квадратный корень может использоваться для любого разложения положительной полуопределенной матрицы A в виде B T B = A , как в разложении Холецкого , даже если BB ≠ A. Это особое значение обсуждается в разделе Положительно определенная матрица § Разложение .

Примеры

В общем случае матрица может иметь несколько квадратных корней. В частности, если то и.

Матрица тождественности 2×2 имеет бесконечно много квадратных корней. Они задаются как

и

где — любые числа (действительные или комплексные), такие что . В частности, если — любая пифагорова тройка , то есть любой набор положительных целых чисел, такой что , то — квадратно-корневая матрица, которая симметрична и имеет рациональные элементы. [2] Таким образом,

Минус тождество имеет квадратный корень, например:

который можно использовать для представления мнимой единицы i и, следовательно, всех комплексных чисел с использованием действительных матриц 2×2, см. Матричное представление комплексных чисел .

Так же, как и в случае с действительными числами , действительная матрица может не иметь действительного квадратного корня, но иметь квадратный корень с комплексными -значными элементами. Некоторые матрицы не имеют квадратного корня. Примером может служить матрица

В то время как квадратный корень неотрицательного целого числа является либо целым, либо иррациональным числом , в противоположность этому матрица целых чисел может иметь квадратный корень, элементы которого рациональны, но не являются целыми, как в примерах выше.

Положительно-полуопределенные матрицы

Симметричная вещественная матрица n × n называется положительно полуопределенной, если для всех (здесь обозначает транспонирование , изменяющее вектор-столбец x в вектор-строку). Квадратная вещественная матрица является положительно полуопределенной тогда и только тогда, когда для некоторой матрицы B . Может быть много различных таких матриц B . Положительно полуопределенная матрица A также может иметь много матриц B таких, что . Однако A всегда имеет ровно один квадратный корень B , который является положительно полуопределенным и симметричным. В частности, поскольку B должна быть симметричной, , поэтому два условия или эквивалентны.

Для комплекснозначных матриц вместо этого используется сопряженное транспонирование , а положительно полуопределенные матрицы являются эрмитовыми , то есть .

Теорема [3]  —  Пусть A — положительно полуопределенная и симметричная матрица (обратите внимание, что A может быть положительно полуопределенной, но не симметричной). Тогда существует ровно одна положительно полуопределенная и симметричная матрица B такая, что . Обратите внимание, что может быть более одной несимметричной и положительно полуопределенной матрицы такой, что

Эта уникальная матрица называется главным , неотрицательным или положительным квадратным корнем (последнее в случае положительно определенных матриц ).

Главный квадратный корень действительной положительной полуопределенной матрицы является действительным числом. [3] Главный квадратный корень положительно определенной матрицы является положительно определенным; в более общем случае ранг главного квадратного корня матрицы A совпадает с рангом матрицы A. [3 ]

Операция извлечения главного квадратного корня непрерывна на этом множестве матриц. [4] Эти свойства являются следствиями голоморфного функционального исчисления, примененного к матрицам. [5] [6] Существование и единственность главного квадратного корня можно вывести непосредственно из нормальной формы Жордана (см. ниже).

Матрицы с различными собственными значениями

Матрица n × n с n различными ненулевыми собственными значениями имеет 2 n квадратных корней. Такая матрица A имеет собственное разложение VDV −1, где V — матрица, столбцы которой являются собственными векторами A , а D — диагональная матрица, диагональные элементы которой являются соответствующими n собственными значениями λ i . Таким образом, квадратные корни A задаются как VD 1/2 V −1 , где D 1/2 — любая матрица квадратных корней D , которая для различных собственных значений должна быть диагональной с диагональными элементами, равными квадратным корням диагональных элементов D ; поскольку существует два возможных выбора для квадратного корня каждого диагонального элемента D , существует 2 n вариантов выбора для матрицы D 1/2 .

Это также приводит к доказательству приведенного выше наблюдения, что положительно определенная матрица имеет ровно один положительно определенный квадратный корень: положительно определенная матрица имеет только положительные собственные значения, и каждое из этих собственных значений имеет только один положительный квадратный корень; и поскольку собственные значения матрицы квадратных корней являются диагональными элементами D 1/2 , для того чтобы матрица квадратных корней сама была положительно определенной, необходимо использовать только уникальные положительные квадратные корни исходных собственных значений.

Решения в закрытой форме

Если матрица идемпотентна , то есть , то по определению один из ее квадратных корней — это сама матрица.

Диагональные и треугольные матрицы

Если Dдиагональная матрица n × n , то некоторые из ее квадратных корней являются диагональными матрицами , где . Если диагональные элементы матрицы D действительны и неотрицательны, то она является положительно полуопределенной, а если квадратные корни берутся с неотрицательным знаком, то полученная матрица является главным корнем матрицы D. Диагональная матрица может иметь дополнительные недиагональные корни, если некоторые элементы на диагонали равны, как показано на примере единичной матрицы выше.

Если Uверхняя треугольная матрица (то есть ее элементы для ) и не более одного из ее диагональных элементов равно нулю, то одно верхнетреугольное решение уравнения можно найти следующим образом. Поскольку уравнение должно быть удовлетворено, пусть будет главным квадратным корнем комплексного числа . По предположению это гарантирует, что для всех i,j (потому что главные квадратные корни комплексных чисел все лежат на одной половине комплексной плоскости). Из уравнения

мы заключаем, что можно вычислить рекурсивно для увеличения от 1 до n -1 следующим образом:

Если U является верхнетреугольной, но имеет несколько нулей на диагонали, то квадратный корень может не существовать, как показано на примере . Обратите внимание, что диагональные элементы треугольной матрицы являются в точности ее собственными значениями (см. Треугольная матрица#Свойства ).

Диагонализацией

Матрица A размера n × n диагонализируема , если существует матрица V и диагональная матрица D, такие что A = VDV −1 . Это происходит тогда и только тогда, когда A имеет n собственных векторов, которые составляют базис для C n . В этом случае V может быть выбрана в качестве матрицы с n собственными векторами в качестве столбцов, и, таким образом, квадратный корень из A равен

где S — любой квадратный корень из D. Действительно,

Например, матрицу можно диагонализировать как VDV −1 , где

и .

D имеет главный квадратный корень

,

даём квадратный корень

.

Когда A симметрична, диагонализующую матрицу V можно сделать ортогональной матрицей , выбрав соответствующим образом собственные векторы (см. спектральную теорему ). Тогда обратная матрица V — это просто транспонирование, так что

По разложению Шура

Каждая комплекснозначная квадратная матрица , независимо от диагонализуемости, имеет разложение Шура, заданное как , где является верхней треугольной и является унитарной (то есть ). Собственные значения являются в точности диагональными элементами ; если не более одного из них равно нулю, то следующее является квадратным корнем [7]

где квадратный корень верхней треугольной матрицы можно найти, как описано выше.

Если положительно определено, то все собственные значения — положительные действительные числа, поэтому выбранная диагональ также состоит из положительных действительных чисел. Следовательно, собственные значения — положительные действительные числа, что означает, что полученная матрица является главным корнем .

По разложению Жордана

Аналогично разложению Шура, каждую квадратную матрицу можно разложить следующим образом: где P обратима , а J находится в жордановой нормальной форме .

Чтобы увидеть, что любая комплексная матрица с положительными собственными значениями имеет квадратный корень того же вида, достаточно проверить это для жордановой клетки. Любая такая клетка имеет вид λ( I + N ) с λ > 0 и N нильпотентным . Если (1 + z ) 1/2 = 1 + a 1 z + a 2 z 2 + ⋯ — биномиальное разложение для квадратного корня (справедливое при | z | < 1), то как формальный степенной ряд ее квадрат равен 1 + z . Подставляя N вместо z , только конечное число членов будет ненулевым, и S = ​​√λ ( I + a 1 N + a 2 N 2 + ⋯) дает квадратный корень жордановой клетки с собственным значением √λ .

Достаточно проверить единственность для жордановой клетки с λ = 1. Построенный выше квадрат имеет вид S = I + L , где L — полином от N без свободного члена. Любой другой квадратный корень T с положительными собственными значениями имеет вид T = I + M , где M нильпотентно, коммутирует с N и, следовательно, L. Но тогда 0 = S 2T 2 = 2( LM )( I + ( L + M )/2) . Поскольку L и M коммутируют, матрица L + M нильпотентна, а I + ( L + M )/2 обратима с обратной, заданной рядом Неймана . Следовательно, L = M .

Если A — матрица с положительными собственными значениями и минимальным многочленом p ( t ) , то разложение Жордана на обобщенные собственные пространства A может быть выведено из разложения p ( t ) −1 в частичные дроби . Соответствующие проекции на обобщенные собственные пространства задаются действительными многочленами в A . На каждом собственном пространстве A имеет вид λ ( I + N ) , как и выше. Выражение степенного ряда для квадратного корня на собственном пространстве показывает, что главный квадратный корень A имеет вид q ( A ), где q ( t ) — многочлен с действительными коэффициентами.

Ряд мощности

Вспомним формальный степенной ряд , который сходится при условии (поскольку коэффициенты степенного ряда суммируемы). Подстановка в это выражение дает

при условии, что . В силу формулы Гельфанда это условие эквивалентно требованию, чтобы спектр содержался в круге . Этот метод определения или вычисления особенно полезен в случае, когда является положительно полуопределенным. В этом случае мы имеем и, следовательно , , так что выражение определяет квадратный корень, из которого, кроме того, оказывается единственным положительно полуопределенным корнем. Этот метод остается действительным для определения квадратных корней операторов в бесконечномерных банаховых или гильбертовых пространствах или некоторых элементах (C*) банаховых алгебр.

Итеративные решения

По методу Денмана–Биверса

Другой способ нахождения квадратного корня из матрицы A размером n × n — это итерация квадратного корня Денмана–Биверса. [8]

Пусть Y 0 = A и Z 0 = I , где Iединичная матрица n × n . Итерация определяется как

Поскольку здесь используется пара последовательностей обратных матриц, более поздние элементы которых изменяются сравнительно мало, только первые элементы имеют высокую вычислительную стоимость, поскольку остальные могут быть вычислены из более ранних элементов всего за несколько проходов варианта метода Ньютона для вычисления обратных матриц .

При этом для последующих значений k можно установить и затем использовать для некоторого малого (возможно, всего лишь 1), и аналогично для

Сходимость не гарантируется даже для матриц, имеющих квадратные корни, но если процесс сходится, матрица квадратично сходится к квадратному корню A 1/2 , в то время как сходится к своей обратной матрице A −1/2 .

Вавилонским методом

Еще один итерационный метод получается путем взятия известной формулы вавилонского метода для вычисления квадратного корня действительного числа и применения ее к матрицам. Пусть X 0 = I , где Iединичная матрица . Итерация определяется как

Опять же, сходимость не гарантируется, но если процесс сходится, матрица квадратично сходится к квадратному корню A 1/2 . По сравнению с итерацией Денмана–Биверса преимущество вавилонского метода заключается в том, что на шаг итерации нужно вычислять только одну обратную матрицу . С другой стороны, поскольку итерация Денмана–Биверса использует пару последовательностей обратных матриц, более поздние элементы которых изменяются сравнительно мало, только первые элементы имеют высокую вычислительную стоимость, поскольку остаток может быть вычислен из более ранних элементов всего за несколько проходов варианта метода Ньютона для вычисления обратных матриц (см. итерацию Денмана–Биверса выше); конечно, тот же подход можно использовать для получения единственной последовательности обратных матриц, необходимой для вавилонского метода. Однако, в отличие от итерации Денмана–Биверса, вавилонский метод численно нестабилен и с большей вероятностью не сойдется. [1]

Вавилонский метод следует из метода Ньютона для уравнения и использования для всех [9]

Квадратные корни положительных операторов

В линейной алгебре и теории операторов , если задан ограниченный положительно полуопределенный оператор (неотрицательный оператор) T в комплексном гильбертовом пространстве, B является квадратным корнем из T , если T = B* B , где B* обозначает эрмитово сопряженное к B. [ требуется ссылка ] Согласно спектральной теореме , непрерывное функциональное исчисление может быть применено для получения оператора T 1/2 такого, что T 1/2 сам по себе положителен и ( T 1/2 ) 2 = T. Оператор T 1/2 является единственным неотрицательным квадратным корнем из T. [ требуется ссылка ]

Ограниченный неотрицательный оператор в комплексном гильбертовом пространстве является самосопряженным по определению. Поэтому T = ( T 1/2 )* T 1/2 . Обратно, тривиально верно, что каждый оператор вида B* B неотрицателен. Следовательно, оператор T неотрицателен тогда и только тогда, когда T = B* B для некоторого B (эквивалентно, T = CC* для некоторого C ).

Факторизация Холецкого представляет собой еще один частный пример квадратного корня, который не следует путать с уникальным неотрицательным квадратным корнем.

Унитарная свобода квадратных корней

Если T — неотрицательный оператор в конечномерном гильбертовом пространстве, то все квадратные корни T связаны унитарными преобразованиями. Точнее, если T = A*A = B*B , то существует унитарное U такое, что A = UB .

Действительно, возьмем B = T 1/2 быть единственным неотрицательным квадратным корнем T. Если T строго положительно, то B обратимо, и поэтому U = AB −1 является унитарным:

Если T неотрицателен, не будучи строго положительным, то обратный оператор B не может быть определен, но псевдообратный оператор Мура–Пенроуза B + может быть определен. В этом случае оператор B + A является частичной изометрией , то есть унитарным оператором из области значений T в себя. Затем это можно расширить до унитарного оператора U на всем пространстве, приравняв его к единице на ядре T . В более общем случае это верно для бесконечномерного гильбертова пространства, если, кроме того, T имеет замкнутую область значений . В общем случае, если A , B являются замкнутыми и плотно определенными операторами в гильбертовом пространстве H , и A* A = B* B , то A = UB , где U является частичной изометрией.

Некоторые приложения

Квадратные корни и унитарная свобода квадратных корней находят применение в функциональном анализе и линейной алгебре.

Полярное разложение

Если A — обратимый оператор в конечномерном гильбертовом пространстве, то существует единственный унитарный оператор U и положительный оператор P, такие что

это полярное разложение A. Положительный оператор P является единственным положительным квадратным корнем положительного оператора A A , а U определяется как U = AP −1 .

Если A необратим, то он все еще имеет полярную композицию, в которой P определяется тем же способом (и является единственным). Унитарный оператор U не является единственным. Вместо этого можно определить «естественный» унитарный оператор следующим образом: AP + — унитарный оператор из области значений A в себя, который может быть расширен тождеством на ядре A . Полученный унитарный оператор U затем дает полярное разложение A .

Операторы Крауса

По результату Чоя, линейное отображение

полностью положительно тогда и только тогда, когда оно имеет вид

где knm . Пусть { E pq } ⊂ C n × nn 2 элементарных матричных единиц. Положительная матрица

называется матрицей Чоя матрицы Φ. Операторы Крауса соответствуют квадратным корням M Φ , не обязательно квадратным : для любого квадратного корня B матрицы M Φ можно получить семейство операторов Крауса V i , отменив операцию Vec для каждого столбца b i матрицы B . Таким образом, все наборы операторов Крауса связаны частичными изометриями.

Смешанные ансамбли

В квантовой физике матрица плотности для n -уровневой квантовой системы — это комплексная матрица ρ размером n × n , которая является положительно полуопределенной со следом 1. Если ρ можно выразить как

где и Σ p i = 1, множество

называется ансамблем , описывающим смешанное состояние ρ . Обратите внимание, что { v i } не обязательно должен быть ортогональным. Различные ансамбли, описывающие состояние ρ, связаны унитарными операторами через квадратные корни ρ . Например, предположим,

Условие трассы 1 означает

Позволять

и v i будет нормализованным a i . Мы видим, что

дает смешанное состояние ρ .

Смотрите также

Примечания

  1. ^ ab Higham, Nicholas J. (апрель 1986 г.), «Метод Ньютона для матричного квадратного корня» (PDF) , Mathematics of Computation , 46 (174): 537–549, doi :10.2307/2007992, JSTOR  2007992
  2. ^ Митчелл, Дуглас В. (ноябрь 2003 г.). «Использование пифагорейских троек для генерации квадратных корней I 2 {\displaystyle I_{2}}». The Mathematical Gazette . 87 (510): 499–500. doi : 10.1017/s0025557200173723 .
  3. ^ abc Horn & Johnson (2013), стр. 439, Теорема 7.2.6 с
  4. ^ Хорн, Роджер А.; Джонсон, Чарльз Р. (1990). Матричный анализ . Кембридж: Cambridge Univ. Press. стр. 411. ISBN 9780521386326.
  5. ^ Для аналитических функций матриц см.
    • Хайэм 2008
    • Хорн и Джонсон 1994
  6. ^ О голоморфном функциональном исчислении см.:
    • Рудин 1991
    • Бурбаки 2007
    • Конвей 1990
  7. ^ Deadman, Edvin; Higham, Nicholas J.; Ralha, Rui (2013), «Блочные алгоритмы Шура для вычисления квадратного корня матрицы» (PDF) , Applied Parallel and Scientific Computing , Springer Berlin Heidelberg, стр. 171–182, doi :10.1007/978-3-642-36803-5_12, ISBN 978-3-642-36802-8
  8. ^ Денман и Биверс 1976; Ченг и др. 2001
  9. ^ Хайэм, Николас Дж. (1997). "Стабильные итерации для квадратного корня матрицы". Численные алгоритмы . 15 (2): 227–242. Bibcode :1997NuAlg..15..227H. doi :10.1023/A:1019150005407.

Ссылки