Инструмент линейной алгебры и матричного анализа
В линейной алгебре и теории матриц дополнение Шура блочной матрицы определяется следующим образом.
Предположим, что p , q — неотрицательные целые числа, и предположим, что A , B , C , D — это соответственно p × p , p × q , q × p и q × q матрицы комплексных чисел. Позволять
![{\displaystyle M=\left[{\begin{matrix}A&B\\C&D\end{matrix}}\right]}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
MpqpqЕсли D обратим, то дополнение Шура к блоку D матрицы M представляет собой матрицу размера p × p , определяемую формулой
![{\displaystyle M/D:=A-BD^{-1}C.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Aдополнение ШураAMqq![{\displaystyle M/A:=D-CA^{-1}B.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
A или D сингулярны ,обратныхAM/D обобщеннымобобщенное дополнение ШураДополнение Шура названо в честь Иссая Шура , который использовал его для доказательства леммы Шура , хотя оно использовалось и ранее. [1] Эмили Вирджиния Хейнсворт была первой, кто назвал это дополнением Шура . [2] Дополнение Шура является ключевым инструментом в области численного анализа, статистики и матричного анализа.
Фон
Дополнение Шура возникает при выполнении блочного исключения Гаусса на матрице M . Чтобы исключить элементы ниже диагонали блока, матрицу M умножают на блочную нижнюю треугольную матрицу справа следующим образом:
![{\displaystyle {\begin{aligned}&M={\begin{bmatrix}A&B\\C&D\end{bmatrix}}\quad \to \quad {\begin{bmatrix}A&B\\C&D\end{bmatrix}}{ \begin{bmatrix}I_{p}&0\\-D^{-1}C&I_{q}\end{bmatrix}}={\begin{bmatrix}A-BD^{-1}C&B\\0&D\end {bmatrix}},\end{aligned}}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
I pединичную матрицу размера pppp![{\displaystyle M/D=A-BD^{-1}C}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Продолжая процесс исключения за этой точкой (т. е. выполняя блок исключения Гаусса–Жордана ),
![{\displaystyle {\begin{aligned}&{\begin{bmatrix}A-BD^{-1}C&B\\0&D\end{bmatrix}}\quad \to \quad {\begin{bmatrix}I_ {p} &-BD^{-1}\\0&I_{q}\end{bmatrix}}{\begin{bmatrix}A-BD^{-1}C&B\\0&D\end{bmatrix}}={\begin{bmatrix }A-BD^{-1}C&0\\0&D\end{bmatrix}},\end{aligned}}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
LDU-разложению,![{\displaystyle {\begin{aligned}M&={\begin{bmatrix}A&B\\C&D\end{bmatrix}}={\begin{bmatrix}I_{p}&BD^{-1}\\0&I_{q} \end{bmatrix}}{\begin{bmatrix}A-BD^{-1}C&0\\0&D\end{bmatrix}}{\begin{bmatrix}I_{p}&0\\D^{-1}C&I_ {q}\end{bmatrix}}.\end{aligned}}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
MD -1![{\displaystyle {\begin{aligned}M^{-1}={\begin{bmatrix}A&B\\C&D\end{bmatrix}}^{-1}={}&\left({\begin{bmatrix} I_{p}&BD^{-1}\\0&I_{q}\end{bmatrix}}{\begin{bmatrix}A-BD^{-1}C&0\\0&D\end{bmatrix}}{\begin{ bmatrix}I_{p}&0\\D^{-1}C&I_{q}\end{bmatrix}}\right)^{-1}\\={}&{\begin{bmatrix}I_{p}&0 \\-D^{-1}C&I_{q}\end{bmatrix}}{\begin{bmatrix}\left(A-BD^{-1}C\right)^{-1}&0\\0&D^ {-1}\end{bmatrix}}{\begin{bmatrix}I_{p}&-BD^{-1}\\0&I_{q}\end{bmatrix}}\\[4pt]={}&{ \begin{bmatrix}\left(A-BD^{-1}C\right)^{-1}&-\left(A-BD^{-1}C\right)^{-1}BD^{ -1}\\-D^{-1}C\left(A-BD^{-1}C\right)^{-1}&D^{-1}+D^{-1}C\left( A-BD^{-1}C\right)^{-1}BD^{-1}\end{bmatrix}}\\[4pt]={}&{\begin{bmatrix}\left(M/D \right)^{-1}&-\left(M/D\right)^{-1}BD^{-1}\\-D^{-1}C\left(M/D\right)^ {-1}&D^{-1}+D^{-1}C\left(M/D\right)^{-1}BD^{-1}\end{bmatrix}}.\end{aligned} }}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
D −1M/DAD.M -1об обращении матрицыMM/DM/A«Вывод из разложения LDU»матрице Вудбери) . тождество § Альтернативные доказательстваХарактеристики
- Если p и q оба равны 1 (т. е. A , B , C и D являются скалярами), мы получаем знакомую формулу для обратной матрицы 2х2:
![{\displaystyle M^{-1}={\frac {1}{AD-BC}}\left[{\begin{matrix}D&-B\\-C&A\end{matrix}}\right]}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
- при условии, что AD − BC не равно нулю.
- В общем случае, если A обратимо, то
![{\displaystyle {\begin{aligned}M&={\begin{bmatrix}A&B\\C&D\end{bmatrix}}={\begin{bmatrix}I_{p}&0\\CA^{-1}&I_{q }\end{bmatrix}}{\begin{bmatrix}A&0\\0&D-CA^{-1}B\end{bmatrix}}{\begin{bmatrix}I_{p}&A^{-1}B\\ 0&I_{q}\end{bmatrix}},\\[4pt]M^{-1}&={\begin{bmatrix}A^{-1}+A^{-1}B(M/A)^ {-1}CA^{-1}&-A^{-1}B(M/A)^{-1}\\-(M/A)^{-1}CA^{-1}&( M/A)^{-1}\end{bmatrix}}\end{aligned}}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
- всякий раз, когда это обратное существует.
- (Формула Шура) Когда A , соответственно D , обратимы, также ясно видно, что определитель M определяется выражением
, соответственно
,- которая обобщает определительную формулу для матриц 2 × 2.
- (Формула аддитивности ранга Гуттмана) Если D обратим, то ранг M определяется выражением
![{\displaystyle \operatorname {ранг} (M) = \operatorname {ранг} (D)+\operatorname {ранг} \left(A-BD^{-1}C\right)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
- ( Формула аддитивности инерции Хейнсворта ) Если A обратима, то инерция блочной матрицы M равна инерции A плюс инерция M / A .
- (Факторное тождество) . [3]
![{\displaystyle A/B=((A/C)/(B/C))}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
- Дополнение Шура к матрице Лапласа также является матрицей Лапласа. [4]
Приложение к решению линейных уравнений
Дополнение Шура естественным образом возникает при решении системы линейных уравнений типа [5]
.
Предполагая, что подматрица обратима, мы можем исключить ее из уравнений следующим образом.![{\displaystyle А}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle х}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
.
Подставив это выражение во второе уравнение, получим
.
Мы называем это сокращенным уравнением , полученным путем исключения из исходного уравнения. Матрица, появляющаяся в сокращенном уравнении, называется дополнением Шура первого блока в :![{\displaystyle х}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle А}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle M}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
.
Решая приведенное уравнение, получаем
.
Подставив это в первое уравнение, получим
.
Мы можем выразить два приведенных выше уравнения как:
.
Следовательно, формулировка обратной блочной матрицы такова:
.
В частности, мы видим, что дополнение Шура является инверсией блочной записи обратного .![{\displaystyle 2,2}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle M}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
На практике для того, чтобы этот алгоритм был численно точным, необходимо быть хорошо подготовленным .![{\displaystyle А}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
В электротехнике это часто называют устранением узла или уменьшением Крона .
Приложения к теории вероятностей и статистике
Предположим, что случайные векторы-столбцы X , Y живут в Rn и Rm соответственно, а вектор ( X , Y ) в Rn + m имеет многомерное нормальное распределение , ковариация которого представляет собой симметричную положительно определенную матрицу .
![{\displaystyle \Sigma =\left[{\begin{matrix}A&B\\B^{\mathrm {T}}&C\end{matrix}}\right],}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
где — ковариационная матрица X , — ковариационная матрица Y и — ковариационная матрица между X и Y.![{\textstyle A\in \mathbb {R} ^{n\times n}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\textstyle C\in \mathbb {R} ^{m\times m}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\textstyle B\in \mathbb {R} ^{n\times m}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Тогда условная ковариация X при условии Y является дополнением Шура к C в : [ 6]![{\текстовый стиль \Сигма }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle {\begin{aligned}\operatorname {Cov} (X\mid Y)&=A-BC^{-1}B^{\mathrm {T} }\\\operatorname {E} (X\mid Y)&=\operatorname {E} (X)+BC^{-1}(Y-\operatorname {E} (Y))\end{aligned}}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Если мы возьмем приведенную выше матрицу не как ковариацию случайного вектора, а как выборочную ковариацию, то она может иметь распределение Уишарта . В этом случае дополнение Шура к C in также имеет распределение Уишарта. [ нужна цитата ]![{\displaystyle \Сигма }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \Сигма }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Условия положительной определенности и полуопределенности.
Пусть X — симметричная матрица действительных чисел, заданная формулой
![{\displaystyle X=\left[{\begin{matrix}A&B\\B^{\mathrm {T}}&C\end{matrix}}\right].}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
- Если A обратим, то X положительно определен тогда и только тогда, когда A и его дополнение X/A положительно определены: [1] : 34
![{\displaystyle X\succ 0\Leftrightarrow A\succ 0,X/A=CB^{\mathrm {T} }A^{-1}B\succ 0.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
- Если C обратим, то X положительно определен тогда и только тогда, когда C и его дополнение X/C оба положительно определены:
![{\displaystyle X\succ 0\Leftrightarrow C\succ 0,X/C=A-BC^{-1}B^{\mathrm {T} }\succ 0.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
- Если A положительно определен, то X положительно полуопределенен тогда и только тогда, когда дополнение X/A положительно полуопределено: [1] : 34
![{\displaystyle {\text{If }}A\succ 0,{\text{ then }}X\succeq 0\Leftrightarrow X/A=CB^{\mathrm {T} }A^{-1}B\succeq 0.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
- Если C положительно определен, то X положительно полуопределенен тогда и только тогда, когда дополнение X/C положительно полуопределено:
![{\displaystyle {\text{If }}C\succ 0,{\text{ then }}X\succeq 0\Leftrightarrow X/C=A-BC^{-1}B^{\mathrm {T} }\ успех 0.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Первое и третье утверждения можно получить [5] , рассматривая минимизатор величины
![{\ displaystyle u ^ {\ mathrm {T} } Au + 2v ^ {\ mathrm {T} } B ^ {\ mathrm {T} } u + v ^ {\ mathrm {T} } Cv, \,}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
vuКроме того, поскольку
![{\displaystyle \left[{\begin{matrix}A&B\\B^{\mathrm {T}}&C\end{matrix}}\right]\succ 0\Longleftrightarrow \left[{\begin{matrix}C&B^ {\mathrm {T} }\\B&A\end{matrix}}\right]\succ 0}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Существует также достаточное и необходимое условие положительной полуопределенности X в терминах обобщенного дополнения Шура. [1] Именно,
и![{\displaystyle X\succeq 0\Leftrightarrow C\succeq 0,A-BC^{g}B^{\mathrm {T}}\succeq 0,\left(I-CC^{g}\right)B^{ \mathrm {T} }=0,}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
где обозначает обобщенную обратную величину .![{\displaystyle A^{g}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle А}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Смотрите также
Рекомендации
- ^ abcd Чжан, Фучжэнь (2005). Чжан, Фучжэнь (ред.). Дополнение Шура и его приложения . Численные методы и алгоритмы. Том. 4. Спрингер. дои : 10.1007/b105056. ISBN 0-387-24271-6.
- ^ Хейнсворт, Э.В., «О дополнении Шура», Базельские математические заметки , # BNB 20, 17 страниц, июнь 1968 г.
- ^ Крэбтри, Дуглас Э.; Хейнсворт, Эмили В. (1969). «Тождество для дополнения Шура матрицы». Труды Американского математического общества . 22 (2): 364–366. дои : 10.1090/S0002-9939-1969-0255573-1 . ISSN 0002-9939. S2CID 122868483.
- ^ Девриендт, Карел (2022). «Эффективное сопротивление - это больше, чем расстояние: лапласианцы, симплики и дополнение Шура». Линейная алгебра и ее приложения . 639 : 24–49. arXiv : 2010.04521 . дои : 10.1016/j.laa.2022.01.002. S2CID 222272289.
- ^ Аб Бойд С. и Ванденбергхе Л. (2004), «Выпуклая оптимизация», Cambridge University Press (Приложение A.5.5)
- ^ фон Мизес, Ричард (1964). «Глава VIII.9.3». Математическая теория вероятностей и статистика . Академическая пресса. ISBN 978-1483255385.