Блочная матрица

В математике блочная матрица или секционированная матрица — это матрица , которая интерпретируется как разбитая на секции, называемые блоками или подматрицами . ^[1] Интуитивно матрица, интерпретируемая как блочная матрица, может быть визуализирована как исходная матрица с набором горизонтальных и вертикальных линий, которые разбивают ее или разделяют на набор меньших матриц. ^[2] Любая матрица может интерпретироваться как блочная матрица одним или несколькими способами, причем каждая интерпретация определяется тем, как разделены ее строки и столбцы.

Это понятие можно уточнить для матрицы by путем разделения на коллекцию , а затем разделения на коллекцию . Исходная матрица затем рассматривается как «сумма» этих групп в том смысле, что запись исходной матрицы соответствует 1-к-1 некоторой записи смещения некоторого , где и . $п$ $м$ $M$ $п$ ${\text{rowgroups}}$ $м$ ${\text{colgroups}}$ $(я,j)$ $(s,t)$ $(x,y)$ $x\in {\text{rowgroups}}$ $y\in {\text{colgroups}}$

Алгебра блочных матриц обычно возникает из двойных произведений в категориях матриц. ^[3]

Пример

Матрица

\mathbf {P} = {\begin{bmatrix}1&2&2&7\\1&5&6&2\\3&3&4&5\\3&3&6&7\end{bmatrix}}

можно разделить на четыре блока 2х2

\mathbf {P} _{11}={\begin{bmatrix}1&2\\1&5\end{bmatrix}},\quad \mathbf {P} _{12}={\begin{bmatrix}2&7\ \6&2\end{bmatrix}},\quad \mathbf {P} _{21}={\begin{bmatrix}3&3\\3&3\end{bmatrix}},\quad \mathbf {P} _{22}= {\begin{bmatrix}4&5\\6&7\end{bmatrix}}.

Тогда разделенную матрицу можно записать как

\mathbf {P} = {\begin{bmatrix}\mathbf {P} _{11} &\mathbf {P} _{12} \\\mathbf {P} _{21} &\mathbf {P } _{22}\end{bmatrix}}.

Умножение блочной матрицы

Можно использовать матричное произведение с блочным разделением, которое включает только алгебру над подматрицами факторов. Однако разделение факторов не является произвольным и требует « согласованных разделений» ^[4] между двумя матрицами , таких, чтобы все подматрицы, которые будут использоваться, были определены. ^[5] Дана матрица с разбиениями по строкам и по столбцам. $А$ $B$ $(м\раз р)$ $\mathbf {A}$ $q$ $s$

\mathbf {A} ={\begin{bmatrix}\mathbf {A} _{11}&\mathbf {A} _{12}&\cdots &\mathbf {A} _{1s}\\\mathbf {A} _{21}&\mathbf {A} _{22}&\cdots &\mathbf {A} _{2s}\\\vdots &\vdots &\ddots &\vdots \\\mathbf {A} _{q1}&\mathbf {A} _{q2}&\cdots &\mathbf {A} _{qs}\end{bmatrix}}

и матрица с разбиениями по строкам и по столбцам $(p\times n)$ $\mathbf {B}$ $s$ $r$

\mathbf {B} ={\begin{bmatrix}\mathbf {B} _{11}&\mathbf {B} _{12}&\cdots &\mathbf {B} _{1r}\\\mathbf {B} _{21}&\mathbf {B} _{22}&\cdots &\mathbf {B} _{2r}\\\vdots &\vdots &\ddots &\vdots \\\mathbf {B} _{s1}&\mathbf {B} _{s2}&\cdots &\mathbf {B} _{sr}\end{bmatrix}},

которые совместимы с разбиениями матричного произведения $A$

\mathbf {C} =\mathbf {A} \mathbf {B}

может выполняться поблочно, получая матрицу с разбиениями по строкам и по столбцам. Матрицы в полученной матрице вычисляются путем умножения: $\mathbf {C}$ $(m\times n)$ $q$ $r$ $\mathbf {C}$

\mathbf {C} _{qr}=\sum _{i=1}^{s}\mathbf {A} _{qi}\mathbf {B} _{ir}.

Или, используя обозначение Эйнштейна , которое неявно суммирует по повторяющимся индексам:

\mathbf {C} _{qr}=\mathbf {A} _{qi}\mathbf {B} _{ir}.

Инверсия блочной матрицы

Если матрица разделена на четыре блока, ее можно инвертировать поблочно следующим образом:

\mathbf {P} ={\begin{bmatrix}\mathbf {A} &\mathbf {B} \\\mathbf {C} &\mathbf {D} \end{bmatrix}}^{-1}={\begin{bmatrix}\mathbf {A} ^{-1}+\mathbf {A} ^{-1}\mathbf {B} \left(\mathbf {D} -\mathbf {CA} ^{-1}\mathbf {B} \right)^{-1}\mathbf {CA} ^{-1}&-\mathbf {A} ^{-1}\mathbf {B} \left(\mathbf {D} -\mathbf {CA} ^{-1}\mathbf {B} \right)^{-1}\\-\left(\mathbf {D} -\mathbf {CA} ^{-1}\mathbf {B} \right)^{-1}\mathbf {CA} ^{-1}&\left(\mathbf {D} -\mathbf {CA} ^{-1}\mathbf {B} \right)^{-1}\end{bmatrix}},

где A и D — квадратные блоки произвольного размера, а B и C согласны с ними при разбиении. Более того, A и дополнение Шура к A в P : P / A = D − CA ⁻¹B должны быть обратимы. ^[6]

Аналогично, переставляя блоки:

\mathbf {P} ={\begin{bmatrix}\mathbf {A} &\mathbf {B} \\\mathbf {C} &\mathbf {D} \end{bmatrix}}^{-1}={\begin{bmatrix}\left(\mathbf {A} -\mathbf {BD} ^{-1}\mathbf {C} \right)^{-1}&-\left(\mathbf {A} -\mathbf {BD} ^{-1}\mathbf {C} \right)^{-1}\mathbf {BD} ^{-1}\\-\mathbf {D} ^{-1}\mathbf {C} \left(\mathbf {A} -\mathbf {BD} ^{-1}\mathbf {C} \right)^{-1}&\quad \mathbf {D} ^{-1}+\mathbf {D} ^{-1}\mathbf {C} \left(\mathbf {A} -\mathbf {BD} ^{-1}\mathbf {C} \right)^{-1}\mathbf {BD} ^{-1}\end{bmatrix}}.

Здесь D и дополнение Шура к D в P : P / D = A − BD ⁻¹C должны быть обратимы.

Если A и D оба обратимы, то:

{\begin{bmatrix}\mathbf {A} &\mathbf {B} \\\mathbf {C} &\mathbf {D} \end{bmatrix}}^{-1}={\begin{bmatrix}\left(\mathbf {A} -\mathbf {B} \mathbf {D} ^{-1}\mathbf {C} \right)^{-1}&\mathbf {0} \\\mathbf {0} &\left(\mathbf {D} -\mathbf {C} \mathbf {A} ^{-1}\mathbf {B} \right)^{-1}\end{bmatrix}}{\begin{bmatrix}\mathbf {I} &-\mathbf {B} \mathbf {D} ^{-1}\\-\mathbf {C} \mathbf {A} ^{-1}&\mathbf {I} \end{bmatrix}}.

Согласно тождеству Вайнштейна – Ароншайна , одна из двух матриц в блочно-диагональной матрице обратима ровно тогда, когда обратима другая.

Определитель блочной матрицы

Приведенная выше формула для определителя -матрицы продолжает выполняться при соответствующих дополнительных предположениях для матрицы, состоящей из четырех подматриц . Самая простая такая формула, которую можно доказать с помощью формулы Лейбница или факторизации с дополнением Шура , имеет вид $2\times 2$ $A,B,C,D$

\det {\begin{pmatrix}A&0\\C&D\end{pmatrix}}=\det(A)\det(D)=\det {\begin{pmatrix}A&B\\0&D\end{pmatrix}}.

Используя эту формулу, мы можем вывести, что характеристические полиномы и одинаковы и равны произведению характеристических полиномов и . Более того, если или диагонализуемо , то и тоже диагонализуемы . Обратное неверно; просто проверьте . ${\begin{pmatrix}A&0\\C&D\end{pmatrix}}$ ${\begin{pmatrix}A&B\\0&D\end{pmatrix}}$ $A$ $D$ ${\begin{pmatrix}A&0\\C&D\end{pmatrix}}$ ${\begin{pmatrix}A&B\\0&D\end{pmatrix}}$ $A$ $D$ ${\begin{pmatrix}1&1\\0&1\end{pmatrix}}$

Если обратим (и аналогично, если обратим [ ^7] ), то $A$ $D$

\det {\begin{pmatrix}A&B\\C&D\end{pmatrix}}=\det(A)\det \left(D-CA^{-1}B\right).

Если -матрица , это упрощается до . $D$ $1\times 1$ $\det(A)(D-CA^{-1}B)$

Если блоки представляют собой квадратные матрицы одинакового размера , дальнейшие формулы справедливы. Например, если и коммутируют (т. е. ), то $C$ $D$ $CD=DC$

\det {\begin{pmatrix}A&B\\C&D\end{pmatrix}}=\det(AD-BC).

^[8]

Эта формула была обобщена на матрицы, состоящие более чем из блоков, опять же при соответствующих условиях коммутативности между отдельными блоками. ^[9] $2\times 2$

Для и ^{справедлива} следующая формула (даже если ^и не коммутируют ⁾ $A=D$ $B=C$ $A$ $B$

\det {\begin{pmatrix}A&B\\B&A\end{pmatrix}}=\det(A-B)\det(A+B).

Блочные диагональные матрицы

Блочная диагональная матрица — это блочная матрица, представляющая собой квадратную матрицу , в которой блоки главной диагонали являются квадратными матрицами, а все внедиагональные блоки являются нулевыми матрицами. То есть блочно-диагональная матрица A имеет вид

\mathbf {A} ={\begin{bmatrix}\mathbf {A} _{1}&\mathbf {0} &\cdots &\mathbf {0} \\\mathbf {0} &\mathbf {A} _{2}&\cdots &\mathbf {0} \\\vdots &\vdots &\ddots &\vdots \\\mathbf {0} &\mathbf {0} &\cdots &\mathbf {A} _{n}\end{bmatrix}}

где A _k — квадратная матрица для всех k = 1,..., n . Другими словами, матрица A является прямой суммой A 1 _, ... _, An . _{Его также можно} указать как A ₁ ⊕ A ₂ ⊕ ... ⊕ An _или diag( A ₁ , A ₂ , ..., An ) (последнее представляет собой тот же формализм, который используется для диагональной матрицы ). Любую квадратную матрицу можно тривиально считать блочной диагональной матрицей только с одним блоком.

Для определителя и следа выполняются следующие свойства

{\begin{aligned}\det \mathbf {A} &=\det \mathbf {A} _{1}\times \cdots \times \det \mathbf {A} _{n},\\\operatorname {tr} \mathbf {A} &=\operatorname {tr} \mathbf {A} _{1}+\cdots +\operatorname {tr} \mathbf {A} _{n}.\end{aligned}}

Блочная диагональная матрица обратима тогда и только тогда, когда каждый из ее блоков главной диагонали обратим, и в этом случае ее обратная матрица является другой блочной диагональной матрицей, заданной формулой

{\begin{bmatrix}\mathbf {A} _{1}&\mathbf {0} &\cdots &\mathbf {0} \\\mathbf {0} &\mathbf {A} _{2}&\cdots &\mathbf {0} \\\vdots &\vdots &\ddots &\vdots \\\mathbf {0} &\mathbf {0} &\cdots &\mathbf {A} _{n}\end{bmatrix}}^{-1}={\begin{bmatrix}\mathbf {A} _{1}^{-1}&\mathbf {0} &\cdots &\mathbf {0} \\\mathbf {0} &\mathbf {A} _{2}^{-1}&\cdots &\mathbf {0} \\\vdots &\vdots &\ddots &\vdots \\\mathbf {0} &\mathbf {0} &\cdots &\mathbf {A} _{n}^{-1}\end{bmatrix}}.

Собственные значения и собственные векторы представляют собой просто значения s вместе взятых. $\mathbf {A}$ $\mathbf {A} _{k}$

Блочные трехдиагональные матрицы

Блочная трехдиагональная матрица — это еще одна специальная блочная матрица, которая, как и блочная диагональная матрица , представляет собой квадратную матрицу , имеющую квадратные матрицы (блоки) в нижней, главной и верхней диагонали, а все остальные блоки являются нулевыми матрицами. По сути, это трехдиагональная матрица , но вместо скаляров имеет подматрицы. Блочная трехдиагональная матрица A имеет вид

\mathbf {A} ={\begin{bmatrix}\mathbf {B} _{1}&\mathbf {C} _{1}&&&\cdots &&\mathbf {0} \\\mathbf {A} _{2}&\mathbf {B} _{2}&\mathbf {C} _{2}&&&&\\&\ddots &\ddots &\ddots &&&\vdots \\&&\mathbf {A} _{k}&\mathbf {B} _{k}&\mathbf {C} _{k}&&\\\vdots &&&\ddots &\ddots &\ddots &\\&&&&\mathbf {A} _{n-1}&\mathbf {B} _{n-1}&\mathbf {C} _{n-1}\\\mathbf {0} &&\cdots &&&\mathbf {A} _{n}&\mathbf {B} _{n}\end{bmatrix}}

где Ak _, Bk и Ck — _{квадратные} подматрицы нижней, главной и верхней диагонали соответственно _.

Блочные трехдиагональные матрицы часто встречаются при численном решении инженерных задач (например, вычислительной гидродинамики ). Доступны оптимизированные численные методы LU-факторизации и, следовательно, эффективные алгоритмы решения систем уравнений с блочной трехдиагональной матрицей в качестве матрицы коэффициентов. Алгоритм Томаса , используемый для эффективного решения систем уравнений, включающих трехдиагональную матрицу , также может применяться с использованием матричных операций для блокировки трехдиагональных матриц (см. также Блочное LU-разложение ).

Блочные матрицы Теплица

Блочная матрица Теплица — это еще одна специальная блочная матрица, которая содержит блоки, повторяющиеся по диагонали матрицы, поскольку в матрице Теплица элементы повторяются по диагонали.

Блочная матрица Теплица A имеет вид

\mathbf {A} ={\begin{bmatrix}\mathbf {A} _{(1,1)}&\mathbf {A} _{(1,2)}&&&\cdots &\mathbf {A} _{(1,n-1)}&\mathbf {A} _{(1,n)}\\\mathbf {A} _{(2,1)}&\mathbf {A} _{(1,1)}&\mathbf {A} _{(1,2)}&&&&\mathbf {A} _{(1,n-1)}\\&\ddots &\ddots &\ddots &&&\vdots \\&&\mathbf {A} _{(2,1)}&\mathbf {A} _{(1,1)}&\mathbf {A} _{(1,2)}&&\\\vdots &&&\ddots &\ddots &\ddots &\\\mathbf {A} _{(n-1,1)}&&&&\mathbf {A} _{(2,1)}&\mathbf {A} _{(1,1)}&\mathbf {A} _{(1,2)}\\\mathbf {A} _{(n,1)}&\mathbf {A} _{(n-1,1)}&\cdots &&&\mathbf {A} _{(2,1)}&\mathbf {A} _{(1,1)}\end{bmatrix}}.

Блокировать транспонирование

Для блочных матриц также можно определить специальную форму транспонирования , при которой отдельные блоки переупорядочиваются, но не транспонируются. Пусть это блочная матрица с блоками , транспонирование блоков - это блочная матрица с блоками . ^[10] $A=(B_{ij})$ $k\times l$ $m\times n$ $B_{ij}$ $A$ $l\times k$ $A^{\mathcal {B}}$ $m\times n$ $\left(A^{\mathcal {B}}\right)_{ij}=B_{ji}$

Как и в случае с обычным оператором трассировки, транспонирование блоков является линейным отображением таким, что . Однако, как правило, собственность не сохраняется, если не перемещаться по кварталам и не добираться до работы. $(A+C)^{\mathcal {B}}=A^{\mathcal {B}}+C^{\mathcal {B}}$ $(AC)^{\mathcal {B}}=C^{\mathcal {B}}A^{\mathcal {B}}$ $A$ $C$

Прямая сумма

Для любых произвольных матриц A (размера m × n ) и B ( размера p × q ) мы имеем прямую сумму A и B , обозначаемую AB и определяемую как $\oplus$

\mathbf {A} \oplus \mathbf {B} ={\begin{bmatrix}a_{11}&\cdots &a_{1n}&0&\cdots &0\\\vdots &\ddots &\vdots &\vdots &\ddots &\vdots \\a_{m1}&\cdots &a_{mn}&0&\cdots &0\\0&\cdots &0&b_{11}&\cdots &b_{1q}\\\vdots &\ddots &\vdots &\vdots &\ddots &\vdots \\0&\cdots &0&b_{p1}&\cdots &b_{pq}\end{bmatrix}}.

Например,

{\begin{bmatrix}1&3&2\\2&3&1\end{bmatrix}}\oplus {\begin{bmatrix}1&6\\0&1\end{bmatrix}}={\begin{bmatrix}1&3&2&0&0\\2&3&1&0&0\\0&0&0&1&6\\0&0&0&0&1\end{bmatrix}}.

Эта операция естественным образом обобщается на массивы произвольной размерности (при условии, что A и B имеют одинаковое количество измерений).

Обратите внимание, что любой элемент прямой суммы двух векторных пространств матриц можно представить как прямую сумму двух матриц.

Приложение

В терминах линейной алгебры использование блочной матрицы соответствует линейному отображению, рассматриваемому в терминах соответствующих «групп» базисных векторов . Это снова соответствует идее различения разложений области и диапазона в прямую сумму . Всегда особенно важно, если блок представляет собой нулевую матрицу ; который несет информацию, которую слагаемое отображает в подсумму.

Учитывая интерпретацию с помощью линейных отображений и прямых сумм, существует особый тип блочной матрицы, который встречается для квадратных матриц (случай m = n ). Для них мы можем предположить интерпретацию как эндоморфизм n - мерного пространства V ; Блочная структура, в которой группировка строк и столбцов одинакова, важна, поскольку она соответствует разложению одной прямой суммы на V (а не двум). В этом случае, например, все диагональные блоки в очевидном смысле являются квадратными. Этот тип структуры необходим для описания жордановой нормальной формы .

Этот метод используется для сокращения вычислений матриц, разложения столбцов и строк и многих приложений в области информатики , включая проектирование микросхем СБИС . Примером может служить алгоритм Штрассена для быстрого умножения матриц , а также кодирование Хэмминга(7,4) для обнаружения и восстановления ошибок при передаче данных.

Этот метод также можно использовать, когда элементы матриц A, B, C и D не требуют одного и того же поля для своих элементов. Например, матрица A может находиться над полем комплексных чисел, а матрица D — над полем действительных чисел. Это может привести к допустимым операциям с матрицами, одновременно упрощая операции внутри одной из матриц. Например, если в D есть только вещественные элементы, то поиск обратного требует меньше вычислений, чем если бы необходимо учитывать комплексные элементы. Но действительные числа — это подполе комплексных чисел (в дальнейшем его можно считать проекцией), поэтому операции с матрицами могут быть четко определены.

Смотрите также

Произведение Кронекера (прямое произведение матрицы, приводящее к блочной матрице)

Примечания

^ Ивс, Ховард (1980). Элементарная теория матриц (переиздание). Нью-Йорк: Дувр. п. 37. ИСБН 0-486-63946-0. Проверено 24 апреля 2013 г. Мы обнаружим, что иногда удобно разбить матрицу на прямоугольные блоки элементов. Это заставляет нас рассмотреть так называемые секционированные или блочные матрицы .
^ Антон, Ховард (1994). Элементарная линейная алгебра (7-е изд.). Нью-Йорк: Джон Уайли. п. 30. ISBN 0-471-58742-7. Матрицу можно разделить на более мелкие матрицы, вставив горизонтальные и вертикальные правила между выбранными строками и столбцами.
^ Маседо, HD; Оливейра, JN (2013). «Типизация линейной алгебры: подход, ориентированный на два произведения». Наука компьютерного программирования . 78 (11): 2160–2191. arXiv : 1312.4818 . doi : 10.1016/j.scico.2012.07.012.
^ Ивс, Ховард (1980). Элементарная теория матриц (переиздание). Нью-Йорк: Дувр. п. 37. ИСБН 0-486-63946-0. Проверено 24 апреля 2013 г. Разбиение, подобное теореме 1.9.4, называется соформным разбиением A и B.
^ Антон, Ховард (1994). Элементарная линейная алгебра (7-е изд.). Нью-Йорк: Джон Уайли. п. 36. ISBN 0-471-58742-7. ...при условии, что размеры подматриц A и B таковы, что указанные операции могут быть выполнены.
^ Бернштейн, Деннис (2005). Матричная математика . Издательство Принстонского университета. п. 44. ИСБН 0-691-11802-7.
^ Табога, Марко (2021). «Определитель блочной матрицы», Лекции по матричной алгебре.
^ Сильвестр, младший (2000). «Определители блочных матриц» (PDF) . Математика. Газ . 84 (501): 460–467. дои : 10.2307/3620776. JSTOR 3620776. Архивировано из оригинала (PDF) 18 марта 2015 г. Проверено 25 июня 2021 г.
^ Сотанафан, Нат (январь 2017 г.). «Определители блочных матриц с некоммутирующими блоками». Линейная алгебра и ее приложения . 512 : 202–218. arXiv : 1805.06027 . дои :10.1016/j.laa.2016.10.004. S2CID 119272194.
^ Макки, Д. Стивен (2006). Структурированная линеаризация матричных полиномов (PDF) (Диссертация). Университет Манчестера. ISSN 1749-9097. ОКЛК 930686781.