Матрица определяется с использованием меньших матриц, называемых блоками.
В математике блочная матрица или секционированная матрица — это матрица , которая интерпретируется как разбитая на секции, называемые блоками или подматрицами . [1] Интуитивно матрица, интерпретируемая как блочная матрица, может быть визуализирована как исходная матрица с набором горизонтальных и вертикальных линий, которые разбивают ее или разделяют на набор меньших матриц. [2] Любая матрица может интерпретироваться как блочная матрица одним или несколькими способами, причем каждая интерпретация определяется тем, как разделены ее строки и столбцы.
Это понятие можно уточнить для матрицы by путем разделения на коллекцию , а затем разделения на коллекцию . Исходная матрица затем рассматривается как «сумма» этих групп в том смысле, что запись исходной матрицы соответствует 1-к-1 некоторой записи смещения некоторого , где и .
Блочная матрица элементов размером 168×168 с подматрицами 12×12, 12×24, 24×12 и 24×24. Ненулевые элементы выделены синим цветом, нулевые элементы — серым.
Матрица
можно разделить на четыре блока 2х2
Тогда разделенную матрицу можно записать как
Умножение блочной матрицы
Можно использовать матричное произведение с блочным разделением, которое включает только алгебру над подматрицами факторов. Однако разделение факторов не является произвольным и требует « согласованных разделений» [4] между двумя матрицами , таких, чтобы все подматрицы, которые будут использоваться, были определены. [5] Дана матрица с разбиениями по строкам и по столбцам.
и матрица с разбиениями по строкам и по столбцам
которые совместимы с разбиениями матричного произведения
может выполняться поблочно, получая матрицу с разбиениями по строкам и по столбцам. Матрицы в полученной матрице вычисляются путем умножения:
Или, используя обозначение Эйнштейна , которое неявно суммирует по повторяющимся индексам:
Инверсия блочной матрицы
Если матрица разделена на четыре блока, ее можно инвертировать поблочно следующим образом:
где A и D — квадратные блоки произвольного размера, а B и C согласны с ними при разбиении. Более того, A и дополнение Шура к A в P : P / A = D − CA −1 B должны быть обратимы. [6]
Аналогично, переставляя блоки:
Здесь D и дополнение Шура к D в P : P / D = A − BD −1 C должны быть обратимы.
Если A и D оба обратимы, то:
Согласно тождеству Вайнштейна – Ароншайна , одна из двух матриц в блочно-диагональной матрице обратима ровно тогда, когда обратима другая.
Определитель блочной матрицы
Приведенная выше формула для определителя -матрицы продолжает выполняться при соответствующих дополнительных предположениях для матрицы, состоящей из четырех подматриц . Самая простая такая формула, которую можно доказать с помощью формулы Лейбница или факторизации с дополнением Шура , имеет вид
Используя эту формулу, мы можем вывести, что характеристические полиномы и одинаковы и равны произведению характеристических полиномов и . Более того, если или диагонализуемо , то и тоже диагонализуемы . Обратное неверно; просто проверьте .
Если обратим (и аналогично, если обратим [ 7] ), то
Если -матрица , это упрощается до .
Если блоки представляют собой квадратные матрицы одинакового размера , дальнейшие формулы справедливы. Например, если и коммутируют (т. е. ), то
[8]
Эта формула была обобщена на матрицы, состоящие более чем из блоков, опять же при соответствующих условиях коммутативности между отдельными блоками. [9]
Для и справедлива следующая формула (даже если и не коммутируют )
Блочные диагональные матрицы
Блочная диагональная матрица — это блочная матрица, представляющая собой квадратную матрицу , в которой блоки главной диагонали являются квадратными матрицами, а все внедиагональные блоки являются нулевыми матрицами. То есть блочно-диагональная матрица A имеет вид
где A k — квадратная матрица для всех k = 1,..., n . Другими словами, матрица A является прямой суммой A 1 , ... , An . Его также можно указать как A 1 ⊕ A 2 ⊕ ... ⊕ An или diag( A 1 , A 2 , ..., An ) (последнее представляет собой тот же формализм, который используется для диагональной матрицы ). Любую квадратную матрицу можно тривиально считать блочной диагональной матрицей только с одним блоком.
Блочная диагональная матрица обратима тогда и только тогда, когда каждый из ее блоков главной диагонали обратим, и в этом случае ее обратная матрица является другой блочной диагональной матрицей, заданной формулой
Блочная трехдиагональная матрица — это еще одна специальная блочная матрица, которая, как и блочная диагональная матрица , представляет собой квадратную матрицу , имеющую квадратные матрицы (блоки) в нижней, главной и верхней диагонали, а все остальные блоки являются нулевыми матрицами. По сути, это трехдиагональная матрица , но вместо скаляров имеет подматрицы. Блочная трехдиагональная матрица A имеет вид
где Ak , Bk и Ck — квадратные подматрицы нижней, главной и верхней диагонали соответственно .
Блочная матрица Теплица — это еще одна специальная блочная матрица, которая содержит блоки, повторяющиеся по диагонали матрицы, поскольку в матрице Теплица элементы повторяются по диагонали.
Блочная матрица Теплица A имеет вид
Блокировать транспонирование
Для блочных матриц также можно определить специальную форму транспонирования , при которой отдельные блоки переупорядочиваются, но не транспонируются. Пусть это блочная матрица с блоками , транспонирование блоков - это блочная матрица с блоками . [10]
Как и в случае с обычным оператором трассировки, транспонирование блоков является линейным отображением таким, что . Однако, как правило, собственность не сохраняется, если не перемещаться по кварталам и не добираться до работы.
Прямая сумма
Для любых произвольных матриц A (размера m × n ) и B ( размера p × q ) мы имеем прямую сумму A и B , обозначаемую AB и определяемую как
Например,
Эта операция естественным образом обобщается на массивы произвольной размерности (при условии, что A и B имеют одинаковое количество измерений).
Обратите внимание, что любой элемент прямой суммы двух векторных пространств матриц можно представить как прямую сумму двух матриц.
Приложение
В терминах линейной алгебры использование блочной матрицы соответствует линейному отображению, рассматриваемому в терминах соответствующих «групп» базисных векторов . Это снова соответствует идее различения разложений области и диапазона в прямую сумму . Всегда особенно важно, если блок представляет собой нулевую матрицу ; который несет информацию, которую слагаемое отображает в подсумму.
Учитывая интерпретацию с помощью линейных отображений и прямых сумм, существует особый тип блочной матрицы, который встречается для квадратных матриц (случай m = n ). Для них мы можем предположить интерпретацию как эндоморфизм n - мерного пространства V ; Блочная структура, в которой группировка строк и столбцов одинакова, важна, поскольку она соответствует разложению одной прямой суммы на V (а не двум). В этом случае, например, все диагональные блоки в очевидном смысле являются квадратными. Этот тип структуры необходим для описания жордановой нормальной формы .
Этот метод используется для сокращения вычислений матриц, разложения столбцов и строк и многих приложений в области информатики , включая проектирование микросхем СБИС . Примером может служить алгоритм Штрассена для быстрого умножения матриц , а также кодирование Хэмминга(7,4) для обнаружения и восстановления ошибок при передаче данных.
Этот метод также можно использовать, когда элементы матриц A, B, C и D не требуют одного и того же поля для своих элементов. Например, матрица A может находиться над полем комплексных чисел, а матрица D — над полем действительных чисел. Это может привести к допустимым операциям с матрицами, одновременно упрощая операции внутри одной из матриц. Например, если в D есть только вещественные элементы, то поиск обратного требует меньше вычислений, чем если бы необходимо учитывать комплексные элементы. Но действительные числа — это подполе комплексных чисел (в дальнейшем его можно считать проекцией), поэтому операции с матрицами могут быть четко определены.
^ Ивс, Ховард (1980). Элементарная теория матриц (переиздание). Нью-Йорк: Дувр. п. 37. ИСБН 0-486-63946-0. Проверено 24 апреля 2013 г. Мы обнаружим, что иногда удобно разбить матрицу на прямоугольные блоки элементов. Это заставляет нас рассмотреть так называемые секционированные или блочные матрицы .
^ Антон, Ховард (1994). Элементарная линейная алгебра (7-е изд.). Нью-Йорк: Джон Уайли. п. 30. ISBN0-471-58742-7. Матрицу можно разделить на более мелкие матрицы, вставив горизонтальные и вертикальные правила между выбранными строками и столбцами.
^ Маседо, HD; Оливейра, JN (2013). «Типизация линейной алгебры: подход, ориентированный на два произведения». Наука компьютерного программирования . 78 (11): 2160–2191. arXiv : 1312.4818 . doi : 10.1016/j.scico.2012.07.012.
^ Ивс, Ховард (1980). Элементарная теория матриц (переиздание). Нью-Йорк: Дувр. п. 37. ИСБН0-486-63946-0. Проверено 24 апреля 2013 г. Разбиение, подобное теореме 1.9.4, называется соформным разбиением A и B.
^ Антон, Ховард (1994). Элементарная линейная алгебра (7-е изд.). Нью-Йорк: Джон Уайли. п. 36. ISBN0-471-58742-7. ...при условии, что размеры подматриц A и B таковы, что указанные операции могут быть выполнены.
^ Бернштейн, Деннис (2005). Матричная математика . Издательство Принстонского университета. п. 44. ИСБН0-691-11802-7.
^ Табога, Марко (2021). «Определитель блочной матрицы», Лекции по матричной алгебре.
^ Сильвестр, младший (2000). «Определители блочных матриц» (PDF) . Математика. Газ . 84 (501): 460–467. дои : 10.2307/3620776. JSTOR 3620776. Архивировано из оригинала (PDF) 18 марта 2015 г. Проверено 25 июня 2021 г.
^ Сотанафан, Нат (январь 2017 г.). «Определители блочных матриц с некоммутирующими блоками». Линейная алгебра и ее приложения . 512 : 202–218. arXiv : 1805.06027 . дои :10.1016/j.laa.2016.10.004. S2CID 119272194.
^ Макки, Д. Стивен (2006). Структурированная линеаризация матричных полиномов (PDF) (Диссертация). Университет Манчестера. ISSN 1749-9097. ОКЛК 930686781.
Рекомендации
Стрэнг, Гилберт (1999). «Лекция 3: Умножение и обратные матрицы». Программное обеспечение открытого курса MIT. 18:30–21:10.