stringtranslate.com

Обратимая матрица

В линейной алгебре обратимая матрица — это квадратная матрица , имеющая обратную . Другими словами, если какая-то другая матрица умножается на обратимую матрицу, результат можно умножить на обратную, чтобы отменить операцию. Обратимые матрицы имеют тот же размер, что и их обратная.

Определение

Квадратная матрица A размером n на n называется обратимой (также невырожденной , невырожденной или редко регулярной ), если существует квадратная матрица B размером n на n , такая, что где I n обозначает единичную матрицу размером n на n , а используемое умножение является обычным матричным умножением . [1] Если это так, то матрица B однозначно определяется A и называется (мультипликативной) обратной матрицей A , обозначаемой A −1 . Обращение матрицы — это процесс нахождения матрицы, которая при умножении на исходную матрицу дает единичную матрицу. [2]

Над полем квадратная матрица, которая не является обратимой, называется вырожденной или сингулярной . Квадратная матрица с элементами в поле является вырожденной тогда и только тогда, когда ее определитель равен нулю. Вырожденные матрицы редки в том смысле, что если элементы квадратной матрицы случайно выбираются из любой ограниченной области на числовой прямой или комплексной плоскости , вероятность того, что матрица вырождена, равна 0, то есть она «почти никогда» не будет вырожденной. Неквадратные матрицы, то есть матрицы размером m на n , для которых mn , не имеют обратной матрицы. Однако в некоторых случаях такая матрица может иметь левую обратную или правую обратную матрицу . Если A имеет размер m на n и ранг A равен n ( nm ), то A имеет левую обратную матрицу, матрицу B размером n на m, такую, что BA = I n . Если A имеет ранг m ( mn ), то у него есть правая обратная матрица B размером n на m такая, что AB = I m .

Хотя наиболее распространенным случаем являются матрицы над действительными или комплексными числами, все эти определения могут быть даны для матриц над любой алгебраической структурой, снабженной сложением и умножением (т. е. кольцами ). Однако в случае, когда кольцо является коммутативным , условием обратимости квадратной матрицы является то, что ее определитель обратим в кольце, что в общем случае является более строгим требованием, чем его ненулевое значение. Для некоммутативного кольца обычный определитель не определен. Условия существования лево-обратного или право-обратного более сложны, поскольку понятие ранга над кольцами не существует.

Множество обратимых матриц размера n × n вместе с операцией умножения матриц и элементами кольца R образуют группу , общую линейную группу степени n , обозначаемую GL n ( R ) .

Характеристики

Теорема об обратимой матрице

Пусть A — квадратная матрица n на n над полем K (например, полем действительных чисел ). Следующие утверждения эквивалентны, т.е. они либо все истинны, либо все ложны для любой заданной матрицы: [3]

Другие свойства

Кроме того, для обратимой матрицы A справедливы следующие свойства :

Строки обратной матрицы V матрицы U ортонормальны столбцам U (и наоборот, меняя строки на столбцы). Чтобы увидеть это, предположим, что UV = VU = I , где строки V обозначены как , а столбцы U как для Тогда ясно, что евклидово скалярное произведение любых двух Это свойство также может быть полезно при построении обратной квадратной матрицы в некоторых случаях, когда известен набор векторов, ортогональных (но не обязательно ортонормальных) к столбцам U. В этом случае можно применить итерационный процесс Грама–Шмидта к этому исходному набору, чтобы определить строки обратной матрицы V .

Матрица, которая является обратной самой себе (т. е. матрица A такая, что A = A −1 , и, следовательно, A2 = I ) , называется инволютивной матрицей .

В отношении его адъюнкта

Сопряжение матрицы A можно использовать для нахождения обратной матрицы A следующим образом:

Если A — обратимая матрица, то

В отношении матрицы идентичности

Из ассоциативности умножения матриц следует , что если

для конечных квадратных матриц A и B , то также

[4]

Плотность

Над полем действительных чисел множество сингулярных матриц n -на -n , рассматриваемое как подмножество ⁠ ⁠, является нулевым множеством , то есть имеет нулевую меру Лебега . Это верно, поскольку сингулярные матрицы являются корнями определительной функции. Это непрерывная функция , поскольку она является полиномом по элементам матрицы. Таким образом, на языке теории меры почти все матрицы n -на- n обратимы.

Более того, множество обратимых матриц n -на -n открыто и плотно в топологическом пространстве всех матриц n -на -n . Эквивалентно, множество сингулярных матриц замкнуто и нигде не плотно в пространстве матриц n -на -n .

Однако на практике можно столкнуться с необратимыми матрицами. А в числовых вычислениях матрицы, которые обратимы, но близки к необратимой матрице, все равно могут быть проблематичными; такие матрицы называются плохо обусловленными .

Примеры

Примером с рангом n − 1 является необратимая матрица

Мы видим, что ранг этой матрицы размером 2 на 2 равен 1, то есть n − 1 ≠ n , поэтому она необратима.

Рассмотрим следующую матрицу размером 2х2:

Матрица обратима. Чтобы проверить это, можно вычислить , что , что не равно нулю.

В качестве примера необратимой, или вырожденной, матрицы рассмотрим матрицу

Определитель матрицы равен 0, что является необходимым и достаточным условием необратимости матрицы.

Методы обращения матриц

Гауссово исключение

Гауссово исключение — полезный и простой способ вычисления обратной матрицы. Чтобы вычислить обратную матрицу с помощью этого метода, сначала создается расширенная матрица , левая сторона которой является инвертируемой матрицей, а правая — единичной матрицей . Затем Гауссово исключение используется для преобразования левой стороны в единичную матрицу, в результате чего правая сторона становится обратной входной матрицей.

Например, возьмем следующую матрицу:

Первым шагом для вычисления обратной матрицы является создание расширенной матрицы

Назовем первую строку этой матрицы и вторую строку . Затем складываем строку 1 со строкой 2. Это дает

Далее вычтем строку 2, умноженную на 3, из строки 1, что дает

Наконец, умножим строку 1 на −1 , а строку 2 на 2. Это даст единичную матрицу слева и обратную матрицу справа:

Таким образом,

Причина, по которой это работает, заключается в том, что процесс исключения Гаусса можно рассматривать как последовательность применения левого умножения матриц с использованием элементарных строчных операций с использованием элементарных матриц ( ), таких как

Применяя правое умножение с помощью , мы получаем правую часть , которая является обратной нам.

Для получения мы создаем расширенную матрицу, объединяя A с I и применяя исключение Гаусса . Две части будут преобразованы с использованием одной и той же последовательности элементарных операций над строками. Когда левая часть становится I , правая часть, примененная к той же последовательности элементарных операций над строками, станет A −1 .

Метод Ньютона

Обобщение метода Ньютона , используемое для мультипликативного обратного алгоритма, может быть удобным, если удобно найти подходящее начальное семя:

Виктор Пан и Джон Рейф проделали работу, которая включает способы создания начального семени. [5] [6]

Метод Ньютона особенно полезен при работе с семействами связанных матриц, которые ведут себя достаточно похоже на последовательность, созданную для гомотопии выше: иногда хорошей отправной точкой для уточнения приближения для новой обратной матрицы может быть уже полученная обратная матрица предыдущей матрицы, которая почти соответствует текущей матрице, например, пара последовательностей обратных матриц, используемых при получении квадратных корней матриц с помощью итерации Денмана–Биверса ; для этого может потребоваться более одного прохода итерации для каждой новой матрицы, если они недостаточно близки друг к другу, чтобы было достаточно одного. Метод Ньютона также полезен для «подправочных» поправок к алгоритму Гаусса–Жордана, который был загрязнен небольшими ошибками из-за несовершенной компьютерной арифметики .

Метод Кэли–Гамильтона

Теорема Кэли–Гамильтона позволяет выразить обратную величину A через det( A ) , следы и степени A : [7]

где n — размер A , а tr( A ) — след матрицы A, заданный суммой главной диагонали . Сумма берется по s и множествам всех удовлетворяющих линейному диофантову уравнению

Формулу можно переписать в терминах полных полиномов Белла аргументов как

Более подробно это описано в методе Кэли–Гамильтона .

Собственное разложение

Если матрица A может быть разложена по собственным значениям и ни одно из ее собственных значений не равно нулю, то A обратима и ее обратная матрица задается формулой

где Q — квадратная матрица ( N × N ) , i -й столбец которой является собственным вектором матрицы A , а Λдиагональная матрица, диагональные элементы которой являются соответствующими собственными значениями, то есть, если A симметрична, то Q гарантированно будет ортогональной матрицей , поэтому . Кроме того, поскольку Λ — диагональная матрица, ее обратная матрица легко вычисляется:

Разложение Холецкого

Если матрица A положительно определена , то ее обратную можно получить как

где Lнижнее треугольное разложение Холецкого матрицы A , а L * обозначает сопряженное транспонирование L.

Аналитическое решение

Запись транспонированной матрицы сомножителей , известной как адъюгатная матрица , также может быть эффективным способом вычисления обратной матрицы для небольших матриц, но этот рекурсивный метод неэффективен для больших матриц. Чтобы определить обратную матрицу, мы вычисляем матрицу сомножителей:

так что

где | A |определитель A , C — матрица сомножителей, а C T представляет собой транспонированную матрицу .

Обращение матриц 2 × 2

Уравнение кофактора, указанное выше, дает следующий результат для матриц 2 × 2. Обращение этих матриц можно выполнить следующим образом: [8]

Это возможно, поскольку 1/( adbc ) является обратной величиной определителя рассматриваемой матрицы, и ту же стратегию можно использовать для матриц других размеров.

Метод Кэли-Гамильтона дает

Обращение матриц 3 × 3

Вычислительно эффективное обращение матрицы 3 × 3 определяется по формуле

(где скаляр A не следует путать с матрицей A ).

Если определитель не равен нулю, матрица обратима, причем элементы промежуточной матрицы в правой части выше задаются выражением

Определитель A можно вычислить, применив правило Сарруса следующим образом:

Разложение Кэли-Гамильтона дает

Обратное 3 × 3 можно кратко выразить в терминах перекрестного произведения и тройного произведения . Если матрица (состоящая из трех векторов-столбцов, , , и ) обратима, ее обратная матрица задается как

Определитель матрицы A , det( A ) , равен тройному произведению x 0 , x 1 и x 2 — объему параллелепипеда , образованного строками или столбцами:

Корректность формулы можно проверить, используя свойства перекрестных и тройных произведений и заметив, что для групп левые и правые обратные всегда совпадают. Интуитивно, из-за перекрестных произведений, каждая строка A –1 ортогональна несоответствующим двум столбцам A (в результате чего недиагональные члены равны нулю). Деление на

приводит к тому, что диагональные элементы I = A −1 A равны единице. Например, первая диагональ:

Обращение матриц 4 × 4

С ростом размерности выражения для обратной величины A становятся сложнее. При n = 4 метод Кэли–Гамильтона приводит к выражению, которое все еще поддается обработке:

Блочная инверсия

Матрицы также можно инвертировать поблочно, используя следующую аналитическую формулу инверсии: [9]

где A , B , C и Dподблоки матрицы произвольного размера. ( A должна быть квадратной, чтобы ее можно было инвертировать. Кроме того, A и DCA −1 B должны быть невырожденными. [10] ) Эта стратегия особенно выгодна, если A диагональна, а DCA −1 B ( дополнение Шура к A ) — небольшая матрица, поскольку они являются единственными матрицами, требующими инвертирования.

Этот метод был изобретен несколько раз и принадлежит Гансу Больцу (1923), [ требуется ссылка ], который использовал его для обращения геодезических матриц, и Тадеушу Банахевичу (1937), который обобщил его и доказал его правильность.

Теорема о недействительности гласит, что недействительность A равна недействительности подблока в правом нижнем углу обратной матрицы, а недействительность B равна недействительности подблока в правом верхнем углу обратной матрицы.

Процедура инверсии, которая привела к уравнению ( 1 ), выполнила операции с блочной матрицей, которые сначала обрабатывали C и D. Вместо этого, если сначала обрабатываются A и B , и при условии, что D и ABD −1 C невырождены, [11] результат будет

Приравнивая уравнения ( 1 ) и ( 2 ), получаем

где Уравнение ( 3 ) представляет собой тождество матрицы Вудбери , которое эквивалентно биномиальной обратной теореме .

Если A и D являются обратимыми, то указанные выше две обратные блочные матрицы можно объединить, чтобы получить простую факторизацию

По тождеству Вайнштейна–Ароншайна одна из двух матриц в блочно-диагональной матрице обратима точно тогда, когда обратима другая.

Эта формула значительно упрощается, когда верхняя правая блочная матрица B является нулевой матрицей . Эта формулировка полезна, когда матрицы A и D имеют относительно простые обратные формулы (или псевдообратные в случае, когда блоки не все квадратные. В этом особом случае формула обращения блочной матрицы, изложенная в полной общности выше, становится

Если заданная обратимая матрица является симметричной матрицей с обратимым блоком A, то справедлива следующая формула обращения блока [12]

где . Это требует 2 инверсий матриц половинного размера A и S и только 4 умножений матриц половинного размера, если правильно организовано вместе с некоторыми сложениями, вычитаниями, отрицаниями и транспозициями незначительной сложности. Любая матрица имеет связанную положительно полуопределенную, симметричную матрицу , которая является точно обратимой (и положительно определенной), тогда и только тогда, когда является обратимой. Записывая обращение матрицы, можно свести его к инвертированию симметричных матриц и 2 дополнительным матричным умножениям, поскольку положительно определенная матрица удовлетворяет условию обратимости для своего левого верхнего блока A .

Эти формулы вместе позволяют построить алгоритм «разделяй и властвуй» , который использует поблочную инверсию связанных симметричных матриц для инвертирования матрицы с той же временной сложностью, что и алгоритм умножения матриц , который используется внутри. [12] Исследования сложности умножения матриц показывают, что существуют алгоритмы умножения матриц со сложностью O ( n 2,371552 ) операций, в то время как наилучшей доказанной нижней границей является Ω ( n 2 log n ) . [13]

Серия «Нейманн»

Если матрица A обладает тем свойством, что

тогда A невырожден и его обратный элемент может быть выражен рядом Неймана : [14]

Усечение суммы приводит к "приблизительной" обратной матрице, которая может быть полезна в качестве предобуславливателя . Обратите внимание, что усеченный ряд можно ускорить экспоненциально, заметив, что ряд Неймана является геометрической суммой . Таким образом, он удовлетворяет

.

Таким образом, для вычисления 2 L членов суммы требуется всего лишь 2 L − 2 матричных умножений.

В более общем смысле, если A «близка» к обратимой матрице X в том смысле, что

тогда A невырожденный и его обратный элемент

Если также AX имеет ранг 1, то это упрощается до

п-адическое приближение

Если A — матрица с целыми или рациональными элементами, и мы ищем решение в рациональных числах произвольной точности , то метод p -адической аппроксимации сходится к точному решению за O( n 4 log 2 n ) , предполагая, что используется стандартное умножение матриц O( n 3 ) . [15] Метод основан на решении n линейных систем с помощью метода Диксона p -адической аппроксимации (каждая за O( n 3 log 2 n ) ) и доступен как таковой в программном обеспечении, специализированном на матричных операциях произвольной точности, например, в IML. [16]

Метод обратных базисных векторов

Дана квадратная матрица n × n , с n строками, интерпретируемыми как n векторов ( предполагается суммирование Эйнштейна ), где являются стандартным ортонормированным базисом евклидова пространства ( ) , затем с помощью алгебры Клиффорда (или геометрической алгебры ) мы вычисляем обратные (иногда называемые дуальными ) векторы-столбцы:

как столбцы обратной матрицы Обратите внимание, что место " " указывает на то, что " " удалено из этого места в приведенном выше выражении для . Тогда мы имеем , где - символ Кронекера . Мы также имеем , как и требовалось. Если векторы не являются линейно независимыми, то и матрица необратима (не имеет обратной).

Производная обратной матрицы

Предположим, что обратимая матрица A зависит от параметра t . Тогда производная обратной матрицы A по t определяется как [17]

Чтобы вывести приведенное выше выражение для производной обратной матрицы A , можно дифференцировать определение обратной матрицы , а затем решить для обратной матрицы A :

Вычитая из обеих частей приведенного выше уравнения и умножая справа на , получаем правильное выражение для производной обратной функции:

Аналогично, если — небольшое число, то

В более общем смысле, если

затем,

Дано положительное целое число ,

Поэтому,

Обобщенная обратная

Некоторые свойства обратных матриц являются общими для обобщенных обратных матриц (например, обратная матрица Мура-Пенроуза ), которые можно определить для любой матрицы размером m на n . [18]

Приложения

Для большинства практических приложений нет необходимости обращать матрицу для решения системы линейных уравнений ; однако для единственного решения необходимо, чтобы задействованная матрица была обратимой.

Методы разложения, такие как LU-разложение, намного быстрее инверсии, и были также разработаны различные быстрые алгоритмы для специальных классов линейных систем.

Регрессия/наименьшие квадраты

Хотя явная обратная матрица не является необходимой для оценки вектора неизвестных, это самый простой способ оценить их точность, найденную в диагонали обратной матрицы (апостериорной ковариационной матрицы вектора неизвестных). Однако во многих случаях известны более быстрые алгоритмы для вычисления только диагональных элементов обратной матрицы. [19]

Обратные матрицы в моделировании в реальном времени

Инверсия матрицы играет важную роль в компьютерной графике , особенно в 3D-рендеринге графики и 3D-симуляциях. Примерами служат экран-мировой рей-кастинг , преобразования объектов мир-подпространство-мир и физические симуляции.

Обратные матрицы в беспроводной связи MIMO

Матричная инверсия также играет важную роль в технологии MIMO (Multiple-Input, Multiple-Output) в беспроводной связи . Система MIMO состоит из N передающих и M приемных антенн. Уникальные сигналы, занимающие одну и ту же полосу частот , отправляются через N передающих антенн и принимаются через M приемных антенн. Сигнал, поступающий на каждую приемную антенну, будет линейной комбинацией N переданных сигналов, образующих матрицу передачи H размером N  ×  M. Для того чтобы приемник мог вычислить переданную информацию, матрица H должна быть обратимой.

Смотрите также

Ссылки

  1. ^ Акслер, Шелдон (18 декабря 2014 г.). Линейная алгебра, сделанная правильно . Бакалаврские тексты по математике (3-е изд.). Springer Publishing (опубликовано в 2015 г.). стр. 296. ISBN 978-3-319-11079-0.
  2. ^ Дж.-С. Роджер Джанг (март 2001 г.). «Обратная матрица в блочной форме».
  3. ^ Weisstein, Eric W. "Теорема об обратимой матрице". mathworld.wolfram.com . Получено 08.09.2020 .
  4. ^ Хорн, Роджер А.; Джонсон, Чарльз Р. (1985). Матричный анализ . Cambridge University Press . стр. 14. ISBN 978-0-521-38632-6..
  5. ^ Пан, Виктор; Рейф, Джон (1985), Эффективное параллельное решение линейных систем , Труды 17-го ежегодного симпозиума ACM по теории вычислений, Провиденс: ACM
  6. ^ Пан, Виктор; Рейф, Джон (1985), Гарвардский университетский центр исследований в области вычислительных технологий, отчет TR-02-85 , Кембридж, Массачусетс: Aiken Computation Laboratory
  7. ^ Доказательство можно найти в Приложении Б Кондратюка Л.А.; Криворученко, М.И. (1992). «Сверхпроводящая кварковая материя цветовой группы SU (2)». Zeitschrift für Physik A. 344 (1): 99–115. Бибкод : 1992ZPhyA.344...99K. дои : 10.1007/BF01291027. S2CID  120467300.
  8. ^ Стрэнг, Гилберт (2003). Введение в линейную алгебру (3-е изд.). SIAM. стр. 71. ISBN 978-0-9614088-9-3., Глава 2, стр. 71
  9. ^ Tzon-Tzer, Lu; Sheng-Hua, Shiou (2002). «Обратные матрицы 2 × 2». Компьютеры и математика с приложениями . 43 (1–2): 119–129. doi :10.1016/S0898-1221(01)00278-4.
  10. ^ Бернстайн, Деннис (2005). Матричная математика . Princeton University Press. стр. 44. ISBN 978-0-691-11802-4.
  11. ^ Бернстайн, Деннис (2005). Матричная математика . Princeton University Press. стр. 45. ISBN 978-0-691-11802-4.
  12. ^ ab TH Cormen, CE Leiserson, RL Rivest, C. Stein, Введение в алгоритмы , 3-е изд., MIT Press, Кембридж, Массачусетс, 2009, §28.2.
  13. ^ Ран Раз . О сложности матричного произведения. В трудах тридцать четвертого ежегодного симпозиума ACM по теории вычислений. ACM Press, 2002. doi :10.1145/509907.509932.
  14. ^ Стюарт, Гилберт (1998). Матричные алгоритмы: Базовые разложения . SIAM. стр. 55. ISBN 978-0-89871-414-2.
  15. ^ Харамото, Х.; Мацумото, М. (2009). "P-адический алгоритм вычисления обратной целочисленной матрицы". Журнал вычислительной и прикладной математики . 225 (1): 320–322. Bibcode :2009JCoAM.225..320H. doi : 10.1016/j.cam.2008.07.044 .
  16. ^ "IML - Integer Matrix Library". cs.uwaterloo.ca . Получено 14 апреля 2018 г. .
  17. ^ Магнус, Ян Р.; Нойдекер, Хайнц (1999). Матричное дифференциальное исчисление: с приложениями в статистике и эконометрике (пересмотренное издание). Нью-Йорк: John Wiley & Sons. С. 151–152. ISBN 0-471-98633-X.
  18. ^ Роман, Стивен (2008), Продвинутая линейная алгебра , Graduate Texts in Mathematics (Третье изд.), Springer, стр. 446, ISBN 978-0-387-72828-5.
  19. ^ Линь, Линь; Лу, Цзяньфэн; Ин, Лексинг; Кар, Роберто; Э, Вэйнан (2009). «Быстрый алгоритм извлечения диагонали обратной матрицы с применением к анализу электронной структуры металлических систем». Communications in Mathematical Sciences . 7 (3): 755–777. doi : 10.4310/CMS.2009.v7.n3.a12 .

Дальнейшее чтение

Внешние ссылки