stringtranslate.com

Обратимая матрица

В линейной алгебре квадратная матрица A размером n × n называется обратимой (также неособой , невырожденной или — редко используемой — регулярной ), если существует квадратная матрица B размером n × n такая, что

I nединичную матрицу размером nnматричным умножением[1]BA(мультипликативной) обратнойAA −1Инверсия матрицы[ нужна цитата ]

Над полем квадратная матрица, не являющаяся обратимой, называется сингулярной или вырожденной . Квадратная матрица с элементами в поле сингулярна тогда и только тогда, когда ее определитель равен нулю. Сингулярные матрицы встречаются редко в том смысле, что если элементы квадратной матрицы случайно выбраны из любой ограниченной области на числовой прямой или комплексной плоскости , вероятность того, что матрица сингулярна, равна 0, то есть она «почти никогда» не будет сингулярной. Неквадратные матрицы, т. е. матрицы размером m на n , для которых mn , не имеют обратной. Однако в некоторых случаях такая матрица может иметь левую обратную или правую обратную . Если A имеет размер m - n и ранг A равен n , ( nm ), то A имеет левую обратную, матрицу B размера n - m такую, что BA = I n . Если A имеет ранг m ( mn ), то у него есть правая обратная матрица B размером n x m такая, что AB = I m .

Хотя наиболее распространенным случаем являются матрицы над действительными или комплексными числами, все эти определения могут быть даны для матриц над любой алгебраической структурой, оснащенной операциями сложения и умножения (т. е. кольцами ). Однако в случае коммутативности кольца условием обратимости квадратной матрицы является то, что ее определитель обратим в кольце, что, как правило, является более строгим требованием, чем то, что она не равна нулю. Для некоммутативного кольца обычный определитель не определен. Условия существования левообратных или правообратных более сложны, поскольку над кольцами не существует понятия ранга.

Набор обратимых матриц размера n × n вместе с операцией умножения матриц и элементами из кольца R образует группуобщую линейную группу степени n , обозначаемую GL n ( R ) .

Характеристики

Теорема об обратимой матрице

Пусть A — квадратная матрица размером n × n над полем K (например, полем действительных чисел). Следующие утверждения эквивалентны, т.е. они либо все истинны, либо все ложны для любой данной матрицы: [2]

Другие объекты недвижимости

Кроме того, для обратимой матрицы A выполняются следующие свойства :

Строки обратной матрицы V матрицы U ортонормированы столбцам U (и наоборот, меняя местами строки на столбцы) . Чтобы убедиться в этом, предположим, что UV = VU = I , где строки V обозначены как, а столбцы U как для Тогда очевидно, что евклидово скалярное произведение любых двух . Это свойство также может быть полезно при построении обратной квадратной матрицы. в некоторых случаях, когда известен набор ортогональных векторов (но не обязательно ортонормированных векторов) столбцам U. В этом случае можно применить итерационный процесс Грама – Шмидта к этому исходному набору, чтобы определить строки обратного V .

Матрица, обратная самой себе (т. е. матрица A такая, что A = A −1 и, следовательно, A 2 = I ), называется инволютивной матрицей .

По отношению к своему адъюгату

Сопряжение матрицы A можно использовать для нахождения обратной матрицы A следующим образом :

Если A — обратимая матрица, то

По отношению к единичной матрице

Из ассоциативности умножения матриц следует, что если

для конечных квадратных матриц A и B , то также

[3]

Плотность

Над полем действительных чисел набор сингулярных матриц размером nxn , рассматриваемый как подмножество , является нулевым множеством , то есть имеет нулевую меру Лебега . Это верно, поскольку сингулярные матрицы являются корнями определяющей функции . Это непрерывная функция , поскольку она является полиномом от элементов матрицы. Таким образом , на языке теории меры почти все матрицы размером n × n обратимы.

Более того, обратимые матрицы размером n на n представляют собой плотное открытое множество в топологическом пространстве всех матриц размером n на n . Эквивалентно , множество сингулярных матриц замкнуто и нигде не плотно в пространстве n -n матриц.

Однако на практике можно встретить необратимые матрицы. А в численных расчетах матрицы, которые являются обратимыми, но близкими к необратимой матрице, все же могут быть проблематичными; такие матрицы называются плохо обусловленными .

Примеры

Примером ранга n - 1 является необратимая матрица.

Мы видим, что ранг этой матрицы 2х2 равен 1, что соответствует n - 1 ≠ n , поэтому она необратима.

Рассмотрим следующую матрицу 2х2:

Матрица обратима. Чтобы проверить это, можно вычислить значение , которое не равно нулю.

В качестве примера необратимой или сингулярной матрицы рассмотрим матрицу

Определитель равен 0, что является необходимым и достаточным условием необратимости матрицы.

Методы обращения матрицы

Исключение по Гауссу

Метод исключения Гаусса — полезный и простой способ вычисления обратной матрицы. Чтобы вычислить обратную матрицу с помощью этого метода, сначала создается расширенная матрица , левая часть которой является матрицей для инвертирования, а правая часть — единичной матрицей . Затем используется метод исключения Гаусса для преобразования левой части в единичную матрицу, в результате чего правая часть становится обратной входной матрице.

Например, возьмем следующую матрицу:

Первым шагом для вычисления обратной является создание расширенной матрицы

Вызовите первую строку этой матрицы и вторую строку . Затем добавьте строку 1 к строке 2. Это дает

Затем вычтите строку 2, умноженную на 3, из строки 1, что даст

Наконец, умножьте строку 1 на −1 и строку 2 на 2. Это даст единичную матрицу слева и обратную матрицу справа:

Таким образом,

Причина, по которой это работает, заключается в том, что процесс исключения Гаусса можно рассматривать как последовательность применения умножения левой матрицы с использованием элементарных операций над строками с использованием элементарных матриц ( ), таких как

Применяя правильное умножение, мы получаем И правую часть , которая является обратной, которую мы хотим.

Чтобы получить, мы создаем расширенную матрицу, объединяя A с I и применяя метод исключения Гаусса . Две части будут преобразованы с использованием одной и той же последовательности элементарных операций над строками. Когда левая часть становится I , правая часть, к которой применяется та же самая последовательность операций элементарной строки, становится A -1 .

метод Ньютона

Обобщение метода Ньютона , используемого для мультипликативного обратного алгоритма, может быть удобным, если удобно найти подходящее начальное начальное число:

Виктор Пэн и Джон Рейф проделали работу, включающую способы создания стартового семени. [4] [5] Журнал Byte резюмировал один из их подходов. [6]

Метод Ньютона особенно полезен при работе с семействами связанных матриц, которые ведут себя достаточно похоже на последовательность, созданную для приведенной выше гомотопии : иногда хорошей отправной точкой для уточнения приближения для новой обратной матрицы может быть уже полученная обратная матрица предыдущей, которая почти соответствует текущая матрица, например, пара последовательностей обратных матриц, используемых при получении квадратных корней матрицы с помощью итерации Денмана – Биверса ; для этого может потребоваться более одного прохода итерации для каждой новой матрицы, если они не расположены достаточно близко друг к другу, чтобы было достаточно только одного. Метод Ньютона также полезен для «подправки» поправок к алгоритму Гаусса – Джордана, который содержит небольшие ошибки из-за несовершенства компьютерной арифметики .

Метод Кэли – Гамильтона

Теорема Кэли -Гамильтона позволяет выразить обратную величину A через det( A ) , следы и степени A : [7]

где n — размер A , а tr( A ) — след матрицы A , заданный суммой главной диагонали . Сумма берется по s и множествам всех , удовлетворяющих линейному диофантовому уравнению

Формулу можно переписать в терминах полных полиномов Белла от аргументов :

Более подробно это описано в разделе « Метод Кэли – Гамильтона» .

Собственное разложение

Если матрица A может быть разложена по собственным значениям и ни одно из ее собственных значений не равно нулю, то A обратима, а ее обратная величина определяется формулой

где Q — квадратная ( N × N ) матрица, i -й столбец которой является собственным вектором A , а Λдиагональная матрица , диагональные элементы которой являются соответствующими собственными значениями, то есть, если A симметрично, Q гарантированно будет ортогональным матрица , поэтому Кроме того, поскольку Λ является диагональной матрицей, ее обратную легко вычислить:

Разложение Холецкого

Если матрица A положительно определена , то ее обратную можно получить как

где L — нижнее треугольное разложение Холецкого A , а L * обозначает сопряженное транспонирование L.

Аналитическое решение

Запись транспонирования матрицы кофакторов , известной как сопряженная матрица , также может быть эффективным способом вычисления обратной маленькой матрицы, но этот рекурсивный метод неэффективен для больших матриц. Для определения обратного вычисляем матрицу кофакторов:

так что

где | А | - определитель A , C - матрица сомножителей , а CT представляет собой транспонированную матрицу .

Инверсия матриц 2 × 2

Уравнение сомножителя , указанное выше, дает следующий результат для матриц 2 × 2 . Обращение этих матриц можно выполнить следующим образом: [8]

Это возможно, потому что 1/( adbc ) является обратной величиной определителя рассматриваемой матрицы, и ту же стратегию можно использовать для других размеров матрицы.

Метод Кэли – Гамильтона дает

Инверсия матриц 3×3

Вычислительно эффективная инверсия матрицы 3 × 3 определяется выражением

(где скаляр A не следует путать с матрицей A ).

Если определитель ненулевой, матрица обратима, а элементы промежуточной матрицы в правой части выше заданы выражением

Определитель A можно вычислить, применив правило Саррюса следующим образом:

Разложение Кэли – Гамильтона дает

Общее обратное 3 × 3 можно кратко выразить через векторное произведение и тройное произведение . Если матрица (состоящая из трех вектор-столбцов , , и ) обратима, ее обратная дается формулой

Определитель A , det( A ) , равен тройному произведению x 0 , x 1 и x 2 — объема параллелепипеда, образованного строками или столбцами:

Правильность формулы можно проверить, используя свойства перекрестного и тройного произведения и отметив, что для групп левые и правые обратные всегда совпадают. Интуитивно понятно, что из-за перекрестных произведений каждая строка A –1 ортогональна несоответствующим двум столбцам A (в результате чего недиагональные члены равны нулю). Деление на

приводит к тому, что диагональные элементы I = A −1 A становятся единицей. Например, первая диагональ:

Инверсия матриц 4 × 4

С увеличением размерности выражения, обратные к A , усложняются. Для n = 4 метод Кэли-Гамильтона приводит к выражению, которое все еще доступно:

Блочная инверсия

Матрицы также можно инвертировать поблочно , используя следующую аналитическую формулу обращения: [9]

где A , B , C и Dподблоки матрицы произвольного размера. ( A должен быть квадратным, чтобы его можно было перевернуть. Кроме того, A и DCA −1 B должны быть неособыми. [10] ) Эта стратегия особенно выгодна, если A диагональный и DCA −1 B ( схема Шура дополнение A ) представляет собой небольшую матрицу, поскольку они единственные матрицы, требующие обращения .

Этот метод несколько раз изобретался заново и принадлежит Гансу Больцу (1923), который использовал его для обращения геодезических матриц, и Тадеушу Банакевичу (1937 ) , который обобщил его и доказал его правильность.

Теорема о недействительности гласит , что недействительность A равна недействительности подблока в правом нижнем углу обратной матрицы, а недействительность B равна недействительности подблока в правом верхнем углу обратной матрицы.

Процедура инверсии, которая привела к уравнению ( 1 ), выполняла операции с блоками матриц, которые сначала работали с C и D. Вместо этого, если сначала действуют над A и B и при условии, что D и ABD −1 C несингулярны, [11] результат будет следующим:

Приравнивание уравнений ( 1 ) и ( 2 ) приводит к

где уравнение ( 3 ) представляет собой матричное тождество Вудбери , которое эквивалентно биномиальной обратной теореме .

Если A и D обратимы, то две приведенные выше обратные блочные матрицы можно объединить, чтобы обеспечить простую факторизацию.

Согласно тождеству Вайнштейна – Ароншайна , одна из двух матриц в блочно-диагональной матрице обратима ровно тогда, когда обратима другая.

Поскольку блочное обращение матрицы размера n × n требует инверсии двух матриц половинного размера и 6 умножений между двумя матрицами половинного размера, можно показать, что алгоритм «разделяй и властвуй» , который использует блочную инверсию для инвертирования матрицы, работает с той же временная сложность как алгоритм матричного умножения , который используется внутри. [12] Исследования сложности умножения матриц показывают, что существуют алгоритмы умножения матриц со сложностью операций O ( n 2,3727 ) , в то время как наиболее доказанная нижняя граница равна Ω ( n 2 log n ) . [13]

Эта формула значительно упрощается, когда верхняя правая блочная матрица B является нулевой матрицей . Эта формулировка полезна, когда матрицы A и D имеют относительно простые обратные формулы (или псевдообратные в случае, когда блоки не все квадратные. В этом частном случае формула обращения блочной матрицы, сформулированная в полной общности выше, становится

По серии Неймана

Если матрица А обладает свойством, что

тогда A невырождена и обратная к ней может быть выражена рядом Неймана : [14]

Усечение суммы приводит к «приблизительному» обратному результату, который может быть полезен в качестве предварительного условия . Обратите внимание, что усеченный ряд можно ускорить экспоненциально, заметив, что ряд Неймана представляет собой геометрическую сумму . Как таковое оно удовлетворяет

.

Следовательно, для вычисления 2 L членов суммы требуется всего 2 L - 2 умножения матриц.

В более общем смысле, если A находится «рядом» с обратимой матрицей X в том смысле, что

тогда A несингулярна и обратная к ней есть

Если также верно, что AX имеет ранг 1, то это упрощается до

p -адическое приближение

Если A — матрица с целыми или рациональными элементами и мы ищем решение в рациональных числах произвольной точности , то метод p -адической аппроксимации сходится к точному решению за O( n 4 log 2 n ) , предполагая стандартное O( n 3 ) используется матричное умножение. [15] Метод основан на решении n линейных систем с помощью метода p -адической аппроксимации Диксона (каждая за O( n 3 log 2 n ) ) и доступен как таковой в программном обеспечении, специализирующемся на матричных операциях произвольной точности, например, в ИМЛ. [16]

Метод обратных базисных векторов

Учитывая квадратную матрицу размера n × n , с n строками, интерпретируемыми как n векторов ( предполагается суммирование Эйнштейна ), где они являются стандартным ортонормированным базисом евклидова пространства ( ) , затем, используя алгебру Клиффорда (или геометрическую алгебру ), мы вычисляем обратную величину (иногда называемую двойные ) векторы-столбцы:

как столбцы обратной матрицы. Обратите внимание, что место " " указывает на то, что " " удаляется из этого места в приведенном выше выражении для . Затем мы знаем , где находится дельта Кронекера . У нас также есть , по мере необходимости. Если векторы не являются линейно независимыми, то и матрица не обратима (не имеет обратной).

Производная обратной матрицы

Предположим, что обратимая матрица A зависит от параметра t . Тогда производная обратного A по t определяется формулой [17]

Чтобы получить приведенное выше выражение для производной обратной матрицы A , можно дифференцировать определение обратной матрицы , а затем найти обратную матрицу :

Вычитание из обеих частей приведенного выше и умножение справа на дает правильное выражение для производной обратного:

Аналогично, если число небольшое, то

В более общем смысле, если

затем,

Учитывая положительное целое число ,

Поэтому,

Обобщенный обратный

Некоторые свойства обратных матриц являются общими для обобщенных обратных матриц (например, обратная матрица Мура-Пенроуза ), которая может быть определена для любой матрицы m - n . [18]

Приложения

Для большинства практических приложений нет необходимости инвертировать матрицу для решения системы линейных уравнений ; однако для единственности решения необходимо , чтобы используемая матрица была обратимой.

Методы декомпозиции, такие как LU-разложение , работают намного быстрее, чем инверсия, также были разработаны различные быстрые алгоритмы для специальных классов линейных систем.

Регрессия/наименьшие квадраты

Хотя явная обратная матрица не является необходимой для оценки вектора неизвестных, это самый простой способ оценить их точность, находящуюся в диагонали обратной матрицы (апостериорная ковариационная матрица вектора неизвестных). Однако во многих случаях известны более быстрые алгоритмы для вычисления только диагональных элементов обратной матрицы. [19]

Обратные матрицы в моделировании в реальном времени

Инверсия матрицы играет важную роль в компьютерной графике , особенно при рендеринге 3D-графики и 3D-моделировании. Примеры включают в себя преобразование лучей из экрана в мир , преобразования объектов из мира в подпространство и физическое моделирование.

Инверсия матрицы в беспроводной связи MIMO

Инверсия матрицы также играет важную роль в технологии MIMO (множественный вход, множественный выход) в беспроводной связи . Система MIMO состоит из N передающих и M приемных антенн. Уникальные сигналы, занимающие одну и ту же полосу частот , передаются через N передающих антенн и принимаются через M приемных антенн. Сигнал, поступающий на каждую приемную антенну, будет представлять собой линейную комбинацию N передаваемых сигналов, образующую матрицу передачи H размера N  ×  M. Крайне важно, чтобы матрица H была обратимой, чтобы получатель мог определить передаваемую информацию.

Смотрите также

Рекомендации

  1. Экслер, Шелдон (18 декабря 2014 г.). Линейная алгебра сделана правильно . Тексты для студентов по математике (3-е изд.). Springer Publishing (опубликовано в 2015 г.). п. 296. ИСБН 978-3-319-11079-0.
  2. ^ Вайсштейн, Эрик В. «Теорема об обратимой матрице». mathworld.wolfram.com . Проверено 8 сентября 2020 г.
  3. ^ Хорн, Роджер А.; Джонсон, Чарльз Р. (1985). Матричный анализ . Издательство Кембриджского университета . п. 14. ISBN 978-0-521-38632-6..
  4. ^ Пан, Виктор; Рейф, Джон (1985), Эффективное параллельное решение линейных систем , Материалы 17-го ежегодного симпозиума ACM по теории вычислений, Провиденс: ACM
  5. ^ Пан, Виктор; Рейф, Джон (1985), Центр исследований вычислительных технологий Гарвардского университета, отчет TR-02-85 , Кембридж, Массачусетс: Вычислительная лаборатория Эйкена
  6. ^ «Обращение больших матриц». Журнал Байт . 11 (4): 181–190. Апрель 1986 года.
  7. ^ Доказательство можно найти в Приложении Б Кондратюка Л.А.; Криворученко, М.И. (1992). «Сверхпроводящая кварковая материя цветовой группы SU (2)». Zeitschrift für Physik A. 344 (1): 99–115. Бибкод : 1992ZPhyA.344...99K. дои : 10.1007/BF01291027. S2CID  120467300.
  8. ^ Стрэнг, Гилберт (2003). Введение в линейную алгебру (3-е изд.). СИАМ. п. 71. ИСБН 978-0-9614088-9-3., Глава 2, стр. 71
  9. ^ Цон-Цер, Лу; Шэн-Хуа, Шиу (2002). «Обратные блочные матрицы 2 × 2». Компьютеры и математика с приложениями . 43 (1–2): 119–129. дои : 10.1016/S0898-1221(01)00278-4.
  10. ^ Бернштейн, Деннис (2005). Матричная математика . Издательство Принстонского университета. п. 44. ИСБН 978-0-691-11802-4.
  11. ^ Бернштейн, Деннис (2005). Матричная математика . Издательство Принстонского университета. п. 45. ИСБН 978-0-691-11802-4.
  12. ^ Т.Х. Кормен, К.Э. Лейзерсон, Р.Л. Ривест, К. Стейн, Введение в алгоритмы , 3-е изд., MIT Press, Кембридж, Массачусетс, 2009, §28.2.
  13. ^ Ран Раз . О сложности матричного произведения. В материалах тридцать четвертого ежегодного симпозиума ACM по теории вычислений. ACM Press, 2002. doi : 10.1145/509907.509932.
  14. ^ Стюарт, Гилберт (1998). Матричные алгоритмы: основные декомпозиции . СИАМ. п. 55. ИСБН 978-0-89871-414-2.
  15. ^ Харамото, Х.; Мацумото, М. (2009). «П-адический алгоритм вычисления обратной целочисленной матрицы». Журнал вычислительной и прикладной математики . 225 (1): 320–322. Бибкод : 2009JCoAM.225..320H. дои : 10.1016/j.cam.2008.07.044 .
  16. ^ "IML - Библиотека целочисленных матриц" . cs.uwaterloo.ca . Проверено 14 апреля 2018 г.
  17. ^ Магнус, Ян Р.; Нойдекер, Хайнц (1999). Матричное дифференциальное исчисление: с приложениями в статистике и эконометрике (пересмотренное издание). Нью-Йорк: Джон Уайли и сыновья. стр. 151–152. ISBN 0-471-98633-Х.
  18. ^ Роман, Стивен (2008), Продвинутая линейная алгебра , Тексты для выпускников по математике (Третье изд.), Springer, стр. 2008. 446, ISBN 978-0-387-72828-5.
  19. ^ Лин, Лин; Лу, Цзяньфэн; Инь, Лексинг; Автомобиль, Роберто; Э, Вэйнан (2009). «Быстрый алгоритм извлечения диагонали обратной матрицы с применением к анализу электронной структуры металлических систем». Связь в математических науках . 7 (3): 755–777. дои : 10.4310/CMS.2009.v7.n3.a12 .

дальнейшее чтение

Внешние ссылки