stringtranslate.com

Определитель

В математике определитель — это скалярная величина , которая является функцией элементов квадратной матрицы . Определитель матрицы A обычно обозначается det( A ) , det A или | А | . Его значение характеризует некоторые свойства матрицы и линейного отображения , представляемого матрицей. В частности, определитель отличен от нуля тогда и только тогда, когда матрица обратима и линейное отображение, представленное матрицей, является изоморфизмом . Определителем произведения матриц является произведение их определителей.

Определитель матрицы 2 × 2 равен

а определитель матрицы 3 × 3 равен

Определитель матрицы размера n × n может быть определен несколькими эквивалентными способами, наиболее распространенным из которых является формула Лейбница , которая выражает определитель как сумму ( факториал n ) знаковых произведений элементов матрицы. Его можно вычислить с помощью расширения Лапласа , которое выражает определитель как линейную комбинацию определителей подматриц, или с помощью метода исключения Гаусса , который выражает определитель как произведение диагональных элементов диагональной матрицы , полученной последовательностью элементарных вычислений. операции со строками .

Определители также могут определяться некоторыми из их свойств. А именно, определитель — это уникальная функция, определенная на матрицах размера n × n , которая обладает четырьмя следующими свойствами:

  1. Определитель единичной матрицы равен 1 .
  2. Обмен двух строк умножает определитель на −1 .
  3. Умножение строки на число умножает определитель на это число.
  4. Добавление к строке числа, кратного другой строке, не меняет определитель.

Вышеуказанные свойства, относящиеся к строкам (свойства 2–4), могут быть заменены соответствующими утверждениями, относящимися к столбцам.

Определители встречаются во всей математике. Например, для представления коэффициентов в системе линейных уравнений часто используется матрица , а для решения этих уравнений можно использовать определители ( правило Крамера ), хотя другие методы решения в вычислительном отношении гораздо более эффективны. Определители используются для определения характеристического многочлена матрицы, корнями которой являются собственные значения . В геометрии знаковый n -мерный объем n -мерного параллелепипеда выражается определителем, а определитель (матрица) линейного преобразования определяет, как преобразуются ориентация и n -мерный объем. Это используется в исчислении с внешними дифференциальными формами и определителем Якобиана , в частности, для замены переменных в кратных интегралах .

Матрицы два на два

Определитель матрицы 2 × 2 обозначается либо буквой « det », либо вертикальными чертами вокруг матрицы и определяется как

Например,

Первые объекты

Определитель имеет несколько ключевых свойств, которые можно доказать путем прямой оценки определения -матрицы и которые продолжают сохраняться для определителей более крупных матриц. Они заключаются в следующем: [1] во-первых, определитель единичной матрицы равен 1. Во-вторых, определитель равен нулю, если две строки одинаковы:

Это справедливо и в том случае, если два столбца одинаковы. Более того,

Наконец, если какой-либо столбец умножается на некоторое число (т. е. все записи в этом столбце умножаются на это число), определитель также умножается на это число:

Геометрический смысл

Площадь параллелограмма — это абсолютное значение определителя матрицы, образованной векторами, представляющими стороны параллелограмма.

Если элементы матрицы являются действительными числами, матрица A может использоваться для представления двух линейных карт : одна, которая отображает стандартные базисные векторы в строки A , и другая , которая отображает их в столбцы A. В любом случае изображения базисных векторов образуют параллелограмм , который представляет собой изображение единичного квадрата при отображении. Параллелограмм, определенный строками приведенной выше матрицы, имеет вершины в (0, 0) , ( a , b ) , ( a + c , b + d ) и ( c , d ) , как показано в сопроводительном документе. диаграмма.

Абсолютное значение adbc — это площадь параллелограмма и, таким образом, представляет собой масштабный коэффициент, с помощью которого площади преобразуются с помощью A. (Параллелограмм, образованный столбцами A, вообще говоря, представляет собой другой параллелограмм, но поскольку определитель симметричен относительно строк и столбцов, площадь будет той же.)

Абсолютное значение определителя вместе со знаком становится ориентированной площадью параллелограмма. Ориентированная область такая же, как и обычная площадь , за исключением того, что она отрицательна, когда угол между первым и вторым вектором, определяющим параллелограмм, поворачивается по часовой стрелке (что противоположно направлению, которое можно было бы получить для единичной матрицы ).

Чтобы показать, что adbc — это область со знаком, можно рассмотреть матрицу, содержащую два вектора u ≡ ( a , b ) и v ≡ ( c , d ) , представляющие стороны параллелограмма. Подписанную область можно выразить как | ты | | в | sin θ для угла θ между векторами, который равен просто основанию, умноженному на высоту, длину одного вектора, умноженную на перпендикулярную составляющую другого. Благодаря синусу это уже область со знаком, но ее можно выразить более удобно, используя косинус дополнительного угла к перпендикулярному вектору, например, u = (− b , a ) , так что | ты | | в | cos θ ' становится рассматриваемой областью со знаком, которую можно определить по образцу скалярного произведения , равному ad - bc , согласно следующим уравнениям:

Объем этого параллелепипеда есть абсолютное значение определителя матрицы, образованной столбцами, построенными из векторов r1, r2 и r3.

Таким образом, определитель дает масштабный коэффициент и ориентацию, индуцированную отображением, представленным A . Когда определитель равен единице, линейное отображение, определяемое матрицей, является равноплощадным и сохраняющим ориентацию.

С этими идеями связан объект, известный как бивектор . В 2D его можно интерпретировать как ориентированный плоский сегмент , образованный путем представления двух векторов, каждый из которых имеет начало координат (0, 0) и координаты ( a , b ) и ( c , d ) . Величина бивектора (обозначается ( a , b ) ∧ ( c , d ) ) — это площадь со знаком , которая также является определителем adbc . [2]

Если действительная матрица A размера n × n записана через ее векторы-столбцы , то

Это означает, что отображает единичный n -куб в n -мерный параллелоэдр , определяемый векторами области

Определитель дает знаковый n -мерный объем этого параллелоэдра и, следовательно, в более общем смысле описывает масштабный коэффициент n -мерного объема линейного преобразования, производимого A . [3] (Знак показывает, сохраняет ли преобразование ориентацию или меняет ее .) В частности, если определитель равен нулю, то этот параллелоэдр имеет нулевой объем и не является полностью n -мерным, что указывает на то, что размерность образа A равна меньше, чем n . Это означает , что A производит линейное преобразование, которое не является ни однозначным , ни однозначным , и поэтому не является обратимым.

Определение

Пусть Aквадратная матрица с n строками и n столбцами, так что ее можно записать как

Записи и т. д. во многих случаях представляют собой действительные или комплексные числа. Как обсуждается ниже, определитель также определен для матриц, элементы которых находятся в коммутативном кольце .

Определитель A обозначается det( A ), или его можно обозначить непосредственно через элементы матрицы, написав заключающие столбцы вместо скобок:

Существуют различные эквивалентные способы определения определителя квадратной матрицы A , то есть матрицы с одинаковым количеством строк и столбцов: определитель может быть определен с помощью формулы Лейбница , явной формулы, включающей суммы произведений определенных элементов матрицы. Определитель также можно охарактеризовать как уникальную функцию, зависящую от элементов матрицы, удовлетворяющих определенным свойствам. Этот подход также можно использовать для вычисления определителей путем упрощения рассматриваемых матриц.

формула Лейбница

матрицы 3 × 3

Формула Лейбница для определителя матрицы 3 × 3 имеет следующий вид:

В этом выражении каждый термин имеет один множитель из каждой строки, все в разных столбцах, расположенных в порядке возрастания строк. Например, bdi имеет b из второго столбца первой строки, d из первого столбца второй строки и i из третьего столбца третьей строки. Знаки определяются тем, сколько транспозиций факторов необходимо, чтобы расположить факторы в порядке возрастания их столбцов (при условии, что члены располагаются слева направо в порядке возрастания порядка строк): положительный при четном числе транспозиций и отрицательный при нечетное число. В примере с bdi однократное транспонирование bd в db дает dbi, три множителя которого взяты из первого, второго и третьего столбцов соответственно; это нечетное количество транспозиций, поэтому термин имеет отрицательный знак.

Правило Сарруса

Правило Сарруса представляет собой мнемонику расширенной формы этого определителя: сумма произведений трех диагональных линий матричных элементов с северо-запада на юго-восток минус сумма произведений трех диагональных линий с юго-запада на северо-восток. восточные строки элементов, когда рядом с ней пишутся копии первых двух столбцов матрицы, как на иллюстрации. Эта схема вычисления определителя матрицы 3×3 не переносится на более высокие измерения.

матрицы n × n

Обобщая вышеизложенное на более высокие измерения, определитель матрицы — это выражение, включающее перестановки и их подписи . Перестановка набора - это биективная функция из этого набора в себя со значениями, исчерпывающими все множество. Множество всех таких перестановок, называемое симметричной группой , обычно обозначается . Сигнатурой перестановки является то, что перестановку можно получить с помощью четного числа транспозиций (обменов двух записей); в противном случае это

Дана матрица

формула Лейбница для его определителя, используя сигма-обозначение суммы, равна

Используя обозначение числа Пи для продукта, его можно сократить до

.

Символ Леви-Чивита определяется для n - кортежей целых чисел как 0 , если два целых числа равны, и в противном случае как сигнатура перестановки, определяемая n- кортежом целых чисел. С символом Леви-Чивита формула Лейбница принимает вид

где сумма берется по всем n -наборам целых чисел из [4] [5]

Свойства определителя

Характеристика определителя

Определитель можно охарактеризовать следующими тремя ключевыми свойствами. Чтобы сформулировать это, удобно рассматривать -матрицу А как состоящую из своих столбцов, обозначаемых таким образом как

где вектор-столбец (для каждого i ) состоит из элементов матрицы в i -м столбце.

  1. , где – единичная матрица .
  2. Определитель является полилинейным : если j -й столбец матрицы записан как линейная комбинация двух вектор-столбцов v и w и числа r , то определитель A выражается как аналогичная линейная комбинация:
  3. Определитель является чередующимся : всякий раз, когда два столбца матрицы идентичны, ее определитель равен 0:

Если определитель определен с использованием формулы Лейбница, как указано выше, эти три свойства можно доказать путем непосредственного изучения этой формулы. Некоторые авторы также подходят к определителю напрямую, используя эти три свойства: можно показать, что существует ровно одна функция, которая присваивает любой -матрице А число, удовлетворяющее этим трем свойствам. [6] Это также показывает, что этот более абстрактный подход к определителю дает то же определение, что и подход, использующий формулу Лейбница.

Чтобы убедиться в этом, достаточно разложить определитель по многолинейности по столбцам в (огромную) линейную комбинацию определителей матриц, в которой каждый столбец является стандартным базисным вектором. Эти определители равны либо 0 (по свойству 9), либо ±1 (по свойствам 1 и 12 ниже), поэтому линейная комбинация дает приведенное выше выражение в терминах символа Леви-Чивита. Хотя эта характеристика выглядит менее технической, она не может полностью заменить формулу Лейбница при определении определителя, поскольку без нее неясно существование соответствующей функции. [ нужна цитата ]

Непосредственные последствия

Эти правила имеют несколько дополнительных последствий:

Пример

Эти характеризующие свойства и их последствия, перечисленные выше, являются теоретически значимыми, но также могут быть использованы для вычисления определителей для конкретных матриц. Фактически, метод исключения Гаусса можно применить для приведения любой матрицы к верхнетреугольной форме, и шаги этого алгоритма контролируемым образом влияют на определитель. Следующий конкретный пример иллюстрирует вычисление определителя матрицы с использованием этого метода:

Объединение этих равенств дает

Транспонировать

Определитель транспонирования равен определителю A :

.

Это можно доказать, исследуя формулу Лейбница. [7] Это означает, что во всех свойствах, упомянутых выше, слово «столбец» может быть заменено словом «строка». Например, если рассматривать матрицу размера n × n как состоящую из n строк, то определитель представляет собой n -линейную функцию.

Мультипликативность и матричные группы

Определитель представляет собой мультипликативное отображение , т. е. для квадратных матриц одинакового размера определитель произведения матриц равен произведению их определителей:

Этот ключевой факт можно доказать, заметив, что для фиксированной матрицы обе части уравнения чередуются и являются полилинейными как функция, зависящая от столбцов . Более того, они оба принимают значение, когда является единичной матрицей. Таким образом, вышеупомянутая уникальная характеристика чередующихся полилинейных отображений подтверждает это утверждение. [8]

Матрица с элементами в поле обратима ровно в том случае , если ее определитель не равен нулю. Это следует из мультипликативности определителя и формулы обратного преобразования с участием сопряженной матрицы, упомянутой ниже. В этом случае определитель обратной матрицы имеет вид

.

В частности, этим свойством по-прежнему обладают произведения и обратные матрицы с ненулевым определителем (соответственно, определителем). Таким образом, набор таких матриц (фиксированного размера по полю ) образует группу, известную как общая линейная группа (соответственно, подгруппа, называемая специальной линейной группой ). В более общем смысле слово «специальный» обозначает подгруппу другой группы матриц. матриц с определителем 1. Примеры включают специальную ортогональную группу (которая, если n равно 2 или 3, состоит из всех матриц вращения ) и специальную унитарную группу .

Поскольку определитель поддерживает умножение и обратное, на самом деле это гомоморфизм группы из в мультипликативную группу ненулевых элементов . Этот гомоморфизм сюръективен и его ядро ​​есть (матрицы с определителем один). Следовательно, по первой теореме изоморфизма это показывает, что это нормальная подгруппа , и что факторгруппа изоморфна .

Формула Коши -Бине является обобщением этой формулы произведения для прямоугольных матриц. Эту формулу также можно преобразовать в мультипликативную формулу для составных матриц , элементы которых являются определителями всех квадратичных подматриц данной матрицы. [9] [10]

Расширение Лапласа

Разложение Лапласа выражает определитель матрицы рекурсивно через определители меньших матриц, известных как ее миноры . Минорный определяется как определитель -матрицы , полученный в результате удаления -й строки и -го столбца. Выражение известно как кофактор . Для каждого имеет место равенство

которое называется разложением Лапласа по i- й строке . Например, разложение Лапласа по первой строке ( ) дает следующую формулу:

Раскручивание определителей этих -матриц дает упомянутую выше формулу Лейбница. Аналогично, разложение Лапласа по -му столбцу представляет собой равенство

Разложение Лапласа можно использовать итеративно для вычисления определителей, но этот подход неэффективен для больших матриц. Однако это полезно для вычисления определителей высокосимметричных матриц, таких как матрица Вандермонда.

-обобщитьnnчленовk xиn−kn−k

Адъюгатная матрица

Матрица сопряжения представляет собой транспонирование матрицы кофакторов, то есть

Для каждой матрицы имеется [11]

Таким образом, сопряженную матрицу можно использовать для выражения обратной неособой матрицы :

Блочные матрицы

Приведенная выше формула для определителя -матрицы продолжает выполняться при соответствующих дальнейших предположениях для блочной матрицы , т . е. матрицы, состоящей из четырех подматриц размерности , и соответственно. Самая простая такая формула, которую можно доказать с помощью формулы Лейбница или факторизации с дополнением Шура , имеет вид

Если обратим , то из результатов раздела о мультипликативности следует, что

что упрощается до -матрицы .

Аналогичный результат имеет место, когда обратимо, а именно

Оба результата можно объединить, чтобы вывести определяющую теорему Сильвестра , которая также изложена ниже.

Если блоки представляют собой квадратные матрицы одинакового размера , дальнейшие формулы справедливы. Например, если и коммутируют (т. е. ), то [12]

Эта формула была обобщена на матрицы, состоящие более чем из блоков, опять же при соответствующих условиях коммутативности между отдельными блоками. [13]

Для и справедлива следующая формула (даже если и не коммутируют )

Определяющая теорема Сильвестра

Детерминантная теорема Сильвестра утверждает, что для A — матрица m × n , а для B — матрица n × m (так что A и B имеют размеры, позволяющие их умножать в любом порядке, образуя квадратную матрицу):

где I m и I n — единичные матрицы m × m и n × n соответственно.

Из этого общего результата вытекает несколько следствий.

  1. Для случая вектора-столбца c и вектора-строки r , каждый из которых имеет m компонентов, формула позволяет быстро вычислить определитель матрицы, которая отличается от единичной матрицы на матрицу ранга 1:
  2. В более общем смысле, [14] для любой обратимой матрицы X размера m × m
  3. Для вектора-столбца и строки, как указано выше:
  4. Для квадратных матриц одинакового размера матрицы и имеют одинаковые характеристические полиномы (следовательно, одинаковые собственные значения).

Сумма

Определитель суммы двух квадратных матриц одинакового размера, вообще говоря , не выражается через определители A и B. Однако для положительных полуопределенных матриц равного размера

[15] [16]
эрмитовымикорень[17]

Тождество суммы для матриц 2 × 2

В частном случае матриц с комплексными элементами определитель суммы можно записать через определители и следы в следующем тождестве:

Удостоверение личности

Это можно показать, расписав каждый термин по компонентам . Левая сторона

Расширение дает

Видно, что члены, которые являются квадратичными по , и аналогично для , поэтому выражение можно записать

Тогда мы можем записать перекрестные члены как

который можно признать

что завершает доказательство.

Это имеет применение к матричным алгебрам. Например, рассмотрим комплексные числа как матричную алгебру. Комплексные числа имеют представление в виде матриц вида

Этот результат следовал как раз из и .

Свойства определителя по отношению к другим понятиям

Собственные значения и характеристический полином

Определитель тесно связан с двумя другими центральными понятиями линейной алгебры: собственными значениями и характеристическим многочленом матрицы. Пусть -матрица с комплексными элементами. Тогда по Основной теореме алгебры оно должно иметь ровно n собственных значений . (Здесь подразумевается, что собственное значение с алгебраической кратностью µ встречается в этом списке µ раз.) Тогда оказывается, что определитель A равен произведению этих собственных значений:

Произведение всех ненулевых собственных значений называется псевдодетерминантом .

Отсюда сразу видно, что определитель матрицы равен нулю тогда и только тогда, когда является собственным значением матрицы . Другими словами, является обратимым тогда и только тогда, когда не является собственным значением .

Характеристический полином определяется как [18]

Здесь – неопределенное значение многочлена, а – единичная матрица того же размера, что и . С помощью этого многочлена определители можно использовать для нахождения собственных значений матрицы : они являются в точности корнями этого многочлена, т. е. теми комплексными числами, что

Эрмитова матрица является положительно определенной, если все ее собственные значения положительны. Критерий Сильвестра утверждает, что это эквивалентно определителям подматриц.

быть положительным, для всех между и . [19]

След

След tr ( A ) по определению является суммой диагональных элементов A , а также суммой собственных значений. Таким образом, для комплексных матриц A ,

или, для вещественных матриц A ,

Здесь exp( A ) обозначает матричную экспоненту A , поскольку каждое собственное значение λ A соответствует собственному значению exp( λ ) exp( A ). В частности, для любого логарифма A , то есть любой матрицы L , удовлетворяющей

определитель A определяется выражением

Например, для n = 2 , n = 3 и n = 4 соответственно,

ср. Теорема Кэли-Гамильтона . Такие выражения выводятся из комбинаторных аргументов, тождеств Ньютона или алгоритма Фаддеева-Леверье . То есть для общего n det A = (−1) n c 0 — постоянный член характеристического полинома со знаком , определенный рекурсивно из

В общем случае это можно получить также из [20]

где сумма берется по множеству всех целых чисел k l ≥ 0, удовлетворяющих уравнению

Формулу можно выразить через полный экспоненциальный полином Белла от n аргументов s l = −( l – 1)! tr( A l ) как

Эту формулу также можно использовать для нахождения определителя матрицы A I J с многомерными индексами I = ( i 1 , i 2 , ..., i r ) и J = ( j 1 , j 2 , ..., j р ) . Произведение и след таких матриц естественным образом определяются как

Важное тождество произвольной размерности n можно получить из разложения логарифма в ряд Меркатора , когда разложение сходится. Если каждое собственное значение A меньше 1 по абсолютной величине,

где I — единичная матрица. В более общем смысле, если

разлагается как формальный степенной ряд по s , то все коэффициенты s m для m > n равны нулю, а оставшийся полином равен det( I + sA ) .

Верхняя и нижняя границы

Для положительно определенной матрицы A оператор следа дает следующие точные нижние и верхние границы логарифмического определителя:

с равенством тогда и только тогда, когда A = I. Эту взаимосвязь можно вывести с помощью формулы расхождения Кульбака-Лейблера между двумя многомерными нормальными распределениями.

Также,

Эти неравенства можно доказать, выразив следы и определитель через собственные значения. По сути, они отражают хорошо известный факт, что среднее гармоническое меньше среднего геометрического , которое меньше среднего арифметического , которое, в свою очередь, меньше среднеквадратического .

Производная

Формула Лейбница показывает, что определитель вещественных (или аналогично комплексных) квадратных матриц является полиномиальной функцией от до . В частности, оно всюду дифференцируемо . Его производную можно выразить с помощью формулы Якоби : [21]

где обозначает сопряжение . _ В частности, если обратимо, имеем

Выраженные в терминах записей , это

Еще одна эквивалентная формулировка:

,

используя большое обозначение O. Особый случай , когда единичная матрица дает

Это тождество используется при описании алгебр Ли , ассоциированных с некоторыми матричными группами Ли . Например, специальная линейная группа определяется уравнением . Приведенная выше формула показывает, что ее алгебра Ли является специальной линейной алгеброй Ли, состоящей из матриц, имеющих нулевой след.

Записав -матрицу как где - векторы-столбцы длины 3, тогда градиент по одному из трех векторов можно записать как векторное произведение двух других:

История

Исторически определители использовались задолго до появления матриц: изначально определитель определялся как свойство системы линейных уравнений . Определитель «определяет», имеет ли система единственное решение (что происходит именно в том случае, если определитель не равен нулю). В этом смысле определители были впервые использованы в китайском учебнике математики « Девять глав математического искусства» (九章算術, китайские учёные, около III века до нашей эры). В Европе решения линейных систем двух уравнений были выражены Кардано в 1545 году с помощью сущности, похожей на определитель. [22]

Собственно определители возникли отдельно от работы Секи Такакадзу в 1683 году в Японии и параллельно Лейбница в 1693 году. [23] [24] [25] [26] Крамер (1750) сформулировал без доказательства правило Крамера. [27] И Крамер, и Безу (1779) пришли к определителям вопросом о плоских кривых , проходящих через заданный набор точек. [28]

Вандермонд (1771) впервые признал детерминанты независимыми функциями. [24] Лаплас (1772) дал общий метод расширения определителя через его дополнительные миноры : Вандермонд уже привел частный случай. [29] Сразу после этого Лагранж (1773) рассмотрел определители второго и третьего порядка и применил их к вопросам теории исключения ; он доказал множество частных случаев общих тождеств.

Гаусс (1801 г.) сделал следующий шаг. Как и Лагранж, он широко использовал определители в теории чисел . Он ввел слово «определитель» (Лаплас использовал слово «результат»), но не в его нынешнем значении, а скорее применительно к дискриминанту кванта . [30] Гаусс также пришел к понятию обратных (обратных) определителей и очень близко подошел к теореме умножения. [ нужны разъяснения ]

Следующим важным вкладчиком является Бине (1811, 1812), который формально сформулировал теорему о произведении двух матриц из m столбцов и n строк, которая для частного случая m = n сводится к теореме умножения. В тот же день (30 ноября 1812 г.), когда Бине представил свою статью Академии, Коши также представил доклад на эту тему. (См. формулу Коши – Бине .) При этом он использовал слово «определитель» в его нынешнем смысле, [31] [32] суммировал и упростил то, что было тогда известно по этому вопросу, улучшил обозначения и дал теорему умножения с доказательство более удовлетворительное, чем у Бине. [24] [33] С него начинается теория в ее общности.

Якоби (1841) использовал функциональный определитель, который Сильвестр позже назвал якобианом . [34] В своих мемуарах в «Журнале Крелля» за 1841 год он специально рассматривает этот предмет, а также класс знакопеременных функций, которые Сильвестр назвал альтернативами . Примерно во время последних мемуаров Якоби Сильвестр (1839 г.) и Кэли начали свою работу. Кэли в 1841 году ввел современное обозначение определителя с помощью вертикальных черт. [35] [36]

Изучение специальных форм определителей явилось естественным результатом завершения общей теории. Осесимметричные определители изучались Лебегом , Гессе и Сильвестром; персимметричные определители Сильвестра и Ханкеля ; циркулянты Каталана , Споттисвуда , Глейшера и Скотта; косые определители и пфаффианы , в связи с теорией ортогональных преобразований , Кэли; продолжатели Сильвестра; Вронскианы (так называемые Мьюиром ) Кристоффеля и Фробениуса ; составные определители Сильвестра, Рейсса и Пике; Якобианы и гессианцы Сильвестра; и симметричные определители гош Труди . Из учебников по этому предмету первым был учебник Споттисвуда. В Америке трактаты опубликовали Ханус (1886 г.), Уэлд (1893 г.) и Мьюир / Мецлер (1933 г.).

Приложения

Правило Крамера

Определители можно использовать для описания решений линейной системы уравнений , записанной в матричной форме как . Это уравнение имеет единственное решение тогда и только тогда, когда оно не равно нулю. В этом случае решение дается по правилу Крамера :

где – матрица, образованная заменой -го столбца на вектор-столбец . Это немедленно следует из разложения определителя по столбцу, т. е.

где векторы являются столбцами A . Правило также подразумевается тождеством

Правило Крамера может быть реализовано за время, что сравнимо с более распространенными методами решения систем линейных уравнений, такими как LU , QR или разложение по сингулярным значениям . [37]

Линейная независимость

Определители могут использоваться для характеристики линейно зависимых векторов: равен нулю тогда и только тогда, когда векторы-столбцы (или, что то же самое, векторы-строки) матрицы линейно зависимы. [38] Например, при наличии двух линейно независимых векторов третий вектор лежит в плоскости , натянутой первыми двумя векторами, точно в том случае, если определитель -матрицы, состоящей из трех векторов, равен нулю. Та же идея также используется в теории дифференциальных уравнений : для заданных функций (предполагаемых дифференцируемыми по времени ) вронскиан определяется как

Она отлична от нуля (для некоторых ) в заданном интервале тогда и только тогда, когда данные функции и все их производные до порядка линейно независимы. Если можно показать, что вронскиан равен нулю всюду на интервале, то в случае аналитических функций это означает, что данные функции линейно зависимы. См. вронскиан и линейная независимость . Другим примером использования определителя является результирующая , которая дает критерий, когда два многочлена имеют общий корень . [39]

Ориентация основы

Определитель можно рассматривать как присвоение номера каждой последовательности из n векторов в R n с использованием квадратной матрицы, столбцы которой являются заданными векторами. Определитель будет отличен от нуля тогда и только тогда , когда последовательность векторов является базисом R n . В этом случае знак определителя определяет, согласуется ли ориентация базиса с ориентацией стандартного базиса или противоположна ему . В случае ортогонального базиса величина определителя равна произведению длин базисных векторов. Например, ортогональная матрица с элементами в Rn представляет собой ортонормированный базис в евклидовом пространстве и, следовательно, имеет определитель ±1 (поскольку все векторы имеют длину 1). Определитель равен +1 тогда и только тогда, когда базис имеет ту же ориентацию. Оно равно −1 тогда и только тогда, когда базис имеет противоположную ориентацию.

В более общем смысле, если определитель A положителен, A представляет собой линейное преобразование , сохраняющее ориентацию (если A — ортогональная матрица 2 × 2 или 3 × 3 , это вращение ), а если он отрицательный, A меняет ориентацию. основы.

Объем и определитель Якобиана

Как указывалось выше, абсолютное значение определителя вещественных векторов равно объему параллелепипеда, натянутого на эти векторы. Как следствие, если линейное отображение задано умножением на матрицу и является любым измеримым подмножеством , то объем равен умноженному на объем . [40] В более общем смысле, если линейная карта представлена ​​-матрицей , то -мерный объем определяется как:

Вычислив объем тетраэдра, ограниченного четырьмя точками, их можно использовать для выявления перекосов линий . Объем любого тетраэдра с учетом его вершин , или любой другой комбинации пар вершин, образующей связующее дерево по вершинам.

Нелинейная карта превращает небольшой квадрат (слева, красный) в искаженный параллелограмм (справа, красный). Якобиан в точке дает наилучшую линейную аппроксимацию искаженного параллелограмма вблизи этой точки (справа, полупрозрачный белый цвет), а определитель Якобиана дает отношение площади аппроксимирующего параллелограмма к площади исходного квадрата.

Для общей дифференцируемой функции многое из вышесказанного переносится при рассмотрении матрицы Якоби функции f . Для

матрица Якобиана представляет собой матрицу размера n × n , элементы которой задаются частными производными

Его определитель, определитель Якобиана , появляется в многомерной версии интегрирования путем подстановки : для подходящих функций f и открытого подмножества U в R n (область определения f ), интеграл по f ( U ) некоторой другой функции φ  : R nR m определяется выражением

Якобиан также встречается в теореме об обратной функции .

Применительно к области картографии определитель можно использовать для измерения скорости расширения карты вблизи полюсов. [41]

Абстрактные алгебраические аспекты

Определитель эндоморфизма

Из приведенных выше тождеств, касающихся определителя произведений и обратных матриц, следует, что подобные матрицы имеют один и тот же определитель: две матрицы A и B подобны, если существует обратимая матрица X такая, что A = X −1 BX . Действительно, повторное применение приведенных выше тождеств дает

Поэтому определитель также называют инвариантом подобия . Определитель линейного преобразования

для некоторого конечномерного векторного пространства V определяется как определитель описывающей его матрицы относительно произвольного выбора базиса в V . В силу инвариантности подобия этот определитель не зависит от выбора базиса V и, следовательно, зависит только от эндоморфизма T .

Квадратные матрицы над коммутативными кольцами

Приведенное выше определение определителя с использованием правила Лейбница работает в более общем смысле, когда элементы матрицы являются элементами коммутативного кольца , например целыми числами , а не полем действительных или комплексных чисел. Более того, характеристика определителя как уникального знакопеременного полилинейного отображения, удовлетворяющего условиям, по-прежнему сохраняется, как и все свойства, вытекающие из этой характеристики. [42]

Матрица обратима (в том смысле, что существует обратная матрица, элементы которой находятся в ) тогда и только тогда, когда ее определитель является обратимым элементом в . [43] Для это означает, что определитель равен +1 или -1. Такая матрица называется унимодулярной .

Определитель, будучи мультипликативным, определяет групповой гомоморфизм

между общей линейной группой (группой обратимых -матриц с элементами в ) и мультипликативной группой единиц в . Поскольку оно соблюдает умножение в обеих группах, это отображение является групповым гомоморфизмом .

Определитель представляет собой естественное преобразование.

Для гомоморфизма колец существует отображение , заданное заменой всех элементов в их образами в . Определитель учитывает эти отображения, т. е. тождество

держит. Другими словами, отображаемая коммутативная диаграмма коммутирует.

Например, определитель комплексно-сопряженной комплексной матрицы (который также является определителем ее сопряженного транспонирования) является комплексно-сопряженным ее определителем, а для целочисленных матриц: приведение по модулю определителя такой матрицы равно определитель матрицы уменьшается по модулю (последний определитель вычисляется с использованием модульной арифметики ). На языке теории категорий определитель представляет собой естественное преобразование между двумя функторами и . [44] Добавляя еще один уровень абстракции, это можно выразить, сказав, что определитель является морфизмом алгебраических групп , от общей линейной группы до мультипликативной группы ,

Внешняя алгебра

Определитель линейного преобразования -мерного векторного пространства или, в более общем плане, свободного модуля (конечного) ранга над коммутативным кольцом может быть сформулирован в бескоординатной форме, рассматривая -ю внешнюю степень . [45] Карта порождает линейное отображение

Поскольку карта является одномерной, она задается путем умножения на некоторый скаляр, т. е. на элемент из . Некоторые авторы, такие как (Бурбаки 1998), используют этот факт, чтобы определить определитель как элемент, удовлетворяющий следующему тождеству (для всех ):

Это определение согласуется с более конкретным определением, зависящим от координат. Это можно показать, используя уникальность полилинейной знакопеременной формы на -кортежах векторов в . По этой причине высшая ненулевая внешняя степень (в отличие от определителя, связанного с эндоморфизмом) иногда также называется определителем и аналогичным образом для более сложных объектов, таких как векторные расслоения или цепные комплексы векторных пространств. Второстепенные элементы матрицы также могут быть преобразованы в эту настройку, рассматривая более низкие чередующиеся формы с . [46]

Обобщения и родственные понятия

Определители, рассмотренные выше, допускают несколько вариантов: перманент матрицы определяется как определитель, за исключением того, что факторы, входящие в правило Лейбница, опускаются. Имманант обобщает оба , вводя в правило Лейбница характер симметрической группы .

Определители конечномерных алгебр

Для любой ассоциативной алгебры , конечномерной как векторное пространство над полем , существует детерминантное отображение [47]

Это определение продолжается путем установления характеристического полинома независимо от определителя и определения определителя как члена самого низкого порядка этого многочлена. Это общее определение восстанавливает определитель матричной алгебры , но также включает несколько дополнительных случаев, включая определитель кватерниона ,

,

норма расширения поля , а также пфаффиан кососимметрической матрицы и приведенная норма центральной простой алгебры также возникают как частные случаи этой конструкции.

Бесконечные матрицы

Для матриц с бесконечным числом строк и столбцов приведенные выше определения определителя не переносятся напрямую. Например, в формуле Лейбница необходимо вычислить бесконечную сумму (все члены которой являются бесконечными произведениями). Функциональный анализ предоставляет различные расширения определителя для таких бесконечномерных ситуаций, которые, однако, работают только для определенных типов операторов.

Определитель Фредгольма определяет определитель для операторов, известных как операторы ядерного класса , посредством соответствующего обобщения формулы

Другое бесконечномерное понятие определителя — функциональный определитель .

Операторы в алгебрах фон Неймана

Для операторов с конечным фактором можно определить положительный вещественный определитель, называемый определителем Фугледа-Кадисона, используя канонический след. Фактически, каждому состоянию следа в алгебре фон Неймана соответствует понятие определителя Фугледа–Кадисона.

Связанные понятия для некоммутативных колец

Для матриц над некоммутативными кольцами полилинейность и альтернирующие свойства несовместимы при n ≥ 2 , [48] , поэтому в этом случае не существует хорошего определения определителя.

Для квадратных матриц с элементами в некоммутативном кольце возникают различные трудности с определением определителей аналогично тому, как это делается для коммутативных колец. Формуле Лейбница можно придать смысл при условии, что порядок произведения указан, и аналогично для других определений определителя, но некоммутативность тогда приводит к потере многих фундаментальных свойств определителя, таких как мультипликативное свойство или что определитель не изменится при транспонировании матрицы. Над некоммутативными кольцами не существует разумного понятия полилинейной формы (существование ненулевой билинейной формы [ уточнить ] с регулярным элементом R в качестве значения для некоторой пары аргументов подразумевает, что R коммутативен). Тем не менее, были сформулированы различные понятия некоммутативного определителя, которые сохраняют некоторые свойства определителей, особенно квазидетерминантов и определителя Дьедонне . Для некоторых классов матриц с некоммутативными элементами можно определить определитель и доказать теоремы линейной алгебры, очень похожие на их коммутативные аналоги. Примеры включают q -детерминант на квантовых группах, определитель Капелли на матрицах Капелли и Березиниан на суперматрицах (т. е. матрицах, элементы которых являются элементами градуированных колец ). [49] Матрицы Манина образуют класс, наиболее близкий к матрицам с коммутативными элементами.

Расчет

Определители в основном используются в качестве теоретического инструмента. Они редко вычисляются явно в числовой линейной алгебре , где для таких приложений, как проверка обратимости и поиск собственных значений, определитель в основном вытесняется другими методами. [50] Однако вычислительная геометрия часто использует вычисления, связанные с определителями. [51]

Хотя определитель можно вычислить напрямую с помощью правила Лейбница, этот подход крайне неэффективен для больших матриц, поскольку эта формула требует вычисления ( факториала ) произведений для -матрицы . Таким образом, количество требуемых операций растет очень быстро: оно имеет порядок . Разложение Лапласа также неэффективно. Поэтому для расчета определителей были разработаны более сложные методы.

Методы разложения

Некоторые методы вычисляют , записывая матрицу как произведение матриц, определители которых легче вычислить. Такие методы называются методами декомпозиции. Примеры включают LU-разложение , QR-разложение или разложение Холецкого (для положительно определенных матриц ). Эти методы имеют порядок , что является значительным улучшением по сравнению с . [52]

Например, разложение LU выражается как произведение

матрицы перестановок (которая имеет ровно единицу в каждом столбце, а в противном случае — нули), нижнюю треугольную матрицу и верхнюю треугольную матрицу . Определители двух треугольных матриц можно быстро вычислить, поскольку они являются произведениями соответствующих диагональных элементов. Определитель — это просто знак соответствующей перестановки (которая предназначена для четного числа перестановок и для нечетного числа перестановок). Как только такое LU-разложение известно для , его определитель легко вычисляется как

Дальнейшие методы

Порядок , достигнутый методами декомпозиции, был улучшен различными методами. Если две матрицы порядка можно перемножить за время , причем для некоторых , то существует алгоритм, вычисляющий определитель за время . [53] Это означает, например, что существует алгоритм вычисления определителя, основанный на алгоритме Копперсмита-Винограда . С 2016 года этот показатель был снижен до 2,373. [54]

Помимо сложности алгоритма, для сравнения алгоритмов можно использовать и другие критерии. Специально для приложений, касающихся матриц над кольцами, существуют алгоритмы, вычисляющие определитель без каких-либо делений. (Напротив, исключение Гаусса требует делений.) Один из таких алгоритмов, обладающий сложностью, основан на следующей идее: перестановки (как в правиле Лейбница) заменяются так называемыми закрытыми упорядоченными блужданиями, в которых несколько элементов могут повторяться. В полученной сумме больше членов, чем в правиле Лейбница, но в процессе некоторые из этих произведений можно использовать повторно, что делает его более эффективным, чем наивные вычисления по правилу Лейбница. [55] Алгоритмы также можно оценивать по их битовой сложности , т. е. по тому, сколько бит точности необходимо для хранения промежуточных значений, возникающих при вычислении. Например, метод исключения Гаусса (или LU-разложение) имеет порядок , но длина промежуточных значений в битах может стать экспоненциально большой. [56] Для сравнения, алгоритм Барейсса представляет собой метод точного деления (поэтому он использует деление, но только в тех случаях, когда эти деления могут быть выполнены без остатка) имеет тот же порядок, но битовая сложность примерно равна битовой сложности. размер исходных записей в матрице раз . [57]

Если определитель A и обратное значение A уже вычислены, лемма об определителе матрицы позволяет быстро вычислить определитель A + uv T , где u и v — векторы-столбцы.

Чарльз Доджсон (т.е. Льюис Кэрролл из «Приключений Алисы в стране чудес» ) изобрел метод вычисления определителей, названный конденсацией Доджсона . К сожалению, этот интересный метод не всегда работает в исходном виде. [58]

Смотрите также

Примечания

  1. ^ Ланг 1985, §VII.1
  2. ^ Вильдбергер, Норман Дж. (2010). Эпизод 4 (видеолекция). ВильдЛинАлг. Сидней, Австралия: Университет Нового Южного Уэльса . Архивировано из оригинала 11 декабря 2021 г. – на YouTube.
  3. ^ «Определители и объемы». textbooks.math.gatech.edu . Проверено 16 марта 2018 г.
  4. ^ МакКоннелл (1957). Приложения тензорного анализа . Дуврские публикации. стр. 10–17.
  5. ^ Харрис 2014, §4.7
  6. ^ Серж Ланг , Линейная алгебра , 2-е издание, Аддисон-Уэсли, 1971, стр. 173, 191.
  7. ^ Ланг 1987, §VI.7, Теорема 7.5
  8. ^ Альтернативно, Бурбаки 1998, §III.8, предложение 1 доказывает этот результат, используя функториальность внешней степени.
  9. ^ Хорн и Джонсон 2018, §0.8.7
  10. ^ Кунг, Рота и Ян 2009, с. 306
  11. ^ Хорн и Джонсон 2018, §0.8.2.
  12. ^ Сильвестр, младший (2000). «Определители блочных матриц». Математика. Газ . 84 (501): 460–467. дои : 10.2307/3620776. JSTOR  3620776. S2CID  41879675.
  13. ^ Сотанафан, Нат (январь 2017 г.). «Определители блочных матриц с некоммутирующими блоками». Линейная алгебра и ее приложения . 512 : 202–218. arXiv : 1805.06027 . дои :10.1016/j.laa.2016.10.004. S2CID  119272194.
  14. ^ Доказательства можно найти по адресу http://www.ee.ic.ac.uk/hp/staff/dmb/matrix/proof003.html.
  15. ^ Линь, Минхуа; Сра, Суврит (2014). «Вполне сильная супераддитивность обобщенных матричных функций». arXiv : 1410.1958 [math.FA].
  16. ^ Паксой; Туркменский; Чжан (2014). «Неравенства обобщенных матричных функций через тензорные произведения». Электронный журнал линейной алгебры . 27 : 332–341. дои : 10.13001/1081-3810.1622 .
  17. Серр, Дени (18 октября 2010 г.). «Вогнутость det1/n над HPDn». MathOverflow .
  18. ^ Ланг 1985, §VIII.2, Horn & Johnson 2018, Def. 1.2.3
  19. ^ Horn & Johnson 2018, Наблюдение 7.1.2, Теорема 7.2.5
  20. ^ Доказательство можно найти в Приложении Б Кондратюка Л.А.; Криворученко, М.И. (1992). «Сверхпроводящая кварковая материя цветовой группы SU (2)». Zeitschrift für Physik A. 344 (1): 99–115. Бибкод : 1992ZPhyA.344...99K. дои : 10.1007/BF01291027. S2CID  120467300.
  21. ^ Horn & Johnson 2018, § 0.8.10
  22. ^ Граттан-Гиннесс 2003, §6.6
  23. ^ Каджори, Ф. История математики с. 80
  24. ^ abc Кэмпбелл, Х: «Линейная алгебра с приложениями», страницы 111–112. Эпплтон Сенчури Крофтс, 1971 год.
  25. ^ Евс 1990, с. 405
  26. ^ Краткая история линейной алгебры и теории матриц: «Краткая история линейной алгебры и теории матриц». Архивировано из оригинала 10 сентября 2012 года . Проверено 24 января 2012 г.
  27. ^ Кляйнер 2007, с. 80
  28. ^ Бурбаки (1994, стр. 59)
  29. ^ Мьюир, сэр Томас, Теория детерминантов исторического порядка развития [Лондон, Англия: Macmillan and Co., Ltd., 1906]. ЖФМ  37.0181.02
  30. ^ Кляйнер 2007, §5.2
  31. ^ Первое использование слова «детерминант» в современном смысле появилось в: Коши, Огюстен-Луи «Memoire sur les fonctions qui ne peuvent obtenir que deux valeurs égales et dessignes contraires par suite des transpositions operées entre lesvarium qu'elles». renferment», которая была впервые прочитана в Институте Франции в Париже 30 ноября 1812 года и которая впоследствии была опубликована в Journal de l'Ecole Polytechnique , Cahier 17, Tome 10, страницы 29–112 (1815).
  32. ^ Происхождение математических терминов: http://jeff560.tripod.com/d.html.
  33. ^ История матриц и определителей: http://www-history.mcs.st-and.ac.uk/history/HistTopics/Matrices_and_determinants.html
  34. ^ Евс 1990, с. 494
  35. ^ Каджори 1993, Том. II, с. 92, нет. 462
  36. ^ История матричных обозначений: http://jeff560.tripod.com/matrices.html.
  37. ^ Хабгуд и Арел, 2012 г.
  38. ^ Ланг 1985, §VII.3
  39. ^ Ланг 2002, §IV.8
  40. ^ Ланг 1985, §VII.6, Теорема 6.10.
  41. ^ Лэй, Дэвид (2021). Линейная алгебра и ее приложения, 6-е издание . Пирсон. п. 172.
  42. ^ Даммит и Фут 2004, §11.4
  43. ^ Даммит и Фут 2004, §11.4, Теорема 30
  44. ^ Мак Лейн 1998, §I.4. См. также Естественное преобразование § Определитель .
  45. ^ Бурбаки 1998, §III.8
  46. ^ Ломбарди и Квитте 2015, §5.2, Бурбаки 1998, §III.5
  47. ^ Гарибальди 2004 г.
  48. ^ В некоммутативной ситуации леволинейность (совместимость с левым умножением на скаляры) следует отличать от праволинейности. Предполагая, что линейность в столбцах считается леволинейной, для некоммутирующих скаляров a , b можно было бы получить :
    противоречие. Не существует полезного понятия полилинейных функций над некоммутативным кольцом.
  49. ^ Варадараджан, В.С. (2004), Суперсимметрия для математиков: введение, Американское математическое общество, ISBN 978-0-8218-3574-6.
  50. ^ «... мы отмечаем, что детерминант, хотя и является теоретически удобным понятием, редко находит полезную роль в числовых алгоритмах», см. Trefethen & Bau III 1997, лекция 1.
  51. ^ Фисикопулос и Пеньяранда 2016, §1.1, §4.3
  52. ^ Камареро, Кристобаль (05 декабря 2018 г.). «Простые, быстрые и практичные алгоритмы разложения Холецкого, LU и QR с использованием быстрого умножения прямоугольных матриц». arXiv : 1812.02056 [cs.NA].
  53. ^ Банч и Хопкрофт, 1974 г.
  54. ^ Фисикопулос и Пеньяранда 2016, §1.1
  55. ^ Роте 2001
  56. ^ Фан, Синь Гуй; Хавас, Джордж (1997). «О сложности целочисленного исключения Гаусса в наихудшем случае» (PDF) . Материалы международного симпозиума 1997 года по символьным и алгебраическим вычислениям . ИССАК '97. Кихеи, Мауи, Гавайи, США: ACM. стр. 28–31. дои : 10.1145/258726.258740. ISBN 0-89791-875-4. Архивировано из оригинала (PDF) 7 августа 2011 г. Проверено 22 января 2011 г.
  57. ^ Фисикопулос и Пеньяранда 2016, §1.1, Bareiss 1968
  58. ^ Абелес, Франсин Ф. (2008). «Конденсация Доджсона: историческое и математическое развитие экспериментального метода». Линейная алгебра и ее приложения . 429 (2–3): 429–438. дои : 10.1016/j.laa.2007.11.022 .

Рекомендации

Исторические справки

Внешние ссылки