stringtranslate.com

Определитель

В математике определитель это скалярная функция элементов квадратной матрицы . Определитель матрицы A обычно обозначается det( A ) , det A или | A | . Его значение характеризует некоторые свойства матрицы и линейного отображения , представленного на заданном базисе матрицей. В частности, определитель не равен нулю тогда и только тогда, когда матрица обратима и соответствующее линейное отображение является изоморфизмом .

Определитель полностью определяется двумя следующими свойствами: определитель произведения матриц равен произведению их определителей, а определитель треугольной матрицы равен произведению ее диагональных элементов.

Определитель матрицы 2 × 2 равен

а определитель матрицы 3 × 3 равен

Определитель матрицы n × n можно определить несколькими эквивалентными способами, наиболее распространенным из которых является формула Лейбница , которая выражает определитель как сумму ( факториала n ) знаковых произведений элементов матрицы. Его можно вычислить с помощью разложения Лапласа , которое выражает определитель как линейную комбинацию определителей подматриц, или с помощью исключения Гаусса , что позволяет вычислить ступенчатую форму строки с тем же определителем , равным произведению диагональных элементов ступенчатой ​​формы строки.

Определители также могут быть определены некоторыми их свойствами. А именно, определитель — это уникальная функция, определенная на матрицах n × n , которая имеет четыре следующих свойства:

  1. Определитель единичной матрицы равен 1 .
  2. Перестановка двух строк умножает определитель на −1 .
  3. Умножение строки на число умножает определитель на это число.
  4. Добавление кратного одной строки к другой строке не меняет определитель.

Приведенные выше свойства, относящиеся к строкам (свойства 2–4), можно заменить соответствующими утверждениями относительно столбцов.

Определитель инвариантен относительно подобия матриц . Это означает, что при заданном линейном эндоморфизме конечномерного векторного пространства определитель матрицы, представляющей его на базисе, не зависит от выбранного базиса. Это позволяет определить определитель линейного эндоморфизма, который не зависит от выбора системы координат .

Определители встречаются во всей математике. Например, матрица часто используется для представления коэффициентов в системе линейных уравнений , и определители могут использоваться для решения этих уравнений ( правило Крамера ), хотя другие методы решения вычислительно гораздо более эффективны. Определители используются для определения характеристического многочлена квадратной матрицы, корни которой являются собственными значениями . В геометрии знаковый n -мерный объем n -мерного параллелепипеда выражается определителем, а определитель линейного эндоморфизма определяет, как ориентация и n -мерный объем преобразуются при эндоморфизме. Это используется в исчислении с внешними дифференциальными формами и определителем Якоби , в частности, для замены переменных в кратных интегралах .

Матрицы два на два

Определитель матрицы 2 × 2 обозначается либо « det », либо вертикальными чертами вокруг матрицы и определяется как

Например,

Первые свойства

Определитель имеет несколько ключевых свойств, которые можно доказать путем прямой оценки определения для -матриц, и которые продолжают выполняться для определителей больших матриц. Они следующие: [1] во-первых, определитель единичной матрицы равен 1. Во-вторых, определитель равен нулю, если две строки одинаковы:

Это справедливо и в том случае, если два столбца одинаковы. Более того,

Наконец, если какой-либо столбец умножается на некоторое число (т. е. все записи в этом столбце умножаются на это число), определитель также умножается на это число:

Геометрическое значение

Площадь параллелограмма — это абсолютное значение определителя матрицы, образованной векторами, представляющими стороны параллелограмма.

Если элементы матрицы являются действительными числами, матрица A может быть использована для представления двух линейных отображений : одно, которое отображает стандартные базисные векторы в строки A , и другое, которое отображает их в столбцы A. В любом случае образы базисных векторов образуют параллелограмм , который представляет собой образ единичного квадрата при отображении. Параллелограмм, определяемый строками указанной выше матрицы, имеет вершины в (0, 0) , ( a , b ) , ( a + c , b + d ) и ( c , d ) , как показано на прилагаемой диаграмме.

Абсолютное значение adbc является площадью параллелограмма и, таким образом, представляет собой масштабный коэффициент, с помощью которого площади преобразуются с помощью A. (Параллелограмм, образованный столбцами A, в общем случае является другим параллелограммом, но поскольку определитель симметричен относительно строк и столбцов, площадь будет той же.)

Абсолютное значение определителя вместе со знаком становится знаковой площадью параллелограмма. Знаковая площадь такая же, как и обычная площадь , за исключением того, что она отрицательна, когда угол между первым и вторым векторами, определяющими параллелограмм, поворачивается по часовой стрелке (что противоположно направлению, которое можно было бы получить для единичной матрицы ).

Чтобы показать, что adbc является знаковой площадью, можно рассмотреть матрицу, содержащую два вектора u ≡ ( a , b ) и v ≡ ( c , d ), представляющих стороны параллелограмма. Знаковая площадь может быть выражена как | u | | v | sin θ для угла θ между векторами, который является просто основанием, умноженным на высоту, длиной одного вектора, умноженной на перпендикулярную составляющую другого. Из-за синуса это уже знаковая площадь, однако ее можно выразить более удобно, используя косинус дополнительного угла к перпендикулярному вектору, например u = (− b , a ) , так что | u | | v | cos θ′ становится рассматриваемой знаковой площадью, которая может быть определена по шаблону скалярного произведения как равная adbc согласно следующим уравнениям:

Объем этого параллелепипеда равен абсолютному значению определителя матрицы, образованной столбцами, построенными из векторов r1, r2 и r3.

Таким образом, определитель дает масштабный коэффициент и ориентацию, индуцированную отображением, представленным A. Когда определитель равен единице, линейное отображение, определяемое матрицей, является равноплощадным и сохраняющим ориентацию.

Объект, известный как бивектор, связан с этими идеями. В 2D его можно интерпретировать как ориентированный плоский сегмент , образованный представлением двух векторов, каждый из которых имеет начало (0, 0) и координаты ( a , b ) и ( c , d ) . Величина бивектора (обозначаемая как ( a , b ) ∧ ( c , d ) ) — это площадь со знаком , которая также является определителем adbc . [2]

Если действительная матрица A размером n × n записана в терминах ее векторов-столбцов , то

Это означает, что отображает единичный n -мерный куб в n -мерный параллелоэдр, определяемый векторами области

Определитель дает знаковый n -мерный объем этого параллелоэдра и, следовательно, описывает в более общем виде n -мерный коэффициент масштабирования объема линейного преобразования, произведенного A . [3] (Знак показывает, сохраняет ли преобразование или меняет ориентацию .) В частности, если определитель равен нулю, то этот параллелоэдр имеет нулевой объем и не является полностью n -мерным, что указывает на то, что размерность образа A меньше n . Это означает , что A производит линейное преобразование, которое не является ни на , ни взаимно-однозначным , и поэтому не является обратимым.

Определение

Пусть Aквадратная матрица с n строками и n столбцами, так что ее можно записать как

Записи и т. д., для многих целей, являются действительными или комплексными числами. Как обсуждается ниже, определитель также определяется для матриц, записи которых находятся в коммутативном кольце .

Определитель матрицы A обозначается как det( A ) или его можно обозначить непосредственно через элементы матрицы, написав окружающие черты вместо скобок:

Существуют различные эквивалентные способы определения определителя квадратной матрицы A , т. е. матрицы с тем же числом строк и столбцов: определитель можно определить с помощью формулы Лейбница , явной формулы, включающей суммы произведений определенных элементов матрицы. Определитель также можно охарактеризовать как уникальную функцию, зависящую от элементов матрицы, удовлетворяющих определенным свойствам. Этот подход также можно использовать для вычисления определителей путем упрощения рассматриваемых матриц.

формула Лейбница

Матрицы 3 × 3

Формула Лейбница для определителя матрицы 3 × 3 выглядит следующим образом:

В этом выражении каждый член имеет один множитель из каждой строки, все в разных столбцах, расположенных в порядке возрастания строк. Например, bdi имеет b из первой строки второго столбца, d из второй строки первого столбца и i из третьей строки третьего столбца. Знаки определяются тем, сколько транспозиций множителей необходимо для расположения множителей в порядке возрастания их столбцов (учитывая, что члены расположены слева направо в порядке возрастания строк): положительный для четного числа транспозиций и отрицательный для нечетного числа. Для примера bdi одиночная транспозиция bd в db дает dbi, три множителя которого находятся из первого, второго и третьего столбцов соответственно; это нечетное число транспозиций, поэтому член появляется со знаком минус.

Правило Сарруса

Правило Сарруса является мнемоническим для расширенной формы этого определителя: сумма произведений трех диагональных линий элементов матрицы с северо-запада на юго-восток, минус сумма произведений трех диагональных линий элементов матрицы с юго-запада на северо-восток, когда копии первых двух столбцов матрицы записаны рядом с ней, как на иллюстрации. Эта схема вычисления определителя матрицы 3 × 3 не переносится в более высокие измерения.

н×нматрицы

Обобщая вышесказанное на более высокие измерения, определитель матрицы — это выражение, включающее перестановки и их сигнатуры . Перестановка множества — это биективная функция из этого множества в себя, со значениями, исчерпывающими весь набор. Множество всех таких перестановок, называемое симметрической группой , обычно обозначается как . Сигнатура перестановки — это если перестановку можно получить с четным числом транспозиций (обменов двух записей); в противном случае она

Дана матрица

формула Лейбница для ее определителя, используя сигма-обозначение для суммы, имеет вид

Используя обозначение Пи для произведения, это можно сократить до

.

Символ Леви-Чивиты определяется на n - кортежах целых чисел в как 0 , если два из целых чисел равны, и в противном случае как сигнатура перестановки, определяемой n- кортежом целых чисел. С символом Леви-Чивиты формула Лейбница становится

где сумма берется по всем n -кортежам целых чисел из [4] [5]

Свойства определителя

Характеристика определителя

Определитель можно охарактеризовать следующими тремя ключевыми свойствами. Чтобы сформулировать их, удобно рассматривать -матрицу A как состоящую из ее столбцов, поэтому обозначаемую как

где вектор-столбец (для каждого i ) состоит из элементов матрицы в i -м столбце.

  1. , где — единичная матрица .
  2. Определитель является полилинейным : если j -й столбец матрицы записан в виде линейной комбинации двух векторов-столбцов v и w и числа r , то определитель A можно выразить в виде аналогичной линейной комбинации:
  3. Определитель является знакопеременным : если два столбца матрицы идентичны, то ее определитель равен 0:

Если определитель определен с использованием формулы Лейбница, как указано выше, эти три свойства могут быть доказаны путем прямого изучения этой формулы. Некоторые авторы также подходят к определителю напрямую, используя эти три свойства: можно показать, что существует ровно одна функция, которая присваивает любой -матрице A число, удовлетворяющее этим трем свойствам. [6] Это также показывает, что этот более абстрактный подход к определителю дает то же определение, что и подход с использованием формулы Лейбница.

Чтобы увидеть это, достаточно разложить определитель по мультилинейности в столбцах в (огромную) линейную комбинацию определителей матриц, в которой каждый столбец является стандартным базисным вектором. Эти определители либо равны 0 (по свойству 9), либо ±1 (по свойствам 1 и 12 ниже), поэтому линейная комбинация дает приведенное выше выражение в терминах символа Леви-Чивиты. Хотя эта характеристика выглядит менее технической, она не может полностью заменить формулу Лейбница при определении определителя, поскольку без нее существование соответствующей функции неясно. [ необходима цитата ]

Немедленные последствия

Эти правила имеют ряд дополнительных последствий:

Пример

Эти характерные свойства и их следствия, перечисленные выше, являются теоретически значимыми, но также могут быть использованы для вычисления определителей для конкретных матриц. Фактически, исключение Гаусса может быть применено для приведения любой матрицы к верхней треугольной форме, и шаги в этом алгоритме влияют на определитель контролируемым образом. Следующий конкретный пример иллюстрирует вычисление определителя матрицы с использованием этого метода:

Объединение этих равенств дает

Транспонировать

Определитель транспонированного числа равен определителю числа A :

.

Это можно доказать, проверив формулу Лейбница. [7] Это подразумевает, что во всех свойствах, упомянутых выше, слово «столбец» может быть заменено на «строка» повсюду. Например, рассматривая матрицу n × n как состоящую из n строк, определитель является n -линейной функцией.

Мультипликативность и матричные группы

Определитель является мультипликативным отображением , т.е. для квадратных матриц одинакового размера определитель произведения матриц равен произведению их определителей:

Этот ключевой факт можно доказать, наблюдая, что для фиксированной матрицы обе стороны уравнения являются чередующимися и полилинейными как функция, зависящая от столбцов . Более того, они обе принимают значение, когда — единичная матрица. Вышеупомянутая уникальная характеристика чередующихся полилинейных отображений, таким образом, показывает это утверждение. [8]

Матрица с элементами в поле обратима точно , если ее определитель ненулевой. Это следует из мультипликативности определителя и формулы для обратной матрицы, включающей присоединенную матрицу, упомянутую ниже. В этом случае определитель обратной матрицы задается как

.

В частности, произведения и обратные матрицы с ненулевым определителем (соответственно, определитель один) все еще обладают этим свойством. Таким образом, множество таких матриц (фиксированного размера над полем ) образует группу, известную как общая линейная группа (соответственно, подгруппа, называемая специальной линейной группой . В более общем смысле, слово «специальная» указывает на подгруппу другой матричной группы матриц с определителем один. Примерами являются специальная ортогональная группа (которая, если n равно 2 или 3, состоит из всех матриц вращения ) и специальная унитарная группа .

Поскольку определитель уважает умножение и обратные, он фактически является групповым гомоморфизмом из в мультипликативную группу ненулевых элементов . Этот гомоморфизм сюръективен, а его ядром является (матрицы с определителем единица). Следовательно, по первой теореме об изоморфизме это показывает, что является нормальной подгруппой , и что фактор-группа изоморфна .

Формула Коши–Бине является обобщением этой формулы произведения для прямоугольных матриц. Эту формулу можно также переформулировать как мультипликативную формулу для составных матриц, элементы которой являются определителями всех квадратичных подматриц данной матрицы. [9] [10]

расширение Лапласа

Разложение Лапласа выражает определитель матрицы рекурсивно через определители меньших матриц, известных как ее миноры . Минор определяется как определитель -матрицы , которая получается путем удаления -й строки и -го столбца. Выражение известно как сомножитель . Для каждого имеет место равенство

что называется разложением Лапласа по i -й строке . Например, разложение Лапласа по первой строке ( ) дает следующую формулу:

Развертывание определителей этих -матриц возвращает формулу Лейбница, упомянутую выше. Аналогично, разложение Лапласа по -му столбцу есть равенство

Разложение Лапласа можно использовать итеративно для вычисления определителей, но этот подход неэффективен для больших матриц. Однако он полезен для вычисления определителей высокосимметричных матриц, таких как матрица Вандермонда . Разложение Лапласа по n - члену вдоль строки или столбца можно обобщить , чтобы записать определитель n x n как сумму членов , каждый из которых является произведением определителя подматрицы k x k и определителя дополнительной подматрицы ( n−k ) x ( n−k ).

Сопрягаемая матрица

Сопряжённая матрица является транспонированной матрицей кофакторов, то есть,

Для каждой матрицы имеется [11]

Таким образом, присоединенную матрицу можно использовать для выражения обратной невырожденной матрицы :

Блочные матрицы

Формула для определителя -матрицы выше продолжает выполняться, при соответствующих дальнейших предположениях, для блочной матрицы , т.е. матрицы, состоящей из четырех подматриц размерности , , и , соответственно. Самая простая такая формула, которая может быть доказана с использованием либо формулы Лейбница, либо факторизации с использованием дополнения Шура , это

Если обратим , то из результатов раздела о мультипликативности следует, что

что упрощается до случая, когда является -матрицей.

Аналогичный результат имеет место, когда обратим, а именно

Оба результата можно объединить для вывода теоремы Сильвестра об определителях , которая также изложена ниже.

Если блоки являются квадратными матрицами одинакового размера , то дальнейшие формулы справедливы. Например, если и коммутируют (т.е. ), то [12]

Эта формула была обобщена на матрицы, состоящие из более чем блоков, снова при соответствующих условиях коммутативности между отдельными блоками. [13]

Для и справедлива следующая формула (даже если и не коммутируют) [ необходима ссылка ]

Теорема Сильвестра об определителе

Теорема Сильвестра об определителях гласит, что для A , матрицы размером m × n , и B , матрицы размером n × m (так что A и B имеют размеры, позволяющие умножать их в любом порядке, образуя квадратную матрицу):

где I m и I n — единичные матрицы размером m × m и n × n соответственно.

Из этого общего результата вытекает несколько следствий.

  1. Для случая вектора-столбца c и вектора-строки r , каждый из которых имеет m компонентов, формула позволяет быстро вычислить определитель матрицы, которая отличается от единичной матрицы на матрицу ранга 1:
  2. В более общем смысле, [14] для любой обратимой матрицы X размером m × m ,
  3. Для вектора столбца и строки, как указано выше:
  4. Для квадратных матриц и одинакового размера матрицы и имеют одинаковые характеристические многочлены (следовательно, одинаковые собственные значения).

Сумма

Определитель суммы двух квадратных матриц одинакового размера в общем случае не выражается через определители матриц A и B.

Однако для положительно полуопределенных матриц и одинакового размера, с учетом следствия [ 15] [16]

Из теоремы Брунна–Минковского следует, что корень n- й степени определителя является вогнутой функцией при ограничении эрмитовыми положительно-определенными матрицами. [17] Следовательно, если A и B являются эрмитовыми положительно-определенными матрицами, то имеем, поскольку корень n- й степени определителя является однородной функцией .

Сумма тождеств для матриц 2×2

Для частного случая матриц с комплексными элементами определитель суммы можно записать через определители и следы в следующем тождестве:

Подтверждение личности

Это можно показать, расписав каждый член по компонентам . Левая часть —

Расширение дает

Видно, что члены, квадратичные по , равны , и аналогично для , поэтому выражение можно записать

Затем мы можем записать перекрестные члены как

который может быть признан как

что завершает доказательство.

Это имеет приложение к матричным алгебрам. Например, рассмотрим комплексные числа как матричную алгебру. Комплексные числа имеют представление в виде матриц вида с и вещественными. Так как , то взятие и в приведенном выше тождестве дает

Этот результат вытекает как раз из и .

Свойства определителя по отношению к другим понятиям

Собственные значения и характеристический полином

Определитель тесно связан с двумя другими центральными понятиями в линейной алгебре, собственными значениями и характеристическим многочленом матрицы. Пусть будет -матрицей с комплексными элементами. Тогда, по Основной теореме алгебры, должно иметь ровно n собственных значений . (Здесь подразумевается, что собственное значение с алгебраической кратностью μ встречается μ раз в этом списке.) Тогда оказывается, что определитель A равен произведению этих собственных значений,

Произведение всех ненулевых собственных значений называется псевдодетерминантом .

Из этого сразу видно, что определитель матрицы равен нулю тогда и только тогда, когда является собственным значением . Другими словами, обратим тогда и только тогда, когда не является собственным значением .

Характеристический многочлен определяется как [18]

Здесь — неопределенность многочлена, а — единичная матрица того же размера, что и . С помощью этого многочлена можно использовать определители для нахождения собственных значений матрицы : они являются в точности корнями этого многочлена, т. е. теми комплексными числами, что

Эрмитова матрица положительно определена , если все ее собственные значения положительны. Критерий Сильвестра утверждает, что это эквивалентно определителям подматриц

будучи положительным, для всех между и . [19]

След

След tr( A ) по определению является суммой диагональных элементов A и также равен сумме собственных значений. Таким образом, для комплексных матриц A ,

или, для действительных матриц A ,

Здесь exp( A ) обозначает матричную экспоненту A , поскольку каждое собственное значение λ матрицы A соответствует собственному значению exp( λ ) матрицы exp( A ). В частности, если задан любой логарифм A , то есть любая матрица L , удовлетворяющая

определитель A определяется как

Например, для n = 2 , n = 3 и n = 4 соответственно,

cf. Теорема Кэли-Гамильтона . Такие выражения выводятся из комбинаторных аргументов, тождеств Ньютона или алгоритма Фаддеева-Леверье . То есть, для общего n , det A = (−1) n c 0 знаковый постоянный член характеристического многочлена , определяемый рекурсивно из

В общем случае это также можно получить из [20]

где сумма берется по множеству всех целых чисел k l ≥ 0, удовлетворяющих уравнению

Формулу можно выразить через полный экспоненциальный полином Белла от n аргументов s l = −( l – 1)! tr( A l ) как

Эту формулу можно также использовать для нахождения определителя матрицы A I J с многомерными индексами I = ( i 1 , i 2 , ..., i r ) и J = ( j 1 , j 2 , ..., j r ) . Произведение и след таких матриц определяются естественным образом как

Важное произвольное тождество размерности n может быть получено из разложения логарифма в ряд Меркатора , когда разложение сходится. Если каждое собственное значение A меньше 1 по абсолютной величине,

где I — единичная матрица. В более общем случае, если

разлагается в формальный степенной ряд по s, то все коэффициенты s m при m > n равны нулю, а оставшийся многочлен равен det( I + sA ) .

Верхние и нижние границы

Для положительно определенной матрицы A оператор трассировки дает следующие точные нижние и верхние границы определителя логарифма:

с равенством тогда и только тогда, когда A = I. Это соотношение можно вывести с помощью формулы для расхождения Кульбака-Лейблера между двумя многомерными нормальными распределениями.

Также,

Эти неравенства можно доказать, выразив следы и определитель через собственные значения. Таким образом, они представляют собой хорошо известный факт, что среднее гармоническое меньше среднего геометрического , которое меньше среднего арифметического , которое, в свою очередь, меньше среднего квадратичного .

Производный

Формула Лейбница показывает, что определитель действительных (или аналогично для комплексных) квадратных матриц является полиномиальной функцией от до . В частности, она всюду дифференцируема . Ее производная может быть выражена с помощью формулы Якоби : [21]

где обозначает сопряжение . В частности, если обратимо, то имеем

Выраженные в терминах записей , они являются

Еще одна эквивалентная формулировка:

,

с использованием большой нотации O. Особый случай, когда , единичная матрица, дает

Это тождество используется при описании алгебр Ли, связанных с определенными матричными группами Ли . Например, специальная линейная группа определяется уравнением . Приведенная выше формула показывает, что ее алгебра Ли является специальной линейной алгеброй Ли, состоящей из тех матриц, след которых равен нулю.

Записав -матрицу как , где - векторы-столбцы длины 3, тогда градиент по одному из трех векторов можно записать как векторное произведение двух других:

История

Исторически определители использовались задолго до матриц: Определитель изначально определялся как свойство системы линейных уравнений . Определитель «определяет», имеет ли система единственное решение (что происходит именно тогда, когда определитель не равен нулю). В этом смысле определители впервые были использованы в китайском учебнике математики «Девять глав математического искусства» (九章算術, китайские ученые, около 3-го века до н. э.). В Европе решения линейных систем из двух уравнений были выражены Кардано в 1545 году с помощью сущности, похожей на определитель. [22]

Собственно определители возникли отдельно из работы Секи Такакадзу в 1683 году в Японии и параллельно Лейбница в 1693 году. [23] [24] [25] [26] Крамер (1750) сформулировал правило Крамера без доказательства. [27] И Крамер, и Безу (1779) пришли к определителям из вопроса о плоских кривых, проходящих через заданный набор точек. [28]

Вандермонд (1771) первым признал определители как независимые функции. [24] Лаплас (1772) дал общий метод разложения определителя по его дополнительным минорам : Вандермонд уже привел частный случай. [29] Сразу же после этого Лагранж (1773) рассмотрел определители второго и третьего порядка и применил их к вопросам теории исключения ; он доказал много частных случаев общих тождеств.

Гаусс (1801) сделал следующий шаг. Подобно Лагранжу, он широко использовал детерминанты в теории чисел . Он ввел слово «детерминант» (Лаплас использовал слово «результант»), хотя и не в настоящем значении, а скорее в применении к дискриминанту квантической функции . [30] Гаусс также пришел к понятию обратных (обратных) детерминантов и очень близко подошел к теореме умножения. [ необходимо разъяснение ]

Следующим по значимости был Бине (1811, 1812), который формально сформулировал теорему, касающуюся произведения двух матриц из m столбцов и n строк, которая для частного случая m = n сводится к теореме умножения. В тот же день (30 ноября 1812 г.), когда Бине представил свою работу в Академии, Коши также представил свою работу по этой теме. (См. формулу Коши–Бине .) В ней он использовал слово «детерминант» в его нынешнем смысле, [31] [32] обобщил и упростил то, что тогда было известно по этой теме, улучшил обозначения и дал теорему умножения с доказательством, более удовлетворительным, чем у Бине. [24] [33] С него начинается теория в ее общности.

Якоби (1841) использовал функциональный определитель, который Сильвестр позже назвал якобианом . [ 34] В своих мемуарах в журнале Крелля за 1841 год он специально рассматривает эту тему, а также класс знакопеременных функций, которые Сильвестр назвал альтернантами . Примерно во время последних мемуаров Якоби Сильвестр (1839) и Кейли начали свою работу. Кейли в 1841 году ввел современную нотацию для определителя с использованием вертикальных черт. [35] [36]

Изучение специальных форм определителей стало естественным результатом завершения общей теории. Осесимметричные определители изучались Лебегом , Гессе и Сильвестром; персимметричные определители — Сильвестром и Ганкелем ; циркулянтыКаталаном , Споттисвудом , Глейшером и Скоттом; косые определители и пфаффианы в связи с теорией ортогональных преобразований — Кэли; континуанты — Сильвестром; вронскианы (так называемые Мюиром ) — Кристоффелем и Фробениусом ; составные определители — Сильвестром, Рейссом и Пике; якобианы и гессианы — Сильвестром; и симметричные гош-определители — Труди . Из учебников по этому предмету учебник Споттисвуда был первым. В Америке трактаты опубликовали Ганус (1886), Уэлд (1893) и Мьюир/Мецлер (1933).

Приложения

Правило Крамера

Определители могут быть использованы для описания решений линейной системы уравнений , записанной в матричной форме как . Это уравнение имеет единственное решение тогда и только тогда, когда не равно нулю. В этом случае решение дается правилом Крамера :

где - матрица, образованная заменой -го столбца на вектор-столбец . Это следует непосредственно из столбцового разложения определителя, т.е.

где векторы являются столбцами матрицы A. Правило также подразумевается тождеством

Правило Крамера может быть реализовано со временем, что сопоставимо с более распространенными методами решения систем линейных уравнений, такими как LU , QR или сингулярное разложение . [37]

Линейная независимость

Определители могут быть использованы для характеристики линейно зависимых векторов: равен нулю тогда и только тогда, когда векторы-столбцы (или, что эквивалентно, векторы-строки) матрицы линейно зависимы. [38] Например, если заданы два линейно независимых вектора , третий вектор лежит в плоскости, охватываемой первыми двумя векторами, точно тогда, когда определитель -матрицы, состоящей из трех векторов, равен нулю. Та же идея используется и в теории дифференциальных уравнений : заданы функции (предполагается, что они дифференцируемы по времени ), вронскиан определяется как

Он не равен нулю (для некоторых ) в указанном интервале тогда и только тогда, когда заданные функции и все их производные вплоть до порядка линейно независимы. Если можно показать, что вронскиан равен нулю всюду на интервале, то в случае аналитических функций это означает, что заданные функции линейно зависимы. См. Вронскиан и линейная независимость . Другое такое использование определителя — результант , который дает критерий, когда два многочлена имеют общий корень . [39]

Ориентация основы

Определитель можно рассматривать как присвоение числа каждой последовательности из n векторов в R n , используя квадратную матрицу, столбцы которой являются заданными векторами. Определитель будет ненулевым тогда и только тогда, когда последовательность векторов является базисом для R n . В этом случае знак определителя определяет, согласуется ли ориентация базиса с ориентацией стандартного базиса или противоположна ей . В случае ортогонального базиса величина определителя равна произведению длин базисных векторов. Например, ортогональная матрица с элементами в R n представляет собой ортонормированный базис в евклидовом пространстве и, следовательно, имеет определитель ±1 (так как все векторы имеют длину 1). Определитель равен +1 тогда и только тогда, когда базис имеет ту же ориентацию. Он равен −1 тогда и только тогда, когда базис имеет противоположную ориентацию.

В более общем случае, если определитель A положителен, то A представляет собой сохраняющее ориентацию линейное преобразование (если A — ортогональная матрица 2 × 2 или 3 × 3 , то это поворот ), а если он отрицателен, то A меняет ориентацию базиса.

Объем и определитель Якобиана

Как указано выше, абсолютное значение определителя действительных векторов равно объему параллелепипеда, охватываемого этими векторами. Как следствие, если — линейная карта, заданная умножением на матрицу , и — любое измеримое подмножество , то объем задается умножением на объем . [40] В более общем случае, если линейная карта представлена ​​-матрицей , то -мерный объем задается как:

Вычислив объем тетраэдра, ограниченного четырьмя точками, их можно использовать для определения скрещивающихся линий . Объем любого тетраэдра, учитывая его вершины , или любую другую комбинацию пар вершин, которые образуют остовное дерево над вершинами.

Нелинейное отображение отправляет небольшой квадрат (слева, в красном) в искаженный параллелограмм (справа, в красном). Якобиан в точке дает наилучшее линейное приближение искаженного параллелограмма вблизи этой точки (справа, в полупрозрачном белом), а определитель Якобиана дает отношение площади аппроксимирующего параллелограмма к площади исходного квадрата.

Для общей дифференцируемой функции многое из вышесказанного переносится при рассмотрении матрицы Якоби функции f . Для

Матрица Якоби — это матрица n × n , элементы которой задаются частными производными

Его определитель, определитель Якоби , появляется в многомерной версии интегрирования путем подстановки : для подходящих функций f и открытого подмножества U R n (области определения f ) интеграл по f ( U ) некоторой другой функции φ  : R nR m определяется как

Якобиан также встречается в теореме об обратной функции .

Применительно к области картографии определитель можно использовать для измерения скорости расширения карты вблизи полюсов. [41]

Абстрактные алгебраические аспекты

Определитель эндоморфизма

Вышеуказанные тождества, касающиеся определителя произведений и обратных матриц, подразумевают, что подобные матрицы имеют одинаковый определитель: две матрицы A и B подобны, если существует обратимая матрица X такая, что A = X −1 BX . Действительно, многократное применение приведенных выше тождеств дает

Определитель поэтому также называется инвариантом подобия . Определитель линейного преобразования

для некоторого конечномерного векторного пространства V определяется как определитель описывающей его матрицы относительно произвольного выбора базиса в V. В силу инвариантности подобия этот определитель не зависит от выбора базиса для V и, следовательно , зависит только от эндоморфизма T.

Квадратные матрицы над коммутативными кольцами

Вышеприведенное определение определителя с использованием правила Лейбница работает более общо, когда элементы матрицы являются элементами коммутативного кольца , например, целыми числами , в отличие от поля действительных или комплексных чисел. Более того, характеристика определителя как уникального чередующегося полилинейного отображения, которое удовлетворяет , все еще сохраняется, как и все свойства, вытекающие из этой характеристики. [42]

Матрица обратима (в том смысле, что существует обратная матрица, элементы которой находятся в ) тогда и только тогда, когда ее определитель является обратимым элементом в . [43] Для это означает, что определитель равен +1 или −1. Такая матрица называется унимодулярной .

Определитель является мультипликативным, он определяет гомоморфизм групп

между общей линейной группой (группой обратимых -матриц с элементами в ) и мультипликативной группой единиц в . Поскольку оно уважает умножение в обеих группах, это отображение является групповым гомоморфизмом .

Определитель — это естественное преобразование.

При наличии гомоморфизма колец существует отображение, заданное заменой всех записей в их образами при . Определитель соблюдает эти отображения, т.е. тождество

выполняется. Другими словами, отображаемая коммутативная диаграмма коммутирует.

Например, определитель комплексно сопряженной комплексной матрицы (который также является определителем ее сопряженного транспонирования) является комплексно сопряженным ее определителем, а для целочисленных матриц: модуль приведения определителя такой матрицы равен определителю матрицы, приведенной по модулю (последний определитель вычисляется с использованием модульной арифметики ). На языке теории категорий определитель является естественным преобразованием между двумя функторами и . [44] Добавляя еще один уровень абстракции, это фиксируется, говоря, что определитель является морфизмом алгебраических групп , из общей линейной группы в мультипликативную группу ,

Внешняя алгебра

The determinant of a linear transformation of an -dimensional vector space or, more generally a free module of (finite) rank over a commutative ring can be formulated in a coordinate-free manner by considering the -th exterior power of .[45] The map induces a linear map

As is one-dimensional, the map is given by multiplying with some scalar, i.e., an element in . Some authors such as (Bourbaki 1998) use this fact to define the determinant to be the element in satisfying the following identity (for all ):

This definition agrees with the more concrete coordinate-dependent definition. This can be shown using the uniqueness of a multilinear alternating form on -tuples of vectors in . For this reason, the highest non-zero exterior power (as opposed to the determinant associated to an endomorphism) is sometimes also called the determinant of and similarly for more involved objects such as vector bundles or chain complexes of vector spaces. Minors of a matrix can also be cast in this setting, by considering lower alternating forms with .[46]

Generalizations and related notions

Determinants as treated above admit several variants: the permanent of a matrix is defined as the determinant, except that the factors occurring in Leibniz's rule are omitted. The immanant generalizes both by introducing a character of the symmetric group in Leibniz's rule.

Determinants for finite-dimensional algebras

For any associative algebra that is finite-dimensional as a vector space over a field , there is a determinant map[47]

This definition proceeds by establishing the characteristic polynomial independently of the determinant, and defining the determinant as the lowest order term of this polynomial. This general definition recovers the determinant for the matrix algebra , but also includes several further cases including the determinant of a quaternion,

,

the norm of a field extension, as well as the Pfaffian of a skew-symmetric matrix and the reduced norm of a central simple algebra, also arise as special cases of this construction.

Infinite matrices

For matrices with an infinite number of rows and columns, the above definitions of the determinant do not carry over directly. For example, in the Leibniz formula, an infinite sum (all of whose terms are infinite products) would have to be calculated. Functional analysis provides different extensions of the determinant for such infinite-dimensional situations, which however only work for particular kinds of operators.

The Fredholm determinant defines the determinant for operators known as trace class operators by an appropriate generalization of the formula

Another infinite-dimensional notion of determinant is the functional determinant.

Operators in von Neumann algebras

For operators in a finite factor, one may define a positive real-valued determinant called the Fuglede−Kadison determinant using the canonical trace. In fact, corresponding to every tracial state on a von Neumann algebra there is a notion of Fuglede−Kadison determinant.

Related notions for non-commutative rings

For matrices over non-commutative rings, multilinearity and alternating properties are incompatible for n ≥ 2,[48] so there is no good definition of the determinant in this setting.

For square matrices with entries in a non-commutative ring, there are various difficulties in defining determinants analogously to that for commutative rings. A meaning can be given to the Leibniz formula provided that the order for the product is specified, and similarly for other definitions of the determinant, but non-commutativity then leads to the loss of many fundamental properties of the determinant, such as the multiplicative property or that the determinant is unchanged under transposition of the matrix. Over non-commutative rings, there is no reasonable notion of a multilinear form (existence of a nonzero bilinear form[clarify] with a regular element of R as value on some pair of arguments implies that R is commutative). Nevertheless, various notions of non-commutative determinant have been formulated that preserve some of the properties of determinants, notably quasideterminants and the Dieudonné determinant. For some classes of matrices with non-commutative elements, one can define the determinant and prove linear algebra theorems that are very similar to their commutative analogs. Examples include the q-determinant on quantum groups, the Capelli determinant on Capelli matrices, and the Berezinian on supermatrices (i.e., matrices whose entries are elements of -graded rings).[49] Manin matrices form the class closest to matrices with commutative elements.

Calculation

Determinants are mainly used as a theoretical tool. They are rarely calculated explicitly in numerical linear algebra, where for applications such as checking invertibility and finding eigenvalues the determinant has largely been supplanted by other techniques.[50] Computational geometry, however, does frequently use calculations related to determinants.[51]

While the determinant can be computed directly using the Leibniz rule this approach is extremely inefficient for large matrices, since that formula requires calculating ( factorial) products for an -matrix. Thus, the number of required operations grows very quickly: it is of order . The Laplace expansion is similarly inefficient. Therefore, more involved techniques have been developed for calculating determinants.

Gaussian elemination

Gaussian elimination consists of left multiplying a matrix by elementary matrices for getting a matrix in a row echelon form. One can restrict the computation to elementary matrices of determinant 1. In this case, the determinant of the resulting row echelon form equals the determinant of the initial matrix. As a row echelon form is a triangular matrix, its determinant is the product of the entries of its diagonal.

So, the determinant can be computed for almost free from the result of a Gaussian elemination.

Decomposition methods

Some methods compute by writing the matrix as a product of matrices whose determinants can be more easily computed. Such techniques are referred to as decomposition methods. Examples include the LU decomposition, the QR decomposition or the Cholesky decomposition (for positive definite matrices). These methods are of order , which is a significant improvement over .[52]

For example, LU decomposition expresses as a product

of a permutation matrix (which has exactly a single in each column, and otherwise zeros), a lower triangular matrix and an upper triangular matrix . The determinants of the two triangular matrices and can be quickly calculated, since they are the products of the respective diagonal entries. The determinant of is just the sign of the corresponding permutation (which is for an even number of permutations and is for an odd number of permutations). Once such a LU decomposition is known for , its determinant is readily computed as

Further methods

The order reached by decomposition methods has been improved by different methods. If two matrices of order can be multiplied in time , where for some , then there is an algorithm computing the determinant in time .[53] This means, for example, that an algorithm for computing the determinant exists based on the Coppersmith–Winograd algorithm. This exponent has been further lowered, as of 2016, to 2.373.[54]

In addition to the complexity of the algorithm, further criteria can be used to compare algorithms. Especially for applications concerning matrices over rings, algorithms that compute the determinant without any divisions exist. (By contrast, Gauss elimination requires divisions.) One such algorithm, having complexity is based on the following idea: one replaces permutations (as in the Leibniz rule) by so-called closed ordered walks, in which several items can be repeated. The resulting sum has more terms than in the Leibniz rule, but in the process several of these products can be reused, making it more efficient than naively computing with the Leibniz rule.[55] Algorithms can also be assessed according to their bit complexity, i.e., how many bits of accuracy are needed to store intermediate values occurring in the computation. For example, the Gaussian elimination (or LU decomposition) method is of order , but the bit length of intermediate values can become exponentially long.[56] By comparison, the Bareiss Algorithm, is an exact-division method (so it does use division, but only in cases where these divisions can be performed without remainder) is of the same order, but the bit complexity is roughly the bit size of the original entries in the matrix times .[57]

If the determinant of A and the inverse of A have already been computed, the matrix determinant lemma allows rapid calculation of the determinant of A + uvT, where u and v are column vectors.

Charles Dodgson (i.e. Lewis Carroll of Alice's Adventures in Wonderland fame) invented a method for computing determinants called Dodgson condensation. Unfortunately this interesting method does not always work in its original form.[58]

See also

Notes

  1. ^ Lang 1985, §VII.1
  2. ^ Wildberger, Norman J. (2010). Episode 4 (video lecture). WildLinAlg. Sydney, Australia: University of New South Wales. Archived from the original on 2021-12-11 – via YouTube.
  3. ^ "Determinants and Volumes". textbooks.math.gatech.edu. Retrieved 16 March 2018.
  4. ^ McConnell (1957). Applications of Tensor Analysis. Dover Publications. pp. 10–17.
  5. ^ Harris 2014, §4.7
  6. ^ Serge Lang, Linear Algebra, 2nd Edition, Addison-Wesley, 1971, pp 173, 191.
  7. ^ Lang 1987, §VI.7, Theorem 7.5
  8. ^ Alternatively, Bourbaki 1998, §III.8, Proposition 1 proves this result using the functoriality of the exterior power.
  9. ^ Horn & Johnson 2018, §0.8.7
  10. ^ Kung, Rota & Yan 2009, p. 306
  11. ^ Horn & Johnson 2018, §0.8.2.
  12. ^ Silvester, J. R. (2000). "Determinants of Block Matrices". Math. Gaz. 84 (501): 460–467. doi:10.2307/3620776. JSTOR 3620776. S2CID 41879675.
  13. ^ Sothanaphan, Nat (January 2017). "Determinants of block matrices with noncommuting blocks". Linear Algebra and Its Applications. 512: 202–218. arXiv:1805.06027. doi:10.1016/j.laa.2016.10.004. S2CID 119272194.
  14. ^ Proofs can be found in http://www.ee.ic.ac.uk/hp/staff/dmb/matrix/proof003.html
  15. ^ Lin, Minghua; Sra, Suvrit (2014). "Completely strong superadditivity of generalized matrix functions". arXiv:1410.1958 [math.FA].
  16. ^ Paksoy; Turkmen; Zhang (2014). "Inequalities of Generalized Matrix Functions via Tensor Products". Electronic Journal of Linear Algebra. 27: 332–341. doi:10.13001/1081-3810.1622.
  17. ^ Serre, Denis (Oct 18, 2010). "Concavity of det1/n over HPDn". MathOverflow.
  18. ^ Lang 1985, §VIII.2, Horn & Johnson 2018, Def. 1.2.3
  19. ^ Horn & Johnson 2018, Observation 7.1.2, Theorem 7.2.5
  20. ^ A proof can be found in the Appendix B of Kondratyuk, L. A.; Krivoruchenko, M. I. (1992). "Superconducting quark matter in SU(2) color group". Zeitschrift für Physik A. 344 (1): 99–115. Bibcode:1992ZPhyA.344...99K. doi:10.1007/BF01291027. S2CID 120467300.
  21. ^ Horn & Johnson 2018, § 0.8.10
  22. ^ Grattan-Guinness 2003, §6.6
  23. ^ Cajori, F. A History of Mathematics p. 80
  24. ^ a b c Campbell, H: "Linear Algebra With Applications", pages 111–112. Appleton Century Crofts, 1971
  25. ^ Eves 1990, p. 405
  26. ^ A Brief History of Linear Algebra and Matrix Theory at: "A Brief History of Linear Algebra and Matrix Theory". Archived from the original on 10 September 2012. Retrieved 24 January 2012.
  27. ^ Kleiner 2007, p. 80
  28. ^ Bourbaki (1994, p. 59)
  29. ^ Muir, Sir Thomas, The Theory of Determinants in the historical Order of Development [London, England: Macmillan and Co., Ltd., 1906]. JFM 37.0181.02
  30. ^ Kleiner 2007, §5.2
  31. ^ The first use of the word "determinant" in the modern sense appeared in: Cauchy, Augustin-Louis "Memoire sur les fonctions qui ne peuvent obtenir que deux valeurs égales et des signes contraires par suite des transpositions operées entre les variables qu'elles renferment," which was first read at the Institute de France in Paris on November 30, 1812, and which was subsequently published in the Journal de l'Ecole Polytechnique, Cahier 17, Tome 10, pages 29–112 (1815).
  32. ^ Origins of mathematical terms: http://jeff560.tripod.com/d.html
  33. ^ History of matrices and determinants: http://www-history.mcs.st-and.ac.uk/history/HistTopics/Matrices_and_determinants.html
  34. ^ Eves 1990, p. 494
  35. ^ Cajori 1993, Vol. II, p. 92, no. 462
  36. ^ History of matrix notation: http://jeff560.tripod.com/matrices.html
  37. ^ Habgood & Arel 2012
  38. ^ Lang 1985, §VII.3
  39. ^ Lang 2002, §IV.8
  40. ^ Lang 1985, §VII.6, Theorem 6.10
  41. ^ Lay, David (2021). Linear Algebra and Its Applications 6th Edition. Pearson. p. 172.
  42. ^ Dummit & Foote 2004, §11.4
  43. ^ Dummit & Foote 2004, §11.4, Theorem 30
  44. ^ Mac Lane 1998, §I.4. See also Natural transformation § Determinant.
  45. ^ Bourbaki 1998, §III.8
  46. ^ Lombardi & Quitté 2015, §5.2, Bourbaki 1998, §III.5
  47. ^ Garibaldi 2004
  48. ^ In a non-commutative setting left-linearity (compatibility with left-multiplication by scalars) should be distinguished from right-linearity. Assuming linearity in the columns is taken to be left-linearity, one would have, for non-commuting scalars a, b:a contradiction. There is no useful notion of multi-linear functions over a non-commutative ring.
  49. ^ Varadarajan, V. S (2004), Supersymmetry for mathematicians: An introduction, American Mathematical Soc., ISBN 978-0-8218-3574-6.
  50. ^ "... we mention that the determinant, though a convenient notion theoretically, rarely finds a useful role in numerical algorithms.", see Trefethen & Bau III 1997, Lecture 1.
  51. ^ Fisikopoulos & Peñaranda 2016, §1.1, §4.3
  52. ^ Camarero, Cristóbal (2018-12-05). "Simple, Fast and Practicable Algorithms for Cholesky, LU and QR Decomposition Using Fast Rectangular Matrix Multiplication". arXiv:1812.02056 [cs.NA].
  53. ^ Bunch & Hopcroft 1974
  54. ^ Fisikopoulos & Peñaranda 2016, §1.1
  55. ^ Rote 2001
  56. ^ Fang, Xin Gui; Havas, George (1997). "On the worst-case complexity of integer Gaussian elimination" (PDF). Proceedings of the 1997 international symposium on Symbolic and algebraic computation. ISSAC '97. Kihei, Maui, Hawaii, United States: ACM. pp. 28–31. doi:10.1145/258726.258740. ISBN 0-89791-875-4. Archived from the original (PDF) on 2011-08-07. Retrieved 2011-01-22.
  57. ^ Fisikopoulos & Peñaranda 2016, §1.1, Bareiss 1968
  58. ^ Abeles, Francine F. (2008). "Dodgson condensation: The historical and mathematical development of an experimental method". Linear Algebra and Its Applications. 429 (2–3): 429–438. doi:10.1016/j.laa.2007.11.022.

References

Historical references

External links