В математике определитель — это скалярная функция элементов квадратной матрицы . Определитель матрицы A обычно обозначается det( A ) , det A или | A | . Его значение характеризует некоторые свойства матрицы и линейного отображения , представленного на заданном базисе матрицей. В частности, определитель не равен нулю тогда и только тогда, когда матрица обратима и соответствующее линейное отображение является изоморфизмом .
Определитель полностью определяется двумя следующими свойствами: определитель произведения матриц равен произведению их определителей, а определитель треугольной матрицы равен произведению ее диагональных элементов.
Определитель матрицы 2 × 2 равен
а определитель матрицы 3 × 3 равен
Определитель матрицы n × n можно определить несколькими эквивалентными способами, наиболее распространенным из которых является формула Лейбница , которая выражает определитель как сумму ( факториала n ) знаковых произведений элементов матрицы. Его можно вычислить с помощью разложения Лапласа , которое выражает определитель как линейную комбинацию определителей подматриц, или с помощью исключения Гаусса , что позволяет вычислить ступенчатую форму строки с тем же определителем , равным произведению диагональных элементов ступенчатой формы строки.
Определители также могут быть определены некоторыми их свойствами. А именно, определитель — это уникальная функция, определенная на матрицах n × n , которая имеет четыре следующих свойства:
Приведенные выше свойства, относящиеся к строкам (свойства 2–4), можно заменить соответствующими утверждениями относительно столбцов.
Определитель инвариантен относительно подобия матриц . Это означает, что при заданном линейном эндоморфизме конечномерного векторного пространства определитель матрицы, представляющей его на базисе, не зависит от выбранного базиса. Это позволяет определить определитель линейного эндоморфизма, который не зависит от выбора системы координат .
Определители встречаются во всей математике. Например, матрица часто используется для представления коэффициентов в системе линейных уравнений , и определители могут использоваться для решения этих уравнений ( правило Крамера ), хотя другие методы решения вычислительно гораздо более эффективны. Определители используются для определения характеристического многочлена квадратной матрицы, корни которой являются собственными значениями . В геометрии знаковый n -мерный объем n -мерного параллелепипеда выражается определителем, а определитель линейного эндоморфизма определяет, как ориентация и n -мерный объем преобразуются при эндоморфизме. Это используется в исчислении с внешними дифференциальными формами и определителем Якоби , в частности, для замены переменных в кратных интегралах .
Определитель матрицы 2 × 2 обозначается либо « det », либо вертикальными чертами вокруг матрицы и определяется как
Например,
Определитель имеет несколько ключевых свойств, которые можно доказать путем прямой оценки определения для -матриц, и которые продолжают выполняться для определителей больших матриц. Они следующие: [1] во-первых, определитель единичной матрицы равен 1. Во-вторых, определитель равен нулю, если две строки одинаковы:
Это справедливо и в том случае, если два столбца одинаковы. Более того,
Наконец, если какой-либо столбец умножается на некоторое число (т. е. все записи в этом столбце умножаются на это число), определитель также умножается на это число:
Если элементы матрицы являются действительными числами, матрица A может быть использована для представления двух линейных отображений : одно, которое отображает стандартные базисные векторы в строки A , и другое, которое отображает их в столбцы A. В любом случае образы базисных векторов образуют параллелограмм , который представляет собой образ единичного квадрата при отображении. Параллелограмм, определяемый строками указанной выше матрицы, имеет вершины в (0, 0) , ( a , b ) , ( a + c , b + d ) и ( c , d ) , как показано на прилагаемой диаграмме.
Абсолютное значение ad − bc является площадью параллелограмма и, таким образом, представляет собой масштабный коэффициент, с помощью которого площади преобразуются с помощью A. (Параллелограмм, образованный столбцами A, в общем случае является другим параллелограммом, но поскольку определитель симметричен относительно строк и столбцов, площадь будет той же.)
Абсолютное значение определителя вместе со знаком становится знаковой площадью параллелограмма. Знаковая площадь такая же, как и обычная площадь , за исключением того, что она отрицательна, когда угол между первым и вторым векторами, определяющими параллелограмм, поворачивается по часовой стрелке (что противоположно направлению, которое можно было бы получить для единичной матрицы ).
Чтобы показать, что ad − bc является знаковой площадью, можно рассмотреть матрицу, содержащую два вектора u ≡ ( a , b ) и v ≡ ( c , d ), представляющих стороны параллелограмма. Знаковая площадь может быть выражена как | u | | v | sin θ для угла θ между векторами, который является просто основанием, умноженным на высоту, длиной одного вектора, умноженной на перпендикулярную составляющую другого. Из-за синуса это уже знаковая площадь, однако ее можно выразить более удобно, используя косинус дополнительного угла к перпендикулярному вектору, например u ⊥ = (− b , a ) , так что | u ⊥ | | v | cos θ′ становится рассматриваемой знаковой площадью, которая может быть определена по шаблону скалярного произведения как равная ad − bc согласно следующим уравнениям:
Таким образом, определитель дает масштабный коэффициент и ориентацию, индуцированную отображением, представленным A. Когда определитель равен единице, линейное отображение, определяемое матрицей, является равноплощадным и сохраняющим ориентацию.
Объект, известный как бивектор, связан с этими идеями. В 2D его можно интерпретировать как ориентированный плоский сегмент , образованный представлением двух векторов, каждый из которых имеет начало (0, 0) и координаты ( a , b ) и ( c , d ) . Величина бивектора (обозначаемая как ( a , b ) ∧ ( c , d ) ) — это площадь со знаком , которая также является определителем ad − bc . [2]
Если действительная матрица A размером n × n записана в терминах ее векторов-столбцов , то
Это означает, что отображает единичный n -мерный куб в n -мерный параллелоэдр, определяемый векторами области
Определитель дает знаковый n -мерный объем этого параллелоэдра и, следовательно, описывает в более общем виде n -мерный коэффициент масштабирования объема линейного преобразования, произведенного A . [3] (Знак показывает, сохраняет ли преобразование или меняет ориентацию .) В частности, если определитель равен нулю, то этот параллелоэдр имеет нулевой объем и не является полностью n -мерным, что указывает на то, что размерность образа A меньше n . Это означает , что A производит линейное преобразование, которое не является ни на , ни взаимно-однозначным , и поэтому не является обратимым.
Пусть A — квадратная матрица с n строками и n столбцами, так что ее можно записать как
Записи и т. д., для многих целей, являются действительными или комплексными числами. Как обсуждается ниже, определитель также определяется для матриц, записи которых находятся в коммутативном кольце .
Определитель матрицы A обозначается как det( A ) или его можно обозначить непосредственно через элементы матрицы, написав окружающие черты вместо скобок:
Существуют различные эквивалентные способы определения определителя квадратной матрицы A , т. е. матрицы с тем же числом строк и столбцов: определитель можно определить с помощью формулы Лейбница , явной формулы, включающей суммы произведений определенных элементов матрицы. Определитель также можно охарактеризовать как уникальную функцию, зависящую от элементов матрицы, удовлетворяющих определенным свойствам. Этот подход также можно использовать для вычисления определителей путем упрощения рассматриваемых матриц.
Формула Лейбница для определителя матрицы 3 × 3 выглядит следующим образом:
В этом выражении каждый член имеет один множитель из каждой строки, все в разных столбцах, расположенных в порядке возрастания строк. Например, bdi имеет b из первой строки второго столбца, d из второй строки первого столбца и i из третьей строки третьего столбца. Знаки определяются тем, сколько транспозиций множителей необходимо для расположения множителей в порядке возрастания их столбцов (учитывая, что члены расположены слева направо в порядке возрастания строк): положительный для четного числа транспозиций и отрицательный для нечетного числа. Для примера bdi одиночная транспозиция bd в db дает dbi, три множителя которого находятся из первого, второго и третьего столбцов соответственно; это нечетное число транспозиций, поэтому член появляется со знаком минус.
Правило Сарруса является мнемоническим для расширенной формы этого определителя: сумма произведений трех диагональных линий элементов матрицы с северо-запада на юго-восток, минус сумма произведений трех диагональных линий элементов матрицы с юго-запада на северо-восток, когда копии первых двух столбцов матрицы записаны рядом с ней, как на иллюстрации. Эта схема вычисления определителя матрицы 3 × 3 не переносится в более высокие измерения.
Обобщая вышесказанное на более высокие измерения, определитель матрицы — это выражение, включающее перестановки и их сигнатуры . Перестановка множества — это биективная функция из этого множества в себя, со значениями, исчерпывающими весь набор. Множество всех таких перестановок, называемое симметрической группой , обычно обозначается как . Сигнатура перестановки — это если перестановку можно получить с четным числом транспозиций (обменов двух записей); в противном случае она
Дана матрица
формула Лейбница для ее определителя, используя сигма-обозначение для суммы, имеет вид
Используя обозначение Пи для произведения, это можно сократить до
Символ Леви-Чивиты определяется на n - кортежах целых чисел в как 0 , если два из целых чисел равны, и в противном случае как сигнатура перестановки, определяемой n- кортежом целых чисел. С символом Леви-Чивиты формула Лейбница становится
где сумма берется по всем n -кортежам целых чисел из [4] [5]
Определитель можно охарактеризовать следующими тремя ключевыми свойствами. Чтобы сформулировать их, удобно рассматривать -матрицу A как состоящую из ее столбцов, поэтому обозначаемую как
где вектор-столбец (для каждого i ) состоит из элементов матрицы в i -м столбце.
Если определитель определен с использованием формулы Лейбница, как указано выше, эти три свойства могут быть доказаны путем прямого изучения этой формулы. Некоторые авторы также подходят к определителю напрямую, используя эти три свойства: можно показать, что существует ровно одна функция, которая присваивает любой -матрице A число, удовлетворяющее этим трем свойствам. [6] Это также показывает, что этот более абстрактный подход к определителю дает то же определение, что и подход с использованием формулы Лейбница.
Чтобы увидеть это, достаточно разложить определитель по мультилинейности в столбцах в (огромную) линейную комбинацию определителей матриц, в которой каждый столбец является стандартным базисным вектором. Эти определители либо равны 0 (по свойству 9), либо ±1 (по свойствам 1 и 12 ниже), поэтому линейная комбинация дает приведенное выше выражение в терминах символа Леви-Чивиты. Хотя эта характеристика выглядит менее технической, она не может полностью заменить формулу Лейбница при определении определителя, поскольку без нее существование соответствующей функции неясно. [ необходима цитата ]
Эти правила имеют ряд дополнительных последствий:
Эти характерные свойства и их следствия, перечисленные выше, являются теоретически значимыми, но также могут быть использованы для вычисления определителей для конкретных матриц. Фактически, исключение Гаусса может быть применено для приведения любой матрицы к верхней треугольной форме, и шаги в этом алгоритме влияют на определитель контролируемым образом. Следующий конкретный пример иллюстрирует вычисление определителя матрицы с использованием этого метода:
Объединение этих равенств дает
Определитель транспонированного числа равен определителю числа A :
Это можно доказать, проверив формулу Лейбница. [7] Это подразумевает, что во всех свойствах, упомянутых выше, слово «столбец» может быть заменено на «строка» повсюду. Например, рассматривая матрицу n × n как состоящую из n строк, определитель является n -линейной функцией.
Определитель является мультипликативным отображением , т.е. для квадратных матриц одинакового размера определитель произведения матриц равен произведению их определителей:
Этот ключевой факт можно доказать, наблюдая, что для фиксированной матрицы обе стороны уравнения являются чередующимися и полилинейными как функция, зависящая от столбцов . Более того, они обе принимают значение, когда — единичная матрица. Вышеупомянутая уникальная характеристика чередующихся полилинейных отображений, таким образом, показывает это утверждение. [8]
Матрица с элементами в поле обратима точно , если ее определитель ненулевой. Это следует из мультипликативности определителя и формулы для обратной матрицы, включающей присоединенную матрицу, упомянутую ниже. В этом случае определитель обратной матрицы задается как
В частности, произведения и обратные матрицы с ненулевым определителем (соответственно, определитель один) все еще обладают этим свойством. Таким образом, множество таких матриц (фиксированного размера над полем ) образует группу, известную как общая линейная группа (соответственно, подгруппа, называемая специальной линейной группой . В более общем смысле, слово «специальная» указывает на подгруппу другой матричной группы матриц с определителем один. Примерами являются специальная ортогональная группа (которая, если n равно 2 или 3, состоит из всех матриц вращения ) и специальная унитарная группа .
Поскольку определитель уважает умножение и обратные, он фактически является групповым гомоморфизмом из в мультипликативную группу ненулевых элементов . Этот гомоморфизм сюръективен, а его ядром является (матрицы с определителем единица). Следовательно, по первой теореме об изоморфизме это показывает, что является нормальной подгруппой , и что фактор-группа изоморфна .
Формула Коши–Бине является обобщением этой формулы произведения для прямоугольных матриц. Эту формулу можно также переформулировать как мультипликативную формулу для составных матриц, элементы которой являются определителями всех квадратичных подматриц данной матрицы. [9] [10]
Разложение Лапласа выражает определитель матрицы рекурсивно через определители меньших матриц, известных как ее миноры . Минор определяется как определитель -матрицы , которая получается путем удаления -й строки и -го столбца. Выражение известно как сомножитель . Для каждого имеет место равенство
что называется разложением Лапласа по i -й строке . Например, разложение Лапласа по первой строке ( ) дает следующую формулу:
Развертывание определителей этих -матриц возвращает формулу Лейбница, упомянутую выше. Аналогично, разложение Лапласа по -му столбцу есть равенство
Разложение Лапласа можно использовать итеративно для вычисления определителей, но этот подход неэффективен для больших матриц. Однако он полезен для вычисления определителей высокосимметричных матриц, таких как матрица Вандермонда . Разложение Лапласа по n - члену вдоль строки или столбца можно обобщить , чтобы записать определитель n x n как сумму членов , каждый из которых является произведением определителя подматрицы k x k и определителя дополнительной подматрицы ( n−k ) x ( n−k ).
Сопряжённая матрица является транспонированной матрицей кофакторов, то есть,
Для каждой матрицы имеется [11]
Таким образом, присоединенную матрицу можно использовать для выражения обратной невырожденной матрицы :
Формула для определителя -матрицы выше продолжает выполняться, при соответствующих дальнейших предположениях, для блочной матрицы , т.е. матрицы, состоящей из четырех подматриц размерности , , и , соответственно. Самая простая такая формула, которая может быть доказана с использованием либо формулы Лейбница, либо факторизации с использованием дополнения Шура , это
Если обратим , то из результатов раздела о мультипликативности следует, что
что упрощается до случая, когда является -матрицей.
Аналогичный результат имеет место, когда обратим, а именно
Оба результата можно объединить для вывода теоремы Сильвестра об определителях , которая также изложена ниже.
Если блоки являются квадратными матрицами одинакового размера , то дальнейшие формулы справедливы. Например, если и коммутируют (т.е. ), то [12]
Эта формула была обобщена на матрицы, состоящие из более чем блоков, снова при соответствующих условиях коммутативности между отдельными блоками. [13]
Для и справедлива следующая формула (даже если и не коммутируют) [ необходима ссылка ]
Теорема Сильвестра об определителях гласит, что для A , матрицы размером m × n , и B , матрицы размером n × m (так что A и B имеют размеры, позволяющие умножать их в любом порядке, образуя квадратную матрицу):
где I m и I n — единичные матрицы размером m × m и n × n соответственно.
Из этого общего результата вытекает несколько следствий.
Определитель суммы двух квадратных матриц одинакового размера в общем случае не выражается через определители матриц A и B.
Однако для положительно полуопределенных матриц и одинакового размера, с учетом следствия [ 15] [16]
Из теоремы Брунна–Минковского следует, что корень n- й степени определителя является вогнутой функцией при ограничении эрмитовыми положительно-определенными матрицами. [17] Следовательно, если A и B являются эрмитовыми положительно-определенными матрицами, то имеем, поскольку корень n- й степени определителя является однородной функцией .
Для частного случая матриц с комплексными элементами определитель суммы можно записать через определители и следы в следующем тождестве:
Это можно показать, расписав каждый член по компонентам . Левая часть —
Расширение дает
Видно, что члены, квадратичные по , равны , и аналогично для , поэтому выражение можно записать
Затем мы можем записать перекрестные члены как
который может быть признан как
что завершает доказательство.
Это имеет приложение к матричным алгебрам. Например, рассмотрим комплексные числа как матричную алгебру. Комплексные числа имеют представление в виде матриц вида с и вещественными. Так как , то взятие и в приведенном выше тождестве дает
Этот результат вытекает как раз из и .
Определитель тесно связан с двумя другими центральными понятиями в линейной алгебре, собственными значениями и характеристическим многочленом матрицы. Пусть будет -матрицей с комплексными элементами. Тогда, по Основной теореме алгебры, должно иметь ровно n собственных значений . (Здесь подразумевается, что собственное значение с алгебраической кратностью μ встречается μ раз в этом списке.) Тогда оказывается, что определитель A равен произведению этих собственных значений,
Произведение всех ненулевых собственных значений называется псевдодетерминантом .
Из этого сразу видно, что определитель матрицы равен нулю тогда и только тогда, когда является собственным значением . Другими словами, обратим тогда и только тогда, когда не является собственным значением .
Характеристический многочлен определяется как [18]
Здесь — неопределенность многочлена, а — единичная матрица того же размера, что и . С помощью этого многочлена можно использовать определители для нахождения собственных значений матрицы : они являются в точности корнями этого многочлена, т. е. теми комплексными числами, что
Эрмитова матрица положительно определена , если все ее собственные значения положительны. Критерий Сильвестра утверждает, что это эквивалентно определителям подматриц
будучи положительным, для всех между и . [19]
След tr( A ) по определению является суммой диагональных элементов A и также равен сумме собственных значений. Таким образом, для комплексных матриц A ,
или, для действительных матриц A ,
Здесь exp( A ) обозначает матричную экспоненту A , поскольку каждое собственное значение λ матрицы A соответствует собственному значению exp( λ ) матрицы exp( A ). В частности, если задан любой логарифм A , то есть любая матрица L , удовлетворяющая
определитель A определяется как
Например, для n = 2 , n = 3 и n = 4 соответственно,
cf. Теорема Кэли-Гамильтона . Такие выражения выводятся из комбинаторных аргументов, тождеств Ньютона или алгоритма Фаддеева-Леверье . То есть, для общего n , det A = (−1) n c 0 знаковый постоянный член характеристического многочлена , определяемый рекурсивно из
В общем случае это также можно получить из [20]
где сумма берется по множеству всех целых чисел k l ≥ 0, удовлетворяющих уравнению
Формулу можно выразить через полный экспоненциальный полином Белла от n аргументов s l = −( l – 1)! tr( A l ) как
Эту формулу можно также использовать для нахождения определителя матрицы A I J с многомерными индексами I = ( i 1 , i 2 , ..., i r ) и J = ( j 1 , j 2 , ..., j r ) . Произведение и след таких матриц определяются естественным образом как
Важное произвольное тождество размерности n может быть получено из разложения логарифма в ряд Меркатора , когда разложение сходится. Если каждое собственное значение A меньше 1 по абсолютной величине,
где I — единичная матрица. В более общем случае, если
разлагается в формальный степенной ряд по s, то все коэффициенты s m при m > n равны нулю, а оставшийся многочлен равен det( I + sA ) .
Для положительно определенной матрицы A оператор трассировки дает следующие точные нижние и верхние границы определителя логарифма:
с равенством тогда и только тогда, когда A = I. Это соотношение можно вывести с помощью формулы для расхождения Кульбака-Лейблера между двумя многомерными нормальными распределениями.
Также,
Эти неравенства можно доказать, выразив следы и определитель через собственные значения. Таким образом, они представляют собой хорошо известный факт, что среднее гармоническое меньше среднего геометрического , которое меньше среднего арифметического , которое, в свою очередь, меньше среднего квадратичного .
Формула Лейбница показывает, что определитель действительных (или аналогично для комплексных) квадратных матриц является полиномиальной функцией от до . В частности, она всюду дифференцируема . Ее производная может быть выражена с помощью формулы Якоби : [21]
где обозначает сопряжение . В частности, если обратимо, то имеем
Выраженные в терминах записей , они являются
Еще одна эквивалентная формулировка:
с использованием большой нотации O. Особый случай, когда , единичная матрица, дает
Это тождество используется при описании алгебр Ли, связанных с определенными матричными группами Ли . Например, специальная линейная группа определяется уравнением . Приведенная выше формула показывает, что ее алгебра Ли является специальной линейной алгеброй Ли, состоящей из тех матриц, след которых равен нулю.
Записав -матрицу как , где - векторы-столбцы длины 3, тогда градиент по одному из трех векторов можно записать как векторное произведение двух других:
Исторически определители использовались задолго до матриц: Определитель изначально определялся как свойство системы линейных уравнений . Определитель «определяет», имеет ли система единственное решение (что происходит именно тогда, когда определитель не равен нулю). В этом смысле определители впервые были использованы в китайском учебнике математики «Девять глав математического искусства» (九章算術, китайские ученые, около 3-го века до н. э.). В Европе решения линейных систем из двух уравнений были выражены Кардано в 1545 году с помощью сущности, похожей на определитель. [22]
Собственно определители возникли отдельно из работы Секи Такакадзу в 1683 году в Японии и параллельно Лейбница в 1693 году. [23] [24] [25] [26] Крамер (1750) сформулировал правило Крамера без доказательства. [27] И Крамер, и Безу (1779) пришли к определителям из вопроса о плоских кривых, проходящих через заданный набор точек. [28]
Вандермонд (1771) первым признал определители как независимые функции. [24] Лаплас (1772) дал общий метод разложения определителя по его дополнительным минорам : Вандермонд уже привел частный случай. [29] Сразу же после этого Лагранж (1773) рассмотрел определители второго и третьего порядка и применил их к вопросам теории исключения ; он доказал много частных случаев общих тождеств.
Гаусс (1801) сделал следующий шаг. Подобно Лагранжу, он широко использовал детерминанты в теории чисел . Он ввел слово «детерминант» (Лаплас использовал слово «результант»), хотя и не в настоящем значении, а скорее в применении к дискриминанту квантической функции . [30] Гаусс также пришел к понятию обратных (обратных) детерминантов и очень близко подошел к теореме умножения. [ необходимо разъяснение ]
Следующим по значимости был Бине (1811, 1812), который формально сформулировал теорему, касающуюся произведения двух матриц из m столбцов и n строк, которая для частного случая m = n сводится к теореме умножения. В тот же день (30 ноября 1812 г.), когда Бине представил свою работу в Академии, Коши также представил свою работу по этой теме. (См. формулу Коши–Бине .) В ней он использовал слово «детерминант» в его нынешнем смысле, [31] [32] обобщил и упростил то, что тогда было известно по этой теме, улучшил обозначения и дал теорему умножения с доказательством, более удовлетворительным, чем у Бине. [24] [33] С него начинается теория в ее общности.
Якоби (1841) использовал функциональный определитель, который Сильвестр позже назвал якобианом . [ 34] В своих мемуарах в журнале Крелля за 1841 год он специально рассматривает эту тему, а также класс знакопеременных функций, которые Сильвестр назвал альтернантами . Примерно во время последних мемуаров Якоби Сильвестр (1839) и Кейли начали свою работу. Кейли в 1841 году ввел современную нотацию для определителя с использованием вертикальных черт. [35] [36]
Изучение специальных форм определителей стало естественным результатом завершения общей теории. Осесимметричные определители изучались Лебегом , Гессе и Сильвестром; персимметричные определители — Сильвестром и Ганкелем ; циркулянты — Каталаном , Споттисвудом , Глейшером и Скоттом; косые определители и пфаффианы в связи с теорией ортогональных преобразований — Кэли; континуанты — Сильвестром; вронскианы (так называемые Мюиром ) — Кристоффелем и Фробениусом ; составные определители — Сильвестром, Рейссом и Пике; якобианы и гессианы — Сильвестром; и симметричные гош-определители — Труди . Из учебников по этому предмету учебник Споттисвуда был первым. В Америке трактаты опубликовали Ганус (1886), Уэлд (1893) и Мьюир/Мецлер (1933).
Определители могут быть использованы для описания решений линейной системы уравнений , записанной в матричной форме как . Это уравнение имеет единственное решение тогда и только тогда, когда не равно нулю. В этом случае решение дается правилом Крамера :
где - матрица, образованная заменой -го столбца на вектор-столбец . Это следует непосредственно из столбцового разложения определителя, т.е.
где векторы являются столбцами матрицы A. Правило также подразумевается тождеством
Правило Крамера может быть реализовано со временем, что сопоставимо с более распространенными методами решения систем линейных уравнений, такими как LU , QR или сингулярное разложение . [37]
Определители могут быть использованы для характеристики линейно зависимых векторов: равен нулю тогда и только тогда, когда векторы-столбцы (или, что эквивалентно, векторы-строки) матрицы линейно зависимы. [38] Например, если заданы два линейно независимых вектора , третий вектор лежит в плоскости, охватываемой первыми двумя векторами, точно тогда, когда определитель -матрицы, состоящей из трех векторов, равен нулю. Та же идея используется и в теории дифференциальных уравнений : заданы функции (предполагается, что они дифференцируемы по времени ), вронскиан определяется как
Он не равен нулю (для некоторых ) в указанном интервале тогда и только тогда, когда заданные функции и все их производные вплоть до порядка линейно независимы. Если можно показать, что вронскиан равен нулю всюду на интервале, то в случае аналитических функций это означает, что заданные функции линейно зависимы. См. Вронскиан и линейная независимость . Другое такое использование определителя — результант , который дает критерий, когда два многочлена имеют общий корень . [39]
Определитель можно рассматривать как присвоение числа каждой последовательности из n векторов в R n , используя квадратную матрицу, столбцы которой являются заданными векторами. Определитель будет ненулевым тогда и только тогда, когда последовательность векторов является базисом для R n . В этом случае знак определителя определяет, согласуется ли ориентация базиса с ориентацией стандартного базиса или противоположна ей . В случае ортогонального базиса величина определителя равна произведению длин базисных векторов. Например, ортогональная матрица с элементами в R n представляет собой ортонормированный базис в евклидовом пространстве и, следовательно, имеет определитель ±1 (так как все векторы имеют длину 1). Определитель равен +1 тогда и только тогда, когда базис имеет ту же ориентацию. Он равен −1 тогда и только тогда, когда базис имеет противоположную ориентацию.
В более общем случае, если определитель A положителен, то A представляет собой сохраняющее ориентацию линейное преобразование (если A — ортогональная матрица 2 × 2 или 3 × 3 , то это поворот ), а если он отрицателен, то A меняет ориентацию базиса.
Как указано выше, абсолютное значение определителя действительных векторов равно объему параллелепипеда, охватываемого этими векторами. Как следствие, если — линейная карта, заданная умножением на матрицу , и — любое измеримое подмножество , то объем задается умножением на объем . [40] В более общем случае, если линейная карта представлена -матрицей , то -мерный объем задается как:
Вычислив объем тетраэдра, ограниченного четырьмя точками, их можно использовать для определения скрещивающихся линий . Объем любого тетраэдра, учитывая его вершины , или любую другую комбинацию пар вершин, которые образуют остовное дерево над вершинами.
Для общей дифференцируемой функции многое из вышесказанного переносится при рассмотрении матрицы Якоби функции f . Для
Матрица Якоби — это матрица n × n , элементы которой задаются частными производными
Его определитель, определитель Якоби , появляется в многомерной версии интегрирования путем подстановки : для подходящих функций f и открытого подмножества U R n (области определения f ) интеграл по f ( U ) некоторой другой функции φ : R n → R m определяется как
Якобиан также встречается в теореме об обратной функции .
Применительно к области картографии определитель можно использовать для измерения скорости расширения карты вблизи полюсов. [41]
Вышеуказанные тождества, касающиеся определителя произведений и обратных матриц, подразумевают, что подобные матрицы имеют одинаковый определитель: две матрицы A и B подобны, если существует обратимая матрица X такая, что A = X −1 BX . Действительно, многократное применение приведенных выше тождеств дает
Определитель поэтому также называется инвариантом подобия . Определитель линейного преобразования
для некоторого конечномерного векторного пространства V определяется как определитель описывающей его матрицы относительно произвольного выбора базиса в V. В силу инвариантности подобия этот определитель не зависит от выбора базиса для V и, следовательно , зависит только от эндоморфизма T.
Вышеприведенное определение определителя с использованием правила Лейбница работает более общо, когда элементы матрицы являются элементами коммутативного кольца , например, целыми числами , в отличие от поля действительных или комплексных чисел. Более того, характеристика определителя как уникального чередующегося полилинейного отображения, которое удовлетворяет , все еще сохраняется, как и все свойства, вытекающие из этой характеристики. [42]
Матрица обратима (в том смысле, что существует обратная матрица, элементы которой находятся в ) тогда и только тогда, когда ее определитель является обратимым элементом в . [43] Для это означает, что определитель равен +1 или −1. Такая матрица называется унимодулярной .
Определитель является мультипликативным, он определяет гомоморфизм групп
между общей линейной группой (группой обратимых -матриц с элементами в ) и мультипликативной группой единиц в . Поскольку оно уважает умножение в обеих группах, это отображение является групповым гомоморфизмом .
При наличии гомоморфизма колец существует отображение, заданное заменой всех записей в их образами при . Определитель соблюдает эти отображения, т.е. тождество
выполняется. Другими словами, отображаемая коммутативная диаграмма коммутирует.
Например, определитель комплексно сопряженной комплексной матрицы (который также является определителем ее сопряженного транспонирования) является комплексно сопряженным ее определителем, а для целочисленных матриц: модуль приведения определителя такой матрицы равен определителю матрицы, приведенной по модулю (последний определитель вычисляется с использованием модульной арифметики ). На языке теории категорий определитель является естественным преобразованием между двумя функторами и . [44] Добавляя еще один уровень абстракции, это фиксируется, говоря, что определитель является морфизмом алгебраических групп , из общей линейной группы в мультипликативную группу ,
The determinant of a linear transformation of an -dimensional vector space or, more generally a free module of (finite) rank over a commutative ring can be formulated in a coordinate-free manner by considering the -th exterior power of .[45] The map induces a linear map
As is one-dimensional, the map is given by multiplying with some scalar, i.e., an element in . Some authors such as (Bourbaki 1998) use this fact to define the determinant to be the element in satisfying the following identity (for all ):
This definition agrees with the more concrete coordinate-dependent definition. This can be shown using the uniqueness of a multilinear alternating form on -tuples of vectors in . For this reason, the highest non-zero exterior power (as opposed to the determinant associated to an endomorphism) is sometimes also called the determinant of and similarly for more involved objects such as vector bundles or chain complexes of vector spaces. Minors of a matrix can also be cast in this setting, by considering lower alternating forms with .[46]
Determinants as treated above admit several variants: the permanent of a matrix is defined as the determinant, except that the factors occurring in Leibniz's rule are omitted. The immanant generalizes both by introducing a character of the symmetric group in Leibniz's rule.
For any associative algebra that is finite-dimensional as a vector space over a field , there is a determinant map[47]
This definition proceeds by establishing the characteristic polynomial independently of the determinant, and defining the determinant as the lowest order term of this polynomial. This general definition recovers the determinant for the matrix algebra , but also includes several further cases including the determinant of a quaternion,
the norm of a field extension, as well as the Pfaffian of a skew-symmetric matrix and the reduced norm of a central simple algebra, also arise as special cases of this construction.
For matrices with an infinite number of rows and columns, the above definitions of the determinant do not carry over directly. For example, in the Leibniz formula, an infinite sum (all of whose terms are infinite products) would have to be calculated. Functional analysis provides different extensions of the determinant for such infinite-dimensional situations, which however only work for particular kinds of operators.
The Fredholm determinant defines the determinant for operators known as trace class operators by an appropriate generalization of the formula
Another infinite-dimensional notion of determinant is the functional determinant.
For operators in a finite factor, one may define a positive real-valued determinant called the Fuglede−Kadison determinant using the canonical trace. In fact, corresponding to every tracial state on a von Neumann algebra there is a notion of Fuglede−Kadison determinant.
For matrices over non-commutative rings, multilinearity and alternating properties are incompatible for n ≥ 2,[48] so there is no good definition of the determinant in this setting.
For square matrices with entries in a non-commutative ring, there are various difficulties in defining determinants analogously to that for commutative rings. A meaning can be given to the Leibniz formula provided that the order for the product is specified, and similarly for other definitions of the determinant, but non-commutativity then leads to the loss of many fundamental properties of the determinant, such as the multiplicative property or that the determinant is unchanged under transposition of the matrix. Over non-commutative rings, there is no reasonable notion of a multilinear form (existence of a nonzero bilinear form[clarify] with a regular element of R as value on some pair of arguments implies that R is commutative). Nevertheless, various notions of non-commutative determinant have been formulated that preserve some of the properties of determinants, notably quasideterminants and the Dieudonné determinant. For some classes of matrices with non-commutative elements, one can define the determinant and prove linear algebra theorems that are very similar to their commutative analogs. Examples include the q-determinant on quantum groups, the Capelli determinant on Capelli matrices, and the Berezinian on supermatrices (i.e., matrices whose entries are elements of -graded rings).[49] Manin matrices form the class closest to matrices with commutative elements.
Determinants are mainly used as a theoretical tool. They are rarely calculated explicitly in numerical linear algebra, where for applications such as checking invertibility and finding eigenvalues the determinant has largely been supplanted by other techniques.[50] Computational geometry, however, does frequently use calculations related to determinants.[51]
While the determinant can be computed directly using the Leibniz rule this approach is extremely inefficient for large matrices, since that formula requires calculating ( factorial) products for an -matrix. Thus, the number of required operations grows very quickly: it is of order . The Laplace expansion is similarly inefficient. Therefore, more involved techniques have been developed for calculating determinants.
Gaussian elimination consists of left multiplying a matrix by elementary matrices for getting a matrix in a row echelon form. One can restrict the computation to elementary matrices of determinant 1. In this case, the determinant of the resulting row echelon form equals the determinant of the initial matrix. As a row echelon form is a triangular matrix, its determinant is the product of the entries of its diagonal.
So, the determinant can be computed for almost free from the result of a Gaussian elemination.
Some methods compute by writing the matrix as a product of matrices whose determinants can be more easily computed. Such techniques are referred to as decomposition methods. Examples include the LU decomposition, the QR decomposition or the Cholesky decomposition (for positive definite matrices). These methods are of order , which is a significant improvement over .[52]
For example, LU decomposition expresses as a product
of a permutation matrix (which has exactly a single in each column, and otherwise zeros), a lower triangular matrix and an upper triangular matrix . The determinants of the two triangular matrices and can be quickly calculated, since they are the products of the respective diagonal entries. The determinant of is just the sign of the corresponding permutation (which is for an even number of permutations and is for an odd number of permutations). Once such a LU decomposition is known for , its determinant is readily computed as
The order reached by decomposition methods has been improved by different methods. If two matrices of order can be multiplied in time , where for some , then there is an algorithm computing the determinant in time .[53] This means, for example, that an algorithm for computing the determinant exists based on the Coppersmith–Winograd algorithm. This exponent has been further lowered, as of 2016, to 2.373.[54]
In addition to the complexity of the algorithm, further criteria can be used to compare algorithms. Especially for applications concerning matrices over rings, algorithms that compute the determinant without any divisions exist. (By contrast, Gauss elimination requires divisions.) One such algorithm, having complexity is based on the following idea: one replaces permutations (as in the Leibniz rule) by so-called closed ordered walks, in which several items can be repeated. The resulting sum has more terms than in the Leibniz rule, but in the process several of these products can be reused, making it more efficient than naively computing with the Leibniz rule.[55] Algorithms can also be assessed according to their bit complexity, i.e., how many bits of accuracy are needed to store intermediate values occurring in the computation. For example, the Gaussian elimination (or LU decomposition) method is of order , but the bit length of intermediate values can become exponentially long.[56] By comparison, the Bareiss Algorithm, is an exact-division method (so it does use division, but only in cases where these divisions can be performed without remainder) is of the same order, but the bit complexity is roughly the bit size of the original entries in the matrix times .[57]
If the determinant of A and the inverse of A have already been computed, the matrix determinant lemma allows rapid calculation of the determinant of A + uvT, where u and v are column vectors.
Charles Dodgson (i.e. Lewis Carroll of Alice's Adventures in Wonderland fame) invented a method for computing determinants called Dodgson condensation. Unfortunately this interesting method does not always work in its original form.[58]
{{citation}}
: CS1 maint: multiple names: authors list (link)