stringtranslate.com

Определитель

В математике определитель это скалярная функция элементов квадратной матрицы . Определитель матрицы A обычно обозначается det( A ) , det A или | A | . Его значение характеризует некоторые свойства матрицы и линейного отображения , представленного на заданном базисе матрицей. В частности, определитель не равен нулю тогда и только тогда, когда матрица обратима , а соответствующее линейное отображение является изоморфизмом .

Определитель полностью определяется двумя следующими свойствами: определитель произведения матриц равен произведению их определителей, а определитель треугольной матрицы равен произведению ее диагональных элементов.

Определитель матрицы 2 × 2 равен

а определитель матрицы 3 × 3 равен

Определитель матрицы n × n можно определить несколькими эквивалентными способами, наиболее распространенным из которых является формула Лейбница , которая выражает определитель как сумму ( факториала n ) знаковых произведений элементов матрицы. Его можно вычислить с помощью разложения Лапласа , которое выражает определитель как линейную комбинацию определителей подматриц, или с помощью исключения Гаусса , что позволяет вычислить ступенчатую форму строки с тем же определителем , равным произведению диагональных элементов ступенчатой ​​формы строки.

Определители также могут быть определены некоторыми их свойствами. А именно, определитель — это уникальная функция, определенная на матрицах n × n , которая имеет четыре следующих свойства:

  1. Определитель единичной матрицы равен 1 .
  2. Перестановка двух строк умножает определитель на −1 .
  3. Умножение строки на число умножает определитель на это число.
  4. Добавление кратного одной строки к другой строке не меняет определитель.

Приведенные выше свойства, относящиеся к строкам (свойства 2–4), можно заменить соответствующими утверждениями относительно столбцов.

Определитель инвариантен относительно подобия матриц . Это означает, что при заданном линейном эндоморфизме конечномерного векторного пространства определитель матрицы, представляющей его на базисе, не зависит от выбранного базиса. Это позволяет определить определитель линейного эндоморфизма, который не зависит от выбора системы координат .

Определители встречаются во всей математике. Например, матрица часто используется для представления коэффициентов в системе линейных уравнений , и определители могут быть использованы для решения этих уравнений ( правило Крамера ), хотя другие методы решения вычислительно гораздо более эффективны. Определители используются для определения характеристического многочлена квадратной матрицы, корни которой являются собственными значениями . В геометрии знаковый n -мерный объем n -мерного параллелепипеда выражается определителем, а определитель линейного эндоморфизма определяет, как ориентация и n -мерный объем преобразуются при эндоморфизме. Это используется в исчислении с внешними дифференциальными формами и определителем Якоби , в частности, для замены переменных в кратных интегралах .

Матрицы два на два

Определитель матрицы 2 × 2 обозначается либо « det », либо вертикальными чертами вокруг матрицы и определяется как

Например,

Первые свойства

Определитель имеет несколько ключевых свойств, которые можно доказать путем прямой оценки определения для -матриц, и которые продолжают выполняться для определителей больших матриц. Они следующие: [1] во-первых, определитель единичной матрицы равен 1. Во-вторых, определитель равен нулю, если две строки одинаковы:

Это справедливо и в том случае, если два столбца одинаковы. Более того,

Наконец, если какой-либо столбец умножается на некоторое число (т. е. все записи в этом столбце умножаются на это число), определитель также умножается на это число:

Геометрическое значение

Площадь параллелограмма — это абсолютное значение определителя матрицы, образованной векторами, представляющими стороны параллелограмма.

Если элементы матрицы являются действительными числами, матрица A может быть использована для представления двух линейных отображений : одно, которое отображает стандартные базисные векторы в строки A , и другое, которое отображает их в столбцы A. В любом случае образы базисных векторов образуют параллелограмм , который представляет собой образ единичного квадрата при отображении. Параллелограмм, определяемый строками указанной выше матрицы, имеет вершины в (0, 0) , ( a , b ) , ( a + c , b + d ) и ( c , d ) , как показано на прилагаемой диаграмме.

Абсолютное значение adbc является площадью параллелограмма и, таким образом, представляет собой масштабный коэффициент, с помощью которого площади преобразуются с помощью A. (Параллелограмм, образованный столбцами A, в общем случае является другим параллелограммом, но поскольку определитель симметричен относительно строк и столбцов, площадь будет той же.)

Абсолютное значение определителя вместе со знаком становится знаковой площадью параллелограмма. Знаковая площадь такая же, как и обычная площадь , за исключением того, что она отрицательна, когда угол между первым и вторым векторами, определяющими параллелограмм, поворачивается по часовой стрелке (что противоположно направлению, которое можно было бы получить для единичной матрицы ).

Чтобы показать, что adbc является знаковой площадью, можно рассмотреть матрицу, содержащую два вектора u ≡ ( a , b ) и v ≡ ( c , d ), представляющих стороны параллелограмма. Знаковая площадь может быть выражена как | u | | v | sin θ для угла θ между векторами, который является просто основанием, умноженным на высоту, длиной одного вектора, умноженной на перпендикулярную составляющую другого. Из-за синуса это уже знаковая площадь, однако ее можно выразить более удобно, используя косинус дополнительного угла к перпендикулярному вектору, например u = (− b , a ) , так что | u | | v | cos θ′ становится рассматриваемой знаковой площадью, которая может быть определена по шаблону скалярного произведения как равная adbc согласно следующим уравнениям:

Объем этого параллелепипеда равен абсолютному значению определителя матрицы, образованной столбцами, построенными из векторов r1, r2 и r3.

Таким образом, определитель дает масштабный коэффициент и ориентацию, индуцированную отображением, представленным A. Когда определитель равен единице, линейное отображение, определяемое матрицей, является равноплощадным и сохраняющим ориентацию.

Объект, известный как бивектор, связан с этими идеями. В 2D его можно интерпретировать как ориентированный плоский сегмент , образованный представлением двух векторов, каждый из которых имеет начало (0, 0) и координаты ( a , b ) и ( c , d ) . Величина бивектора (обозначаемая как ( a , b ) ∧ ( c , d ) ) — это площадь со знаком , которая также является определителем adbc . [2]

Если действительная матрица A размером n × n записана в терминах ее векторов-столбцов , то

Это означает, что отображает единичный n -мерный куб в n -мерный параллелоэдр, определяемый векторами области

Определитель дает знаковый n -мерный объем этого параллелоэдра и, следовательно, описывает в более общем виде n -мерный коэффициент масштабирования объема линейного преобразования, произведенного A . [3] (Знак показывает, сохраняет ли преобразование или меняет ориентацию .) В частности, если определитель равен нулю, то этот параллелоэдр имеет нулевой объем и не является полностью n -мерным, что указывает на то, что размерность образа A меньше n . Это означает , что A производит линейное преобразование, которое не является ни на , ни взаимно-однозначным , и поэтому не является обратимым.

Определение

Пусть Aквадратная матрица с n строками и n столбцами, так что ее можно записать как

Записи и т. д., для многих целей, являются действительными или комплексными числами. Как обсуждается ниже, определитель также определяется для матриц, записи которых находятся в коммутативном кольце .

Определитель матрицы A обозначается как det( A ) или его можно обозначить непосредственно через элементы матрицы, написав окружающие черты вместо скобок:

Существуют различные эквивалентные способы определения определителя квадратной матрицы A , т. е. матрицы с тем же числом строк и столбцов: определитель можно определить с помощью формулы Лейбница , явной формулы, включающей суммы произведений определенных элементов матрицы. Определитель также можно охарактеризовать как уникальную функцию, зависящую от элементов матрицы, удовлетворяющих определенным свойствам. Этот подход также можно использовать для вычисления определителей путем упрощения рассматриваемых матриц.

формула Лейбница

Матрицы 3 × 3

Формула Лейбница для определителя матрицы 3 × 3 выглядит следующим образом:

В этом выражении каждый член имеет один множитель из каждой строки, все в разных столбцах, расположенных в порядке возрастания строк. Например, bdi имеет b из первой строки второго столбца, d из второй строки первого столбца и i из третьей строки третьего столбца. Знаки определяются тем, сколько транспозиций множителей необходимо для расположения множителей в порядке возрастания их столбцов (учитывая, что члены расположены слева направо в порядке возрастания строк): положительный для четного числа транспозиций и отрицательный для нечетного числа. Для примера bdi одиночная транспозиция bd в db дает dbi, три множителя которого находятся из первого, второго и третьего столбцов соответственно; это нечетное число транспозиций, поэтому член появляется со знаком минус.

Правило Сарруса

Правило Сарруса является мнемоническим для расширенной формы этого определителя: сумма произведений трех диагональных линий элементов матрицы с северо-запада на юго-восток, минус сумма произведений трех диагональных линий элементов матрицы с юго-запада на северо-восток, когда копии первых двух столбцов матрицы записаны рядом с ней, как на иллюстрации. Эта схема вычисления определителя матрицы 3 × 3 не переносится в более высокие измерения.

н×нматрицы

Обобщая вышесказанное на более высокие измерения, определитель матрицы — это выражение, включающее перестановки и их сигнатуры . Перестановка множества — это биективная функция из этого множества в себя, со значениями, исчерпывающими весь набор. Множество всех таких перестановок, называемое симметрической группой , обычно обозначается как . Сигнатура перестановки — это если перестановку можно получить с четным числом транспозиций (обменов двух записей); в противном случае она

Дана матрица

формула Лейбница для ее определителя, используя сигма-обозначение для суммы, имеет вид

Используя обозначение Пи для произведения, это можно сократить до

.

Символ Леви-Чивиты определяется на n - кортежах целых чисел в как 0 , если два из целых чисел равны, и в противном случае как сигнатура перестановки, определяемой n- кортежом целых чисел. С символом Леви-Чивиты формула Лейбница становится

где сумма берется по всем n -кортежам целых чисел из [4] [5]

Характеристики

Характеристика определителя

Определитель можно охарактеризовать следующими тремя ключевыми свойствами. Чтобы сформулировать их, удобно рассматривать -матрицу A как состоящую из ее столбцов, поэтому обозначаемую как

где вектор-столбец (для каждого i ) состоит из элементов матрицы в i -м столбце.

  1. , где — единичная матрица .
  2. Определитель является полилинейным : если j -й столбец матрицы записан в виде линейной комбинации двух векторов-столбцов v и w и числа r , то определитель A можно выразить в виде аналогичной линейной комбинации:
  3. Определитель является знакопеременным : если два столбца матрицы идентичны, то ее определитель равен 0:

Если определитель определен с использованием формулы Лейбница, как указано выше, эти три свойства могут быть доказаны путем прямого изучения этой формулы. Некоторые авторы также подходят к определителю напрямую, используя эти три свойства: можно показать, что существует ровно одна функция, которая назначает любой -матрице A число, удовлетворяющее этим трем свойствам. [6] Это также показывает, что этот более абстрактный подход к определителю дает то же определение, что и подход с использованием формулы Лейбница.

Чтобы увидеть это, достаточно разложить определитель по мультилинейности в столбцах в (огромную) линейную комбинацию определителей матриц, в которой каждый столбец является стандартным базисным вектором. Эти определители либо равны 0 (по свойству 9), либо ±1 (по свойствам 1 и 12 ниже), поэтому линейная комбинация дает приведенное выше выражение в терминах символа Леви-Чивиты. Хотя эта характеристика выглядит менее технической, она не может полностью заменить формулу Лейбница при определении определителя, поскольку без нее существование соответствующей функции неясно. [ необходима цитата ]

Немедленные последствия

Эти правила имеют ряд дополнительных последствий:

Пример

Эти характерные свойства и их следствия, перечисленные выше, являются теоретически значимыми, но также могут быть использованы для вычисления определителей для конкретных матриц. Фактически, исключение Гаусса может быть применено для приведения любой матрицы к верхней треугольной форме, и шаги в этом алгоритме влияют на определитель контролируемым образом. Следующий конкретный пример иллюстрирует вычисление определителя матрицы с использованием этого метода:

Объединение этих равенств дает

Транспонировать

Определитель транспонированного числа равен определителю числа A :

.

Это можно доказать, проверив формулу Лейбница. [7] Это подразумевает, что во всех свойствах, упомянутых выше, слово «столбец» может быть заменено на «строка» повсюду. Например, рассматривая матрицу n × n как состоящую из n строк, определитель является n -линейной функцией.

Мультипликативность и матричные группы

Определитель является мультипликативным отображением , т.е. для квадратных матриц одинакового размера определитель произведения матриц равен произведению их определителей:

Этот ключевой факт можно доказать, наблюдая, что для фиксированной матрицы обе стороны уравнения являются чередующимися и полилинейными как функция, зависящая от столбцов . Более того, они обе принимают значение, когда — единичная матрица. Вышеупомянутая уникальная характеристика чередующихся полилинейных отображений, таким образом, показывает это утверждение. [8]

Матрица с элементами в поле обратима точно , если ее определитель ненулевой. Это следует из мультипликативности определителя и формулы для обратной матрицы, включающей присоединенную матрицу, упомянутую ниже. В этом случае определитель обратной матрицы задается как

.

В частности, произведения и обратные матрицы с ненулевым определителем (соответственно, определитель один) все еще обладают этим свойством. Таким образом, множество таких матриц (фиксированного размера над полем ) образует группу, известную как общая линейная группа (соответственно, подгруппа, называемая специальной линейной группой . В более общем смысле, слово «специальная» указывает на подгруппу другой матричной группы матриц с определителем один. Примерами являются специальная ортогональная группа (которая, если n равно 2 или 3, состоит из всех матриц вращения ) и специальная унитарная группа .

Поскольку определитель уважает умножение и обратные, он фактически является групповым гомоморфизмом из в мультипликативную группу ненулевых элементов . Этот гомоморфизм сюръективен, а его ядром является (матрицы с определителем единица). Следовательно, по первой теореме об изоморфизме это показывает, что является нормальной подгруппой , и что фактор-группа изоморфна .

Формула Коши–Бине является обобщением этой формулы произведения для прямоугольных матриц. Эту формулу можно также переформулировать как мультипликативную формулу для составных матриц, элементы которой являются определителями всех квадратичных подматриц данной матрицы. [9] [10]

расширение Лапласа

Разложение Лапласа выражает определитель матрицы рекурсивно через определители меньших матриц, известных как ее миноры . Минор определяется как определитель -матрицы , которая получается путем удаления -й строки и -го столбца. Выражение известно как сомножитель . Для каждого имеет место равенство

что называется разложением Лапласа по i -й строке . Например, разложение Лапласа по первой строке ( ) дает следующую формулу:

Развертывание определителей этих -матриц возвращает формулу Лейбница, упомянутую выше. Аналогично, разложение Лапласа по -му столбцу есть равенство

Разложение Лапласа можно использовать итеративно для вычисления определителей, но этот подход неэффективен для больших матриц. Однако он полезен для вычисления определителей высокосимметричных матриц, таких как матрица Вандермонда . Разложение Лапласа по n - члену вдоль строки или столбца можно обобщить , чтобы записать определитель n x n как сумму членов , каждый из которых является произведением определителя подматрицы k x k и определителя дополнительной подматрицы ( n−k ) x ( n−k ).

Сопрягаемая матрица

Сопряжённая матрица является транспонированной матрицей кофакторов, то есть,

Для каждой матрицы имеется [11]

Таким образом, присоединенную матрицу можно использовать для выражения обратной невырожденной матрицы :

Блочные матрицы

Формула для определителя -матрицы выше продолжает выполняться, при соответствующих дальнейших предположениях, для блочной матрицы , т.е. матрицы, состоящей из четырех подматриц размерности , , и , соответственно. Самая простая такая формула, которая может быть доказана с использованием либо формулы Лейбница, либо факторизации с использованием дополнения Шура , имеет вид

Если обратим , то из результатов раздела о мультипликативности следует, что

что упрощается до случая, когда является -матрицей.

Аналогичный результат имеет место, когда обратим, а именно

Оба результата можно объединить для вывода теоремы Сильвестра об определителях , которая также изложена ниже.

Если блоки являются квадратными матрицами одинакового размера , то дальнейшие формулы справедливы. Например, если и коммутируют (т.е. ), то [12]

Эта формула была обобщена на матрицы, состоящие из более чем блоков, снова при соблюдении соответствующих условий коммутативности между отдельными блоками. [13]

Для и справедлива следующая формула (даже если и не коммутируют) [ необходима цитата ]

Теорема Сильвестра об определителе

Теорема Сильвестра об определителях гласит, что для A , матрицы размером m × n , и B , матрицы размером n × m (так что A и B имеют размеры, позволяющие умножать их в любом порядке, образуя квадратную матрицу):

где I m и I n — единичные матрицы размером m × m и n × n соответственно.

Из этого общего результата вытекает несколько следствий.

  1. Для случая вектора-столбца c и вектора-строки r , каждый из которых имеет m компонентов, формула позволяет быстро вычислить определитель матрицы, которая отличается от единичной матрицы на матрицу ранга 1:
  2. В более общем смысле, [14] для любой обратимой матрицы X размером m × m ,
  3. Для вектора столбца и строки, как указано выше:
  4. Для квадратных матриц и одинакового размера матрицы и имеют одинаковые характеристические многочлены (следовательно, одинаковые собственные значения).

Сумма

Определитель суммы двух квадратных матриц одинакового размера в общем случае не выражается через определители матриц A и B.

Однако для положительно полуопределенных матриц и одинакового размера, с учетом следствия [ 15] [16]

Из теоремы Брунна–Минковского следует, что корень n- й степени определителя является вогнутой функцией при ограничении эрмитовыми положительно-определенными матрицами. [17] Следовательно, если A и B являются эрмитовыми положительно-определенными матрицами, то имеем, поскольку корень n- й степени определителя является однородной функцией .

Сумма тождеств для матриц 2×2

Для частного случая матриц с комплексными элементами определитель суммы можно записать через определители и следы в следующем тождестве:

Подтверждение личности

Это можно показать, расписав каждый член по компонентам . Левая часть —

Расширение дает

Видно, что члены, квадратичные по , равны , и аналогично для , поэтому выражение можно записать

Затем мы можем записать перекрестные члены как

который может быть признан как

что завершает доказательство.

Это имеет приложение к матричным алгебрам. Например, рассмотрим комплексные числа как матричную алгебру. Комплексные числа имеют представление в виде матриц вида с и вещественными. Так как , то взятие и в приведенном выше тождестве дает

Этот результат вытекает как раз из и .

Свойства определителя по отношению к другим понятиям

Собственные значения и характеристический полином

Определитель тесно связан с двумя другими центральными понятиями линейной алгебры, собственными значениями и характеристическим многочленом матрицы. Пусть будет -матрицей с комплексными элементами. Тогда, по Основной теореме алгебры, должно иметь ровно n собственных значений . (Здесь подразумевается, что собственное значение с алгебраической кратностью μ встречается μ раз в этом списке.) Тогда оказывается, что определитель A равен произведению этих собственных значений,

Произведение всех ненулевых собственных значений называется псевдодетерминантом .

Из этого сразу видно, что определитель матрицы равен нулю тогда и только тогда, когда является собственным значением . Другими словами, обратим тогда и только тогда, когда не является собственным значением .

Характеристический многочлен определяется как [18]

Здесь — неопределенность многочлена, а — единичная матрица того же размера, что и . С помощью этого многочлена можно использовать определители для нахождения собственных значений матрицы : они являются в точности корнями этого многочлена, т. е. теми комплексными числами, что

Эрмитова матрица положительно определена , если все ее собственные значения положительны. Критерий Сильвестра утверждает, что это эквивалентно определителям подматриц

будучи положительным, для всех между и . [19]

След

След tr( A ) по определению является суммой диагональных элементов A и также равен сумме собственных значений. Таким образом, для комплексных матриц A ,

или, для действительных матриц A ,

Здесь exp( A ) обозначает матричную экспоненту A , поскольку каждое собственное значение λ матрицы A соответствует собственному значению exp( λ ) матрицы exp( A ). В частности, если задан любой логарифм A , то есть любая матрица L , удовлетворяющая

определитель A определяется как

Например, для n = 2 , n = 3 и n = 4 соответственно,

cf. Теорема Кэли-Гамильтона . Такие выражения выводятся из комбинаторных аргументов, тождеств Ньютона или алгоритма Фаддеева-Леверье . То есть, для общего n , det A = (−1) n c 0 знаковый постоянный член характеристического многочлена , определяемый рекурсивно из

В общем случае это также можно получить из [20]

где сумма берется по множеству всех целых чисел k l ≥ 0, удовлетворяющих уравнению

Формулу можно выразить через полный экспоненциальный полином Белла от n аргументов s l = −( l – 1)! tr( A l ) как

Эту формулу можно также использовать для нахождения определителя матрицы A I J с многомерными индексами I = ( i 1 , i 2 , ..., i r ) и J = ( j 1 , j 2 , ..., j r ) . Произведение и след таких матриц определяются естественным образом как

Важное произвольное тождество размерности n может быть получено из разложения логарифма в ряд Меркатора , когда разложение сходится. Если каждое собственное значение A меньше 1 по абсолютной величине,

где I — единичная матрица. В более общем случае, если

разлагается в формальный степенной ряд по s, то все коэффициенты s m при m > n равны нулю, а оставшийся многочлен равен det( I + sA ) .

Верхние и нижние границы

Для положительно определенной матрицы A оператор трассировки дает следующие точные нижние и верхние границы определителя логарифма:

с равенством тогда и только тогда, когда A = I. Это соотношение можно вывести с помощью формулы для расхождения Кульбака-Лейблера между двумя многомерными нормальными распределениями.

Также,

Эти неравенства можно доказать, выразив следы и определитель через собственные значения. Таким образом, они представляют собой хорошо известный факт, что среднее гармоническое меньше среднего геометрического , которое меньше среднего арифметического , которое, в свою очередь, меньше среднего квадратичного .

Производный

Формула Лейбница показывает, что определитель действительных (или аналогично для комплексных) квадратных матриц является полиномиальной функцией от до . В частности, она всюду дифференцируема . Ее производная может быть выражена с помощью формулы Якоби : [21]

где обозначает сопряжение . В частности, если обратимо, то имеем

Выраженные в терминах записей , они являются

Еще одна эквивалентная формулировка:

,

с использованием большой нотации O. Особый случай, когда , единичная матрица, дает

Это тождество используется при описании алгебр Ли, связанных с определенными матричными группами Ли . Например, специальная линейная группа определяется уравнением . Приведенная выше формула показывает, что ее алгебра Ли является специальной линейной алгеброй Ли, состоящей из тех матриц, след которых равен нулю.

Записав -матрицу как , где - векторы-столбцы длины 3, тогда градиент по одному из трех векторов можно записать как векторное произведение двух других:

История

Исторически определители использовались задолго до матриц: определитель изначально определялся как свойство системы линейных уравнений . Определитель «определяет», имеет ли система единственное решение (что происходит именно тогда, когда определитель не равен нулю). В этом смысле определители впервые были использованы в китайском учебнике математики «Девять глав математического искусства» (九章算術, китайские ученые, около 3-го века до н. э.). В Европе решения линейных систем из двух уравнений были выражены Кардано в 1545 году с помощью сущности, похожей на определитель. [22]

Собственно определители возникли отдельно из работы Секи Такакадзу в 1683 году в Японии и параллельно Лейбница в 1693 году. [23] [24] [25] [26] Крамер (1750) сформулировал правило Крамера без доказательства. [27] И Крамер, и Безу (1779) пришли к определителям из вопроса о плоских кривых, проходящих через заданный набор точек. [28]

Вандермонд (1771) первым признал определители как независимые функции. [24] Лаплас (1772) дал общий метод разложения определителя по его дополнительным минорам : Вандермонд уже привел частный случай. [29] Сразу же после этого Лагранж (1773) рассмотрел определители второго и третьего порядка и применил их к вопросам теории исключения ; он доказал много частных случаев общих тождеств.

Гаусс (1801) сделал следующий шаг. Подобно Лагранжу, он широко использовал определители в теории чисел . Он ввел слово «определитель» (Лаплас использовал «результант»), хотя и не в настоящем значении, а скорее в применении к дискриминанту квантовой функции . [ 30] Гаусс также пришел к понятию обратных (обратных) определителей и очень близко подошел к теореме умножения. [ необходимо разъяснение ]

Следующим по значимости был Бине (1811, 1812), который формально сформулировал теорему, касающуюся произведения двух матриц из m столбцов и n строк, которая для частного случая m = n сводится к теореме умножения. В тот же день (30 ноября 1812 г.), когда Бине представил свою работу в Академии, Коши также представил свою работу по этой теме. (См. формулу Коши–Бине .) В ней он использовал слово «детерминант» в его нынешнем смысле, [31] [32] обобщил и упростил то, что тогда было известно по этой теме, улучшил обозначения и дал теорему умножения с доказательством, более удовлетворительным, чем у Бине. [24] [33] С него начинается теория в ее общности.

Якоби (1841) использовал функциональный определитель, который Сильвестр позже назвал якобианом . [ 34] В своих мемуарах в журнале Крелля за 1841 год он специально рассматривает эту тему, а также класс знакопеременных функций, которые Сильвестр назвал альтернантами . Примерно во время последних мемуаров Якоби Сильвестр (1839) и Кейли начали свою работу. Кейли в 1841 году ввел современную нотацию для определителя с использованием вертикальных черт. [35] [36]

Изучение специальных форм определителей стало естественным результатом завершения общей теории. Осесимметричные определители изучались Лебегом , Гессе и Сильвестром; персимметричные определители — Сильвестром и Ганкелем ; циркулянтыКаталаном , Споттисвудом , Глейшером и Скоттом; косые определители и пфаффианы в связи с теорией ортогональных преобразований — Кэли; континуанты — Сильвестром; вронскианы (так называемые Мюиром ) — Кристоффелем и Фробениусом ; составные определители — Сильвестром, Рейссом и Пике; якобианы и гессианы — Сильвестром; и симметричные гош-определители — Труди . Из учебников по этому предмету учебник Споттисвуда был первым. В Америке трактаты опубликовали Ганус (1886), Уэлд (1893) и Мьюир/Мецлер (1933).

Приложения

Правило Крамера

Определители могут быть использованы для описания решений линейной системы уравнений , записанной в матричной форме как . Это уравнение имеет единственное решение тогда и только тогда, когда не равно нулю. В этом случае решение дается правилом Крамера :

где - матрица, образованная заменой -го столбца на вектор-столбец . Это следует непосредственно из столбцового разложения определителя, т.е.

где векторы являются столбцами матрицы A. Правило также подразумевается тождеством

Правило Крамера может быть реализовано со временем, что сопоставимо с более распространенными методами решения систем линейных уравнений, такими как LU , QR или сингулярное разложение . [37]

Линейная независимость

Определители могут быть использованы для характеристики линейно зависимых векторов: равен нулю тогда и только тогда, когда векторы-столбцы (или, что эквивалентно, векторы-строки) матрицы линейно зависимы. [38] Например, если заданы два линейно независимых вектора , третий вектор лежит в плоскости, охватываемой первыми двумя векторами, точно тогда, когда определитель -матрицы, состоящей из трех векторов, равен нулю. Та же идея используется и в теории дифференциальных уравнений : заданы функции (предполагается, что они дифференцируемы по времени ), вронскиан определяется как

Он не равен нулю (для некоторых ) в указанном интервале тогда и только тогда, когда заданные функции и все их производные вплоть до порядка линейно независимы. Если можно показать, что вронскиан равен нулю всюду на интервале, то в случае аналитических функций это означает, что заданные функции линейно зависимы. См. Вронскиан и линейная независимость . Другое такое использование определителя — результант , который дает критерий, когда два многочлена имеют общий корень . [39]

Ориентация основы

Определитель можно рассматривать как присвоение числа каждой последовательности из n векторов в R n , используя квадратную матрицу, столбцы которой являются заданными векторами. Определитель будет ненулевым тогда и только тогда, когда последовательность векторов является базисом для R n . В этом случае знак определителя определяет, согласуется ли ориентация базиса с ориентацией стандартного базиса или противоположна ей . В случае ортогонального базиса величина определителя равна произведению длин базисных векторов. Например, ортогональная матрица с элементами в R n представляет собой ортонормированный базис в евклидовом пространстве и, следовательно, имеет определитель ±1 (так как все векторы имеют длину 1). Определитель равен +1 тогда и только тогда, когда базис имеет ту же ориентацию. Он равен −1 тогда и только тогда, когда базис имеет противоположную ориентацию.

В более общем случае, если определитель A положителен, то A представляет собой сохраняющее ориентацию линейное преобразование (если A — ортогональная матрица 2 × 2 или 3 × 3 , то это поворот ), а если он отрицателен, то A меняет ориентацию базиса.

Объем и определитель Якобиана

Как указано выше, абсолютное значение определителя действительных векторов равно объему параллелепипеда, охватываемого этими векторами. Как следствие, если — линейная карта, заданная умножением на матрицу , и — любое измеримое подмножество , то объем задается умножением на объем . [40] В более общем случае, если линейная карта представлена ​​-матрицей , то -мерный объем задается как:

Вычислив объем тетраэдра, ограниченного четырьмя точками, их можно использовать для определения скрещивающихся линий . Объем любого тетраэдра, учитывая его вершины , или любую другую комбинацию пар вершин, которые образуют остовное дерево над вершинами.

Нелинейное отображение отправляет небольшой квадрат (слева, в красном) в искаженный параллелограмм (справа, в красном). Якобиан в точке дает наилучшее линейное приближение искаженного параллелограмма вблизи этой точки (справа, в полупрозрачном белом), а определитель Якобиана дает отношение площади аппроксимирующего параллелограмма к площади исходного квадрата.

Для общей дифференцируемой функции многое из вышесказанного переносится при рассмотрении матрицы Якоби функции f . Для

Матрица Якоби — это матрица n × n , элементы которой задаются частными производными

Его определитель, определитель Якоби , появляется в многомерной версии интегрирования путем подстановки : для подходящих функций f и открытого подмножества U R n (области определения f ) интеграл по f ( U ) некоторой другой функции φ  : R nR m определяется как

Якобиан также встречается в теореме об обратной функции .

Применительно к области картографии определитель может быть использован для измерения скорости расширения карты вблизи полюсов. [41]

Абстрактные алгебраические аспекты

Определитель эндоморфизма

Вышеуказанные тождества, касающиеся определителя произведений и обратных матриц, подразумевают, что подобные матрицы имеют одинаковый определитель: две матрицы A и B подобны, если существует обратимая матрица X такая, что A = X −1 BX . Действительно, многократное применение приведенных выше тождеств дает

Определитель поэтому также называется инвариантом подобия . Определитель линейного преобразования

для некоторого конечномерного векторного пространства V определяется как определитель описывающей его матрицы относительно произвольного выбора базиса в V. В силу инвариантности подобия этот определитель не зависит от выбора базиса для V и, следовательно , зависит только от эндоморфизма T.

Квадратные матрицы над коммутативными кольцами

Вышеприведенное определение определителя с использованием правила Лейбница работает более общо, когда элементы матрицы являются элементами коммутативного кольца , например, целыми числами , в отличие от поля действительных или комплексных чисел. Более того, характеристика определителя как уникального чередующегося полилинейного отображения, которое удовлетворяет , все еще сохраняется, как и все свойства, вытекающие из этой характеристики. [42]

Матрица обратима (в том смысле, что существует обратная матрица, элементы которой находятся в ) тогда и только тогда, когда ее определитель является обратимым элементом в . [43] Для это означает, что определитель равен +1 или −1. Такая матрица называется унимодулярной .

Определитель является мультипликативным, он определяет гомоморфизм групп

между общей линейной группой (группой обратимых -матриц с элементами в ) и мультипликативной группой единиц в . Поскольку оно уважает умножение в обеих группах, это отображение является групповым гомоморфизмом .

Определитель — это естественное преобразование.

При наличии гомоморфизма колец существует отображение, заданное заменой всех записей в их образами при . Определитель соблюдает эти отображения, т.е. тождество

выполняется. Другими словами, отображаемая коммутативная диаграмма коммутирует.

Например, определитель комплексно сопряженной комплексной матрицы (который также является определителем ее сопряженного транспонирования) является комплексно сопряженным ее определителем, а для целочисленных матриц: модуль приведения определителя такой матрицы равен определителю матрицы, приведенной по модулю (последний определитель вычисляется с использованием модульной арифметики ). На языке теории категорий определитель является естественным преобразованием между двумя функторами и . [44] Добавляя еще один уровень абстракции, это фиксируется, говоря, что определитель является морфизмом алгебраических групп , из общей линейной группы в мультипликативную группу ,

Внешняя алгебра

Определитель линейного преобразования -мерного векторного пространства или, в более общем смысле, свободного модуля (конечного) ранга над коммутативным кольцом можно сформулировать в безкоординатной манере, рассматривая -ю внешнюю степень . [ 45] Отображение индуцирует линейное отображение

Поскольку является одномерным, отображение задается путем умножения на некоторый скаляр, т.е. элемент в . Некоторые авторы, такие как (Бурбаки 1998), используют этот факт для определения определителя как элемента в , удовлетворяющего следующему тождеству (для всех ):

Это определение согласуется с более конкретным определением, зависящим от координат. Это можно показать, используя уникальность полилинейной знакопеременной формы на -кортежах векторов в . По этой причине наивысшая ненулевая внешняя мощность (в отличие от определителя, связанного с эндоморфизмом) иногда также называется определителем и аналогично для более сложных объектов, таких как векторные расслоения или цепные комплексы векторных пространств. Миноры матрицы также можно отлить в этой настройке, рассматривая низшие знакопеременные формы с . [46]

Обобщения и связанные с ними понятия

Определители, рассмотренные выше, допускают несколько вариантов: перманент матрицы определяется как определитель, за исключением того, что факторы, встречающиеся в правиле Лейбница, опускаются. Имманант обобщает оба, вводя характер симметрической группы в правило Лейбница.

Определители для конечномерных алгебр

Для любой ассоциативной алгебры , которая является конечномерной как векторное пространство над полем , существует детерминантное отображение [47]

Это определение продолжается путем установления характеристического многочлена независимо от определителя и определения определителя как члена самого низкого порядка этого многочлена. Это общее определение восстанавливает определитель для матричной алгебры , но также включает несколько дополнительных случаев, включая определитель кватерниона ,

,

норма расширения поля , а также пфаффиан кососимметричной матрицы и приведенная норма центральной простой алгебры также возникают как частные случаи этой конструкции.

Бесконечные матрицы

Для матриц с бесконечным числом строк и столбцов приведенные выше определения определителя не переносятся напрямую. Например, в формуле Лейбница должна быть вычислена бесконечная сумма (все члены которой являются бесконечными произведениями). Функциональный анализ предоставляет различные расширения определителя для таких бесконечномерных ситуаций, которые, однако, работают только для определенных видов операторов.

Определитель Фредгольма определяет определитель для операторов, известных как операторы класса следа, посредством соответствующего обобщения формулы

Другим бесконечномерным понятием определителя является функциональный определитель .

Операторы в алгебрах фон Неймана

Для операторов в конечном множителе можно определить положительный вещественный определитель, называемый определителем Фугледе-Кадисона, используя канонический след. Фактически, каждому следовому состоянию на алгебре фон Неймана соответствует понятие определителя Фугледе-Кадисона.

Смежные понятия для некоммутативных колец

Для матриц над некоммутативными кольцами свойства полилинейности и знакопеременности несовместимы при n ≥ 2 [48] , поэтому в этой ситуации нет хорошего определения определителя.

Для квадратных матриц с элементами в некоммутативном кольце существуют различные трудности в определении определителей аналогично определению для коммутативных колец. Формуле Лейбница можно придать смысл при условии, что указан порядок для произведения, и аналогично для других определений определителя, но некоммутативность тогда приводит к потере многих фундаментальных свойств определителя, таких как свойство мультипликативности или то, что определитель не изменяется при транспонировании матрицы. Над некоммутативными кольцами нет разумного понятия полилинейной формы (существование ненулевой билинейной формы [ прояснить ] с регулярным элементом R в качестве значения для некоторой пары аргументов подразумевает, что R является коммутативным). Тем не менее, были сформулированы различные понятия некоммутативного определителя, которые сохраняют некоторые свойства определителей, в частности, квазидетерминанты и определитель Дьедонне . Для некоторых классов матриц с некоммутативными элементами можно определить определитель и доказать теоремы линейной алгебры, которые очень похожи на их коммутативные аналоги. Примерами являются q -определитель на квантовых группах, определитель Капелли на матрицах Капелли и березиниан на суперматрицах (т.е. матрицах, элементы которых являются элементами -градуированных колец ). [49] Матрицы Манина образуют класс, наиболее близкий к матрицам с коммутативными элементами.

Расчет

Определители в основном используются как теоретический инструмент. Они редко вычисляются явно в числовой линейной алгебре , где для приложений, таких как проверка обратимости и нахождение собственных значений, определитель был в значительной степени вытеснен другими методами. [50] Вычислительная геометрия , однако, часто использует вычисления, связанные с определителями. [51]

Хотя определитель можно вычислить напрямую, используя правило Лейбница, этот подход крайне неэффективен для больших матриц, поскольку эта формула требует вычисления ( факториальных ) произведений для -матрицы. Таким образом, число требуемых операций растет очень быстро: оно имеет порядок . Разложение Лапласа также неэффективно. Поэтому были разработаны более сложные методы вычисления определителей.

Гауссово исключение

Гауссово исключение состоит из левого умножения матрицы на элементарные матрицы для получения матрицы в ступенчатой ​​форме . Можно ограничить вычисления элементарными матрицами определителя 1. В этом случае определитель результирующей ступенчатой ​​формы равен определителю исходной матрицы. Поскольку ступенчатая форма является треугольной матрицей , ее определитель является произведением элементов ее диагонали.

Таким образом, определитель можно вычислить практически бесплатно из результата исключения Гаусса.

Методы разложения

Некоторые методы вычисляют , записывая матрицу как произведение матриц, определители которых можно вычислить проще. Такие методы называются методами разложения. Примерами являются разложение LU , разложение QR или разложение Холецкого (для положительно определенных матриц ). Эти методы имеют порядок , что является значительным улучшением по сравнению с . [52]

Например, LU-разложение выражается как произведение

матрицы перестановок (которая имеет ровно один элемент в каждом столбце, а в противном случае нули), нижней треугольной матрицы и верхней треугольной матрицы . Определители двух треугольных матриц и могут быть быстро вычислены, поскольку они являются произведениями соответствующих диагональных элементов. Определитель — это просто знак соответствующей перестановки (которая для четного числа перестановок и для нечетного числа перестановок). Как только такое LU-разложение известно для , его определитель легко вычисляется как

Дальнейшие методы

Порядок, достигнутый методами разложения, был улучшен различными методами. Если две матрицы порядка можно умножить за время , где для некоторых , то существует алгоритм, вычисляющий определитель за время . [53] Это означает, например, что существует алгоритм для вычисления определителя, основанный на алгоритме Копперсмита–Винограда . Этот показатель был дополнительно снижен, по состоянию на 2016 год, до 2,373. [54]

В дополнение к сложности алгоритма, для сравнения алгоритмов могут использоваться дополнительные критерии. Особенно для приложений, касающихся матриц над кольцами, существуют алгоритмы, которые вычисляют определитель без каких-либо делений. (В отличие от этого, исключение Гаусса требует делений.) Один из таких алгоритмов, имеющий сложность, основан на следующей идее: перестановки (как в правиле Лейбница) заменяются так называемыми замкнутыми упорядоченными блужданиями, в которых несколько элементов могут повторяться. Результирующая сумма имеет больше членов, чем в правиле Лейбница, но в процессе несколько из этих произведений могут быть повторно использованы, что делает ее более эффективной, чем наивное вычисление с правилом Лейбница. [55] Алгоритмы также можно оценивать по их битовой сложности , т. е. сколько бит точности необходимо для хранения промежуточных значений, возникающих в вычислении. Например, метод исключения Гаусса (или LU-разложения) имеет порядок , но длина бит промежуточных значений может стать экспоненциально большой. [56] Для сравнения, алгоритм Барейса , являющийся методом точного деления (поэтому он использует деление, но только в тех случаях, когда эти деления могут быть выполнены без остатка), имеет тот же порядок, но его битовая сложность примерно равна размеру бит исходных записей в матрице, умноженному на . [57]

Если определитель матрицы A и обратный к ней определитель матрицы A уже вычислены, лемма об определителе матрицы позволяет быстро вычислить определитель матрицы A + uv T , где u и v — векторы-столбцы.

Чарльз Доджсон (т. е. Льюис Кэрролл из «Приключений Алисы в Стране чудес ») изобрел метод вычисления определителей, называемый конденсацией Доджсона . К сожалению, этот интересный метод не всегда работает в своей первоначальной форме. [58]

Смотрите также

Примечания

  1. ^ Ланг 1985, §VII.1
  2. ^ Wildberger, Norman J. (2010). Эпизод 4 (видеолекция). WildLinAlg. Сидней, Австралия: Университет Нового Южного Уэльса . Архивировано из оригинала 2021-12-11 – через YouTube.
  3. ^ "Определители и объемы". textbooks.math.gatech.edu . Получено 16 марта 2018 г. .
  4. ^ Макконнелл (1957). Приложения тензорного анализа . Dover Publications. С. 10–17.
  5. ^ Харрис 2014, §4.7
  6. ^ Серж Лэнг , Линейная алгебра , 2-е издание, Addison-Wesley, 1971, стр. 173, 191.
  7. ^ Ланг 1987, §VI.7, Теорема 7.5
  8. ^ В качестве альтернативы, Бурбаки 1998, §III.8, Предложение 1 доказывает этот результат, используя функториальность внешней мощности.
  9. ^ Хорн и Джонсон 2018, §0.8.7
  10. ^ Кунг, Рота и Ян 2009, с. 306
  11. ^ Хорн и Джонсон 2018, §0.8.2.
  12. ^ Сильвестер, Дж. Р. (2000). «Определители блочных матриц». Math. Gaz . 84 (501): 460–467. doi :10.2307/3620776. JSTOR  3620776. S2CID  41879675.
  13. ^ Sothanaphan, Nat (январь 2017 г.). «Определители блочных матриц с некоммутирующими блоками». Линейная алгебра и ее приложения . 512 : 202–218. arXiv : 1805.06027 . doi : 10.1016/j.laa.2016.10.004. S2CID  119272194.
  14. ^ Доказательства можно найти по адресу http://www.ee.ic.ac.uk/hp/staff/dmb/matrix/proof003.html
  15. ^ Линь, Минхуа; Сра, Суврит (2014). «Совершенно сильная супераддитивность обобщенных матричных функций». arXiv : 1410.1958 [math.FA].
  16. ^ Paksoy; Turk; Zhang (2014). «Неравенства обобщенных матричных функций с помощью тензорных произведений». Электронный журнал линейной алгебры . 27 : 332–341. doi : 10.13001/1081-3810.1622 .
  17. ^ Серр, Денис (18 октября 2010 г.). "Вогнутость det1/n над HPDn". MathOverflow .
  18. ^ Ланг 1985, §VIII.2, Хорн и Джонсон 2018, Определ. 1.2.3
  19. ^ Хорн и Джонсон 2018, Наблюдение 7.1.2, Теорема 7.2.5
  20. ^ Доказательство можно найти в Приложении Б Кондратюка Л.А.; Криворученко, М.И. (1992). «Сверхпроводящая кварковая материя цветовой группы SU (2)». Zeitschrift für Physik A. 344 (1): 99–115. Бибкод : 1992ZPhyA.344...99K. дои : 10.1007/BF01291027. S2CID  120467300.
  21. ^ Хорн и Джонсон 2018, § 0.8.10
  22. ^ Граттан-Гиннесс 2003, §6.6
  23. ^ Каджори, Ф. История математики, стр. 80
  24. ^ abc Campbell, H: "Linear Algebra With Applications", страницы 111–112. Appleton Century Crofts, 1971
  25. ^ Ивс 1990, стр. 405
  26. ^ Краткая история линейной алгебры и теории матриц в: "Краткая история линейной алгебры и теории матриц". Архивировано из оригинала 10 сентября 2012 года . Получено 24 января 2012 года .
  27. ^ Кляйнер 2007, стр. 80
  28. ^ Бурбаки (1994, стр. 59)
  29. ^ Мьюир, сэр Томас, Теория детерминант в историческом порядке развития [Лондон, Англия: Macmillan and Co., Ltd., 1906]. JFM  37.0181.02
  30. ^ Кляйнер 2007, §5.2
  31. ^ Первое использование слова «детерминант» в современном смысле появилось в: Коши, Огюстен-Луи «Memoire sur les fonctions qui ne peuvent obtenir que deux valeurs égales et dessignes contraires par suite des transpositions operées entre lesvarium qu’elles». renferment», которая была впервые прочитана в Институте Франции в Париже 30 ноября 1812 года и которая впоследствии была опубликована в Journal de l'Ecole Polytechnique , Cahier 17, Tome 10, страницы 29–112 (1815).
  32. ^ Происхождение математических терминов: http://jeff560.tripod.com/d.html
  33. ^ История матриц и определителей: http://www-history.mcs.st-and.ac.uk/history/HistTopics/Matrices_and_determinants.html
  34. ^ Ивс 1990, стр. 494
  35. ^ Каджори 1993, Том. II, с. 92, нет. 462
  36. ^ История матричной записи: http://jeff560.tripod.com/matrices.html
  37. ^ Хабгуд и Арел 2012
  38. ^ Ланг 1985, §VII.3
  39. ^ Ланг 2002, §IV.8
  40. ^ Ланг 1985, §VII.6, Теорема 6.10
  41. ^ Лэй, Дэвид (2021). Линейная алгебра и ее приложения 6-е издание . Пирсон. стр. 172.
  42. ^ Даммит и Фут 2004, §11.4
  43. ^ Даммит и Фут 2004, §11.4, Теорема 30
  44. ^ Mac Lane 1998, §I.4. См. также Естественное преобразование § Определитель .
  45. ^ Бурбаки 1998, §III.8
  46. ^ Ломбарди и Квитте 2015, §5.2, Бурбаки 1998, §III.5
  47. ^ Гарибальди 2004
  48. ^ В некоммутативной установке леволинейность (совместимость с левым умножением на скаляры) следует отличать от праволинейности. Предполагая, что линейность в столбцах принимается за леволинейность, можно было бы иметь для некоммутирующих скаляров a , b : противоречие. Не существует полезного понятия полилинейных функций над некоммутативным кольцом.
  49. ^ Варадараджан, В. С. (2004), Суперсимметрия для математиков: Введение, Американское математическое общество, ISBN 978-0-8218-3574-6.
  50. ^ "... мы упоминаем, что определитель, хотя и является удобным понятием теоретически, редко находит полезную роль в численных алгоритмах.", см. Trefethen & Bau III 1997, Lecture 1.
  51. ^ Фисикопулос и Пеньяранда 2016, §1.1, §4.3
  52. ^ Камареро, Кристобаль (2018-12-05). «Простые, быстрые и практичные алгоритмы для разложения Холецкого, LU и QR с использованием быстрого умножения прямоугольных матриц». arXiv : 1812.02056 [cs.NA].
  53. ^ Банч и Хопкрофт 1974
  54. ^ Фисикопулос и Пеньяранда 2016, §1.1
  55. ^ Роте 2001
  56. ^ Фанг, Синь Гуй; Хавас, Джордж (1997). "О наихудшей сложности целочисленного гауссовского исключения" (PDF) . Труды международного симпозиума 1997 года по символьным и алгебраическим вычислениям . ISSAC '97. Кихеи, Мауи, Гавайи, США: ACM. стр. 28–31. doi :10.1145/258726.258740. ISBN 0-89791-875-4. Архивировано из оригинала (PDF) 2011-08-07 . Получено 2011-01-22 .
  57. ^ Фисикопулос и Пеньяранда 2016, §1.1, Bareiss 1968
  58. ^ Абелес, Франсин Ф. (2008). «Конденсация Доджсона: историческое и математическое развитие экспериментального метода». Линейная алгебра и ее приложения . 429 (2–3): 429–438. doi : 10.1016/j.laa.2007.11.022 .

Ссылки

Исторические справки

Внешние ссылки