stringtranslate.com

Формула Якоби

В матричном исчислении формула Якоби выражает производную определителя матрицы A через сопряженную с A и производную A. [ 1 ]

Если A — дифференцируемое отображение действительных чисел в матрицы n  ×  n , то

где tr( X ) — след матрицы X , а — ее сопряженная матрица . (Последнее равенство справедливо только в том случае, если A ( t ) обратимо .)

В качестве особого случая,

Эквивалентно, если dA обозначает дифференциал A , общая формула имеет вид

Формула названа в честь математика Карла Густава Якоба Якоби .

Вывод

С помощью матричного вычисления

Теорема. (Формула Якоби) Для любого дифференцируемого отображения A действительных чисел в матрицы n  ×  n ,

Доказательство. Формула Лапласа для определителя матрицы A может быть записана как

Обратите внимание, что суммирование выполняется по некоторой произвольной строке i матрицы.

Определитель A можно рассматривать как функцию элементов A :

так что по правилу цепочки его дифференциал равен

Это суммирование выполняется по всем n × n элементам матрицы.

Чтобы найти ∂ F /∂ A ij , учтите, что в правой части формулы Лапласа индекс i может быть выбран по желанию. (В целях оптимизации вычислений: любой другой выбор в конечном итоге даст тот же результат, но это может быть намного сложнее). В частности, его можно выбрать так, чтобы он соответствовал первому индексу ∂ / ∂ A ij :

Таким образом, по правилу произведения,

Теперь, если элемент матрицы A ij и сомножитель adj T ( A ) ik элемента A ik лежат в одной строке (или столбце), то сомножитель не будет функцией A ij , поскольку сомножитель A ik выражается через элементы, не находящиеся в его собственной строке (или столбце). Таким образом,

так

Все элементы A независимы друг от друга, т.е.

где δ — это символ Кронекера , поэтому

Поэтому,

Через цепочку правил

Лемма 1. , где — дифференциал .

Это уравнение означает, что дифференциал , вычисленный в единичной матрице, равен следу. Дифференциал — это линейный оператор, который отображает матрицу n × n в действительное число.

Доказательство. Используя определение производной по направлению вместе с одним из ее основных свойств для дифференцируемых функций, имеем

является многочленом порядка n . Он тесно связан с характеристическим многочленом . Постоянный член в этом многочлене (член с ) равен 1, тогда как линейный член в равен .

Лемма 2. Для обратимой матрицы A имеем: .

Доказательство. Рассмотрим следующую функцию X :

Вычислим дифференциал и оценим его при , используя Лемму 1, уравнение выше и цепочку правил:

Теорема. (Формула Якоби)

Доказательство. Если обратим, то по лемме 2, причем

используя уравнение, связывающее сопряженное с . Теперь формула верна для всех матриц, поскольку множество обратимых линейных матриц плотно в пространстве матриц.

Через диагонализацию

Обе части формулы Якоби являются полиномами от матричных коэффициентов A и A' . Поэтому достаточно проверить полиномиальное тождество на плотном подмножестве, где собственные значения A различны и не равны нулю.

Если A разлагается дифференцируемо как , то

В частности, если L обратим, то и

Поскольку A имеет различные собственные значения, существует дифференцируемая комплексная обратимая матрица L такая, что и D является диагональной. Тогда

Пусть , — собственные значения матрицы A. Тогда

что является формулой Якоби для матриц A с различными ненулевыми собственными значениями.

Следствие

Ниже приведено полезное соотношение, связывающее след с определителем соответствующей матричной экспоненты :

Это утверждение очевидно для диагональных матриц, и далее следует доказательство общего утверждения.

Для любой обратимой матрицы в предыдущем разделе «С помощью цепного правила» мы показали, что

Учитывая это уравнение, получаем:

Желаемый результат получается как решение этого обыкновенного дифференциального уравнения.

Приложения

Несколько форм формулы лежат в основе алгоритма Фаддеева–Леверье для вычисления характеристического полинома и явных приложений теоремы Кэли–Гамильтона . Например, исходя из следующего уравнения, которое было доказано выше:

и используя , получаем:

где adj обозначает присоединенную матрицу .

Замечания

  1. Magnus & Neudecker (1999, стр. 149–150), Часть третья, Раздел 8.3

Ссылки