stringtranslate.com

Матрица экспоненциальная

В математике матричная экспонента — это матричная функция на квадратных матрицах, аналогичная обычной экспоненциальной функции . Она используется для решения систем линейных дифференциальных уравнений. В теории групп Ли матричная экспонента задает экспоненциальное отображение между матричной алгеброй Ли и соответствующей группой Ли .

Пусть Xвещественная или комплексная матрица размера n × n . Экспонента X , обозначаемая как e X или exp( X ) , — это матрица размера n × n, заданная степенным рядом

где определяется как единичная матрица с теми же размерами, что и . [1] Ряд всегда сходится, поэтому экспонента X хорошо определена.

Эквивалентно,

где Iединичная матрица размера n × n .

Если Xдиагональная матрица размера n × n, то exp( X ) будет диагональной матрицей размера n × n , в которой каждый диагональный элемент равен обычной экспоненте, примененной к соответствующему диагональному элементу X .

Характеристики

Элементарные свойства

Пусть X и Y будут комплексными матрицами n × n , а a и b — произвольными комплексными числами. Обозначим единичную матрицу n × n через I , а нулевую матрицу через 0. Экспоненциальная матрица удовлетворяет следующим свойствам. [2]

Начнем со свойств, которые являются непосредственными следствиями определения как степенного ряда:

Следующий ключевой результат таков:

Доказательство этого тождества такое же, как и стандартный аргумент степенного ряда для соответствующего тождества для экспоненты действительных чисел. То есть, пока и коммутируют , для аргумента не имеет значения, являются ли и числами или матрицами. Важно отметить, что это тождество обычно не выполняется, если и не коммутируют (см. неравенство Голдена-Томпсона ниже).

Последствия предыдущего тождества следующие:

Используя приведенные выше результаты, мы можем легко проверить следующие утверждения. Если X симметричен , то e X также симметричен, а если X кососимметричен , то e X ортогонален . Если X эрмитово , то e X также эрмитово, а если X косоэрмитово , то e X унитарно .

Наконец, преобразование Лапласа матричных экспонент равносильно резольвенте для всех достаточно больших положительных значений s .

Системы линейных дифференциальных уравнений

Одной из причин важности матричной экспоненты является то, что ее можно использовать для решения систем линейных обыкновенных дифференциальных уравнений . Решение, где A — постоянная матрица, а y — вектор-столбец, задается формулой

Матричную экспоненту можно также использовать для решения неоднородного уравнения. Примеры см. в разделе о приложениях ниже.

Не существует замкнутого решения для дифференциальных уравнений вида, где A не является константой, но ряд Магнуса дает решение в виде бесконечной суммы.

Определитель матричной экспоненты

По формуле Якоби для любой комплексной квадратной матрицы справедливо следующее тождество следа : [3]

Помимо предоставления вычислительного инструмента, эта формула демонстрирует, что матричная экспонента всегда является обратимой матрицей . Это следует из того факта, что правая часть приведенного выше уравнения всегда не равна нулю, и поэтому det( e A ) ≠ 0 , что подразумевает, что e A должна быть обратимой.

В вещественнозначном случае формула также показывает, что отображение не является сюръективным , в отличие от комплексного случая, упомянутого ранее. Это следует из того факта, что для вещественнозначных матриц правая часть формулы всегда положительна, в то время как существуют обратимые матрицы с отрицательным определителем.

Действительные симметричные матрицы

Матричная экспонента действительной симметричной матрицы положительно определена. Пусть будет вещественной симметричной матрицей n × n и вектором-столбцом. Используя элементарные свойства матричной экспоненты и симметричных матриц, имеем:

Так как обратим, равенство справедливо только для , и для всех ненулевых имеем . Следовательно , положительно определен.

Экспонента сумм

Для любых действительных чисел (скаляров) x и y мы знаем, что экспоненциальная функция удовлетворяет условию e x + y = e x e y . То же самое верно для коммутирующих матриц. Если матрицы X и Y коммутируют (что означает, что XY = YX ), то,

Однако для матриц, которые не коммутируют, указанное выше равенство не обязательно выполняется.

Формула произведения Ли

Даже если X и Y не коммутируют, экспоненту e X + Y можно вычислить по формуле произведения Ли [4]

Использование большого конечного значения k для аппроксимации вышеизложенного является основой разложения Сузуки-Троттера, часто используемого в числовой эволюции во времени .

Формула Бейкера–Кэмпбелла–Хаусдорфа

В другом направлении, если X и Y являются достаточно малыми (но не обязательно коммутирующими) матрицами, мы имеем где Z может быть вычислено как ряд по коммутаторам X и Y с помощью формулы БейкераКэмпбелла – Хаусдорфа : [ 5 ] где все оставшиеся члены являются итерированными коммутаторами, включающими X и Y. Если X и Y коммутируют, то все коммутаторы равны нулю, и мы просто имеем Z = X + Y.

Неравенства для экспонент эрмитовых матриц

Для эрмитовых матриц существует известная теорема, связанная со следом матричных экспонент.

Если A и B — эрмитовы матрицы, то [6]

Нет требования коммутативности. Существуют контрпримеры, показывающие, что неравенство Голдена–Томпсона не может быть распространено на три матрицы – и, в любом случае, tr(exp( A )exp( B )exp( C )) не гарантирует вещественность для эрмитовых A , B , C . Однако Либ доказал [7] [8] , что его можно обобщить на три матрицы, если мы изменим выражение следующим образом

Экспоненциальная карта

Экспонента матрицы всегда является обратимой матрицей . Обратная матрица e X задается как e X . Это аналогично тому, что экспонента комплексного числа всегда не равна нулю. Затем экспонента матрицы дает нам отображение из пространства всех матриц n × n в общую линейную группу степени n , то есть группу всех обратимых матриц n × n . Фактически, это отображение является сюръективным , что означает, что каждая обратимая матрица может быть записана как экспонента некоторой другой матрицы [9] (для этого необходимо рассматривать поле C комплексных чисел, а не R ).

Для любых двух матриц X и Y ,

где ‖ · ‖ обозначает произвольную матричную норму . Отсюда следует, что экспоненциальное отображение непрерывно и удовлетворяет условию Липшица на компактных подмножествах M n ( C ) .

Карта определяет гладкую кривую в общей линейной группе, которая проходит через единичный элемент при t = 0 .

Фактически, это дает однопараметрическую подгруппу общей линейной группы, поскольку

Производная этой кривой (или касательного вектора ) в точке t определяется выражением

Производная при t = 0 — это просто матрица X , то есть X порождает эту однопараметрическую подгруппу.

В более общем смысле, [10] для общей t -зависимой экспоненты, X ( t ) ,

Вынося приведенное выше выражение e X ( t ) за знак интеграла и раскрывая подынтегральное выражение с помощью леммы Адамара, можно получить следующее полезное выражение для производной матричной экспоненты, [11]

Коэффициенты в выражении выше отличаются от тех, что появляются в экспоненциальном выражении. Для замкнутой формы см. производную экспоненциального отображения .

Направленные производные при ограничении эрмитовыми матрицами

Пусть будет эрмитовой матрицей с различными собственными значениями. Пусть будет ее собственным разложением, где — унитарная матрица, столбцы которой являются собственными векторами , — ее сопряженная транспонированная матрица, а вектор соответствующих собственных значений. Тогда для любой эрмитовой матрицы производная по направлению от at в направлении равна [12] [13] где , оператор обозначает произведение Адамара, и для всех матрица определяется как Кроме того, для любой эрмитовой матрицы вторая производная по направлению в направлениях и равна [13] где матричная функция определяется для всех , как с

Вычисление матричной экспоненты

Найти надежные и точные методы вычисления матричной экспоненты сложно, и это все еще тема значительных современных исследований в области математики и численного анализа. Matlab , GNU Octave , R и SciPy используют аппроксимацию Паде . [14] [15] [16] [17] В этом разделе мы обсуждаем методы, которые в принципе применимы к любой матрице и которые могут быть явно реализованы для небольших матриц. [18] В последующих разделах описываются методы, подходящие для численной оценки больших матриц.

Диагонализуемый случай

Если матрица диагональная : то ее экспоненту можно получить, возведя в степень каждый элемент на главной диагонали:

Этот результат также позволяет возводить в степень диагонализуемые матрицы . Если

А = УДУ −1

и D — диагональ, тогда

е А = Ue D U −1 .

Применение формулы Сильвестра дает тот же результат. (Чтобы убедиться в этом, отметим, что сложение и умножение, а следовательно, и возведение в степень диагональных матриц эквивалентно поэлементному сложению и умножению, а следовательно, и возведению в степень; в частности, «одномерное» возведение в степень ощущается поэлементно для диагонального случая.)

Пример: Диагонализуемый

Например, матрицу можно диагонализировать следующим образом:

Таким образом,

Нильпотентный случай

Матрица N нильпотентна, если N q = 0 для некоторого целого числа q . В этом случае матричную экспоненту e N можно вычислить непосредственно из разложения ряда, поскольку ряд заканчивается после конечного числа членов:

Поскольку ряд имеет конечное число шагов, он представляет собой матричный полином, который можно эффективно вычислить .

Общий случай

Используя разложение Жордана–Шевалле

По разложению Жордана–Шевалле любая матрица X с комплексными элементами может быть выражена как где

Это означает, что мы можем вычислить экспоненту X , сведя ее к предыдущим двум случаям:

Обратите внимание, что для работы последнего шага нам нужна коммутативность A и N.

Используя каноническую форму Жордана

Близкий метод заключается в том, чтобы, если поле алгебраически замкнуто , работать с жордановой формой X. Предположим, что X = PJP −1 , где J — жорданова форма X. Тогда

Также, поскольку

Поэтому нам нужно только знать, как вычислить матричную экспоненту жордановой клетки . Но каждая жорданова клетка имеет вид

где N — специальная нильпотентная матрица. Тогда матричная экспонента J задается как

Проекционный корпус

Если Pпроекционная матрица (т.е. идемпотентна : P 2 = P ), ее матричная экспонента равна:

е П = Я + ( е − 1) П .

Выводя это путем расширения показательной функции, каждая степень P сводится к P , который становится общим множителем суммы:

Корпус вращения

Для простого вращения, в котором перпендикулярные единичные векторы a и b задают плоскость, [19] матрица вращения R может быть выражена через аналогичную экспоненциальную функцию, включающую генератор G и угол θ . [20] [21]

Формула для экспоненты получается путем сокращения степеней G в разложении ряда и идентификации соответствующих коэффициентов ряда G 2 и G с −cos( θ ) и sin( θ ) соответственно. Второе выражение здесь для e такое же, как выражение для R ( θ ) в статье, содержащей вывод генератора , R ( θ ) = e .

В двух измерениях, если и , то , , и сводится к стандартной матрице для вращения плоскости.

Матрица P = − G 2 проецирует вектор на плоскость ab , и вращение влияет только на эту часть вектора. Примером, иллюстрирующим это, является вращение на 30° = π/6 в плоскости, охватываемой a и b ,

Пусть N = I - P , тогда N 2 = N , а его произведения с P и G равны нулю. Это позволит нам оценить степени R.

Оценка по серии Лорана

В силу теоремы Кэли–Гамильтона матричная экспонента выражается в виде многочлена порядка n −1.

Если P и Qt — ненулевые многочлены от одной переменной, такие, что P(A) = 0, и если мероморфная функция является целой , то Чтобы доказать это , умножим первое из двух приведенных выше равенств на P ( z ) и заменим z на A.

Такой многочлен Q t ( z ) можно найти следующим образом − см. формулу Сильвестра . Пусть a является корнем P , Q a,t ( z ) решается из произведения P на главную часть ряда Лорана f в a : Она пропорциональна соответствующему коварианту Фробениуса . Тогда сумма S t из Q a,t , где a пробегает все корни P , может быть взята как конкретный Q t . Все остальные Q t будут получены путем добавления кратного P к S t ( z ) . В частности, S t ( z ) , многочлен Лагранжа-Сильвестра , является единственным Q t , степень которого меньше , чем у P .

Пример : Рассмотрим случай произвольной матрицы 2×2,

Экспоненциальная матрица e tA , в силу теоремы Кэли–Гамильтона , должна иметь вид

(Для любого комплексного числа z и любой C -алгебры B мы снова обозначаем через z произведение z на единицу B. )

Пусть α и β корни характеристического многочлена A ,

Тогда мы имеем отсюда

если αβ ; в то время как, если α = β ,

так что

Определение

у нас есть

где sin( qt )/ q равен 0, если t = 0 , и t, если q = 0 .

Таким образом,

Таким образом, как указано выше, матрица A, разложенная на сумму двух взаимно коммутирующих частей, следовой части и бесследовой части,

матричная экспонента сводится к простому произведению экспонент двух соответствующих частей. Это формула, часто используемая в физике, поскольку она представляет собой аналог формулы Эйлера для спиновых матриц Паули , то есть вращений дублетного представления группы SU(2) .

Полиному S t также можно дать следующую « интерполяционную » характеристику. Определим e t ( z ) ≡ e tz , и n ≡ deg P . Тогда S t ( z ) является единственным полиномом степени < n , который удовлетворяет S t ( k ) ( a ) = e t ( k ) ( a ) всякий раз, когда k меньше кратности a как корня P . Мы предполагаем, что мы, очевидно, можем, что P является минимальным полиномом A . Мы также предполагаем , что A является диагонализируемой матрицей . В частности , корни P являются простыми, и « интерполяционная » характеристика указывает, что S t задается интерполяционной формулой Лагранжа , поэтому это полином Лагранжа−Сильвестра .

С другой стороны, если P = ( z - a ) n , то

Простейший случай, не охваченный приведенными выше наблюдениями, — это случай, когда a b , что дает

Оценка по внедрениюФормула Сильвестра

Практическое, ускоренное вычисление вышеизложенного сводится к следующим быстрым шагам. Напомним, что матрица n×n exp( tA ) представляет собой линейную комбинацию первых n −1 степеней A по теореме Кэли–Гамильтона . Для диагонализуемых матриц, как показано выше, например, в случае 2×2, формула Сильвестра дает exp( tA ) = B α exp( ) + B β exp( ) , где B s — коварианты Фробениуса матрицы A .

Однако проще всего решить эти уравнения B напрямую, вычислив это выражение и его первую производную при t = 0 через A и I , чтобы найти тот же ответ, что и выше.

Но эта простая процедура также работает для дефектных матриц в обобщении, предложенном Бухгеймом. [22] Это проиллюстрировано здесь для примера матрицы 4×4, которая не диагонализируется , а B не являются проекционными матрицами.

Рассмотрим собственные значения λ 1 = 3/4 и λ 2 = 1 , каждое из которых имеет кратность два.

Рассмотрим экспоненту каждого собственного значения, умноженную на t , exp( λ i t ) . Умножим каждое экспоненциальное собственное значение на соответствующую неопределенную матрицу коэффициентов B i . Если собственные значения имеют алгебраическую кратность больше 1, то повторим процесс, но теперь умножая на дополнительный множитель t для каждого повторения, чтобы обеспечить линейную независимость.

(Если бы одно собственное значение имело кратность три, то было бы три члена: . Напротив, когда все собственные значения различны, B являются просто ковариантами Фробениуса , и решение для них, как показано ниже, просто равносильно инверсии матрицы Вандермонда этих 4 собственных значений.)

Сумма всех таких членов, здесь четыре таких,

Чтобы решить все неизвестные матрицы B в терминах первых трех степеней A и тождества, необходимо четыре уравнения, причем приведенное выше дает одно из них при t = 0. Далее, дифференцируем его по t ,

и снова,

и еще раз,

(В общем случае необходимо взять n −1 производных.)

Установив t = 0 в этих четырех уравнениях, теперь можно решить четыре матрицы коэффициентов B s ,

уступать

Подстановка значения для A дает матрицы коэффициентов

так что окончательный ответ:

Процедура намного короче алгоритма Путцера, иногда используемого в таких случаях.

Иллюстрации

Предположим, что мы хотим вычислить экспоненту

Ее жорданова форма имеет вид , где матрица P задается как

Давайте сначала вычислим exp( J ). У нас есть

Экспонента матрицы 1×1 — это просто экспонента одного элемента матрицы, поэтому exp( J 1 (4)) = [ e 4 ] . Экспонента J 2 (16) может быть вычислена по формуле e I + N ) = e λ e N , упомянутой выше; это дает [23]

Следовательно, экспонента исходной матрицы B равна

Приложения

Линейные дифференциальные уравнения

Матричная экспонента имеет приложения к системам линейных дифференциальных уравнений . (См. также матричное дифференциальное уравнение .) Напомним, что ранее в этой статье говорилось, что однородное дифференциальное уравнение вида имеет решение e At y (0) .

Если мы рассмотрим вектор, то можем выразить систему неоднородных связанных линейных дифференциальных уравнений как. Сделав анзац, используя интегрирующий множитель e At и умножая его везде, получим

Второй шаг возможен благодаря тому, что если AB = BA , то e At B = Be At . Таким образом, вычисление e At приводит к решению системы, просто интегрируя третий шаг по t .

Решение этой задачи можно получить путем интегрирования и умножения на для устранения показателя степени в левой части уравнения. Обратите внимание, что в то время как является матрицей, учитывая, что это матрица экспоненциальная, мы можем сказать, что . Другими словами, .

Пример (однородный)

Рассмотрим систему

Сопутствующая дефектная матрица

Экспоненциальная матрица равна

так что общее решение однородной системы равно

в размере

Пример (неоднородный)

Рассмотрим теперь неоднородную систему

У нас снова есть

и

Из предыдущего мы уже имеем общее решение однородного уравнения. Поскольку сумма однородного и частного решений дает общее решение неоднородной задачи, нам теперь нужно найти только частное решение.

Мы имеем, согласно вышесказанному, что можно было бы еще больше упростить, чтобы получить требуемое частное решение, определенное путем изменения параметров. Обратите внимание, что c = y p (0). Для большей строгости см. следующее обобщение.

Обобщение неоднородного случая: вариация параметров

Для неоднородного случая можно использовать интегрирующие множители (метод, родственный вариации параметров ). Мы ищем частное решение вида y p ( t ) = exp( tA ) z ( t ) ,

Чтобы y p было решением,

Таким образом, где c определяется начальными условиями задачи.

Точнее, рассмотрим уравнение

с начальным условием Y ( t 0 ) = Y 0 , где

Умножение слева приведенного выше равенства на e −tA дает

Мы утверждаем, что решение уравнения

с начальными условиями для 0 ≤ k < n равно

где обозначения следующие:

s k ( t ) — коэффициентв полиноме, обозначенномв Подразделе Оценка с помощью ряда Лорана выше.

Чтобы обосновать это утверждение, мы преобразуем наше скалярное уравнение порядка n в векторное уравнение порядка один с помощью обычного сведения к системе первого порядка . Наше векторное уравнение принимает вид где Aтранспонированная сопутствующая матрица P. Мы решаем это уравнение, как объяснено выше, вычисляя матричные экспоненты с помощью наблюдения, сделанного в Подразделе Оценка путем реализации формулы Сильвестра выше.

В случае n = 2 получаем следующее утверждение. Решение

является

где функции s 0 и s 1 такие же, как в подразделе Оценка с помощью рядов Лорана выше.

Матрично-матричные экспоненты

Матричная экспонента другой матрицы (матрично-матричная экспонента) [ 24] определяется как для любой нормальной и невырожденной n × n матрицы X и любой комплексной n × n матрицы Y.

Для матрично-матричных экспонент существует различие между левой экспонентой Y X и правой экспонентой X Y , поскольку оператор умножения для матрицы на матрицу не является коммутативным . Более того,

Смотрите также

Ссылки

  1. ^ Холл 2015 Уравнение 2.1
  2. ^ Холл 2015 Предложение 2.3
  3. ^ Холл 2015 Теорема 2.12
  4. ^ Холл 2015 Теорема 2.11
  5. ^ Холл 2015 Глава 5
  6. ^ Бхатия, Р. (1997). Матричный анализ . Graduate Texts in Mathematics. Vol. 169. Springer. ISBN 978-0-387-94846-1.
  7. ^ Либ, Эллиотт Х. (1973). «Выпуклые функции следа и гипотеза Вигнера–Янасе–Дайсона». Успехи в математике . 11 (3): 267–288. doi : 10.1016/0001-8708(73)90011-X .
  8. ^ H. Epstein (1973). «Замечания о двух теоремах Э. Либа». Сообщения по математической физике . 31 (4): 317–325. Bibcode :1973CMaPh..31..317E. doi :10.1007/BF01646492. S2CID  120096681.
  9. ^ Холл 2015 Упражнения 2.9 и 2.10
  10. ^ RM Wilcox (1967). «Экспоненциальные операторы и дифференцирование параметров в квантовой физике». Журнал математической физики . 8 (4): 962–982. Bibcode : 1967JMP.....8..962W. doi : 10.1063/1.1705306.
  11. ^ Холл 2015 Теорема 5.4
  12. ^ Льюис, Адриан С.; Сендов, Христо С. (2001). «Дважды дифференцируемые спектральные функции» (PDF) . Журнал SIAM по матричному анализу и приложениям . 23 (2): 368–386. doi :10.1137/S089547980036838X.См. теорему 3.3.
  13. ^ ab Deledalle, Charles-Alban; Denis, Loïc; Tupin, Florence (2022). «Уменьшение спеклов в области матрицы-логарифма для получения радиолокационных изображений с синтезированной апертурой». Journal of Mathematical Imaging and Vision . 64 (3): 298–320. doi : 10.1007/s10851-022-01067-1 .См. Предложения 1 и 2.
  14. ^ "Матричная экспоненциальная – MATLAB expm – MathWorks Deutschland". Mathworks.de. 2011-04-30 . Получено 2013-06-05 .
  15. ^ "GNU Octave – Функции матрицы". Network-theory.co.uk. 2007-01-11. Архивировано из оригинала 2015-05-29 . Получено 2013-06-05 .
  16. ^ "R - pkg {Matrix}: Matrix Exponential". 2005-02-28 . Получено 2023-07-17 .
  17. ^ "документация функции scipy.linalg.expm". Сообщество SciPy. 2015-01-18 . Получено 2015-05-29 .
  18. ^ См. раздел 2.2 Холла 2015 г.
  19. ^ в евклидовом пространстве
  20. ^ Вейль, Герман (1952). Пространство и время. Дувр. стр. 142. ISBN 978-0-486-60267-7.
  21. ^ Бьёркен, Джеймс Д.; Дрелл, Сидней Д. (1964). Релятивистская квантовая механика . McGraw-Hill. стр. 22.
  22. ^ Райнхарт, РФ (1955). «Эквивалентность определений матричной функции». The American Mathematical Monthly , 62 (6), 395-414.
  23. ^ Это можно обобщить; в общем случае экспонента J n ( a ) представляет собой верхнюю треугольную матрицу с e a /0! на главной диагонали, e a /1! на той, что выше, e a /2! на следующей и так далее.
  24. ^ Игнасио Баррадас и Джоэл Э. Коэн (1994). "Итеративное возведение в степень, матричное возведение в степень и энтропия" (PDF) . Academic Press, Inc. Архивировано из оригинала (PDF) 2009-06-26.

Внешние ссылки