stringtranslate.com

Матричная экспонента

В математике матричная экспонента — это матричная функция на квадратных матрицах , аналогичная обычной экспоненциальной функции . Он используется для решения систем линейных дифференциальных уравнений. В теории групп Ли матричная экспонента дает экспоненциальное отображение между матричной алгеброй Ли и соответствующей группой Ли .

Пусть Xдействительная или комплексная матрица размера n × n . Экспонента X , обозначаемая e X или exp( X ) , представляет собой матрицу размера n × n , заданную степенным рядом

где определяется как единичная матрица тех же размеров, что и . [1] Ряд всегда сходится, поэтому экспонента X четко определена.

Эквивалентно,

Iединичная матрица размера n × n

Когда X является диагональной матрицей размера n × n, тогда exp( X ) будет диагональной матрицей размера n × n , где каждый диагональный элемент равен обычной экспоненте , примененной к соответствующему диагональному элементу X .

Характеристики

Элементарные свойства

Пусть X и Y — комплексные матрицы размера n × n , а a и b — произвольные комплексные числа. Обозначим единичную матрицу размера n × n через I , а нулевую матрицу через 0. Матричная экспонента удовлетворяет следующим свойствам. [2]

Начнем со свойств, которые являются непосредственными следствиями определения степенного ряда:

Следующий ключевой результат таков:

Доказательство этого тождества такое же, как и стандартное доказательство степенного ряда для соответствующего тождества для экспоненты действительных чисел. То есть, пока и коммутируют , для аргумента не имеет значения, являются ли и числами или матрицами. Важно отметить, что это тождество обычно не выполняется, если и не коммутировать (см. неравенство Голдена-Томпсона ниже).

Следствия предыдущего тождества следующие:

Используя приведенные выше результаты, мы можем легко проверить следующие утверждения. Если X симметричен , то e X также симметричен, а если X кососимметричен , то e X ортогонален . Если X эрмитово , то e X также эрмитово, а если X косоэрмитово , то e X унитарно .

Наконец, преобразование Лапласа матричных экспонент сводится к резольвенте ,

s

Системы линейных дифференциальных уравнений

Одной из причин важности матричной экспоненты является то, что ее можно использовать для решения систем линейных обыкновенных дифференциальных уравнений . Решение

A

Матричную экспоненту можно использовать и для решения неоднородного уравнения

Для дифференциальных уравнений вида не существует решения в замкнутой форме

Aряд Магнуса

Определитель матричной экспоненты

По формуле Якоби для любой комплексной квадратной матрицы справедливо следующее тождество следа : [3]

Эта формула не только предоставляет вычислительный инструмент, но и демонстрирует, что матричная экспонента всегда является обратимой матрицей . Это следует из того факта, что правая часть приведенного выше уравнения всегда отлична от нуля, и поэтому det( e A ) ≠ 0 , из чего следует, что e A должна быть обратимой.

В действительном случае формула также отображает карту

сюръективным

Действительные симметричные матрицы

Матричная экспонента вещественной симметричной матрицы положительно определена. Пусть — вещественная симметричная матрица размера n × n и вектор-столбец. Используя элементарные свойства матричной экспоненты и симметричных матриц, имеем:

Поскольку обратимо, равенство справедливо только для , и мы имеем для всех ненулевых . Следовательно , положительно определено.

Экспонента сумм

Для любых действительных чисел (скаляров) x и y мы знаем, что экспоненциальная функция удовлетворяет условию e x + y = e x e y . То же самое справедливо и для коммутирующих матриц. Если матрицы X и Y коммутируют (это означает, что XY = YX ), то

Однако для матриц, которые не коммутируют, приведенное выше равенство не обязательно выполняется.

Формула произведения Ли

Даже если X и Y не коммутируют, экспоненту e X + Y можно вычислить по формуле произведения Ли [4]

Использование большого конечного k для аппроксимации вышеизложенного является основой расширения Сузуки-Троттера, часто используемого в числовой эволюции во времени .

Формула Бейкера-Кэмпбелла-Хаусдорфа.

В другом направлении, если X и Y — достаточно малые (но не обязательно коммутирующие) матрицы, мы имеем

ZX исформулы Бейкера – Кэмпбелла – Хаусдорфа[5]
XY.XYZ = X + Y.

Неравенства для экспонент эрмитовых матриц

Для эрмитовых матриц существует примечательная теорема, связанная со следом матричных экспонент.

Если A и B — эрмитовые матрицы, то [6]

Требование коммутативности отсутствует. Существуют контрпримеры, показывающие, что неравенство Голдена-Томпсона не может быть распространено на три матрицы – и, в любом случае, tr(exp( A )exp( B )exp( C )) не гарантированно вещественен для эрмитовых A , B , С . Однако Либ доказал [7] [8] , что его можно обобщить на три матрицы, если мы изменим выражение следующим образом:

Экспоненциальная карта

Экспонента матрицы всегда является обратимой матрицей . Обратная матрица e X определяется как e X . Это аналогично тому факту, что экспонента комплексного числа всегда отлична от нуля. Затем матричная экспонента дает нам карту

nnобщую линейную группуnгруппуразмера nnсюръективно[9]C , а не R

Для любых двух матриц X и Y ,

где ‖ · ‖ обозначает произвольную матричную норму . Отсюда следует , что экспоненциальное отображение непрерывно и липшицево непрерывно на компактных подмножествах Mn ( C ) .

Карта

гладкуюt = 0

Фактически это дает однопараметрическую подгруппу полной линейной группы, поскольку

Производная этой кривой (или касательного вектора ) в точке t определяется выражением

Производная при t = 0 — это просто матрица X , то есть X порождает эту однопараметрическую подгруппу.

В более общем смысле, [10] для общего t -зависимого показателя X ( t ) ,

Вынеся приведенное выше выражение e X ( t ) за знак интеграла и расширив подынтегральную функцию с помощью леммы Адамара , можно получить следующее полезное выражение для производной матричного показателя степени: [11]

Коэффициенты в приведенном выше выражении отличаются от тех, которые появляются в экспоненте. Для замкнутой формы см. производную экспоненциального отображения .

Производные по направлению при ограничении эрмитовыми матрицами

Пусть – эрмитова матрица с различными собственными значениями. Пусть – его собственное разложение где – унитарная матрица, столбцы которой являются собственными векторами матрицы , – ее сопряженное транспонирование и вектор соответствующих собственных значений. Тогда для любой эрмитовой матрицы производная от at по направлению равна [12] [13]

[13]

Вычисление матричной экспоненты

Найти надежные и точные методы вычисления матричной экспоненты сложно, и это все еще является темой серьезных текущих исследований в области математики и численного анализа. Matlab , GNU Octave , R и SciPy используют аппроксимант Паде . [14] [15] [16] [17] В этом разделе мы обсуждаем методы, которые в принципе применимы к любой матрице и которые можно явно реализовать для малых матриц. [18] В последующих разделах описываются методы, подходящие для численного оценивания больших матриц.

Диагонализуемый корпус

Если матрица диагональная :

Этот результат также позволяет возводить в степень диагонализуемые матрицы . Если

А = УДУ -1

и D диагональ, то

е А знак равно Ue D U -1 .

Применение формулы Сильвестра дает тот же результат. (Чтобы убедиться в этом, заметим, что сложение и умножение, а, следовательно, и возведение в степень, диагональных матриц эквивалентно поэлементному сложению и умножению и, следовательно, возведению в степень; в частности, «одномерное» возведение в степень ощущается поэлементно для диагонали. случай.)

Пример: Диагонализуемый

Например, матрица

Таким образом,

Нильпотентный случай

Матрица N нильпотентна , если N q = 0 для некоторого целого числа q . В этом случае матричную экспоненту e N можно вычислить непосредственно из разложения в ряд, поскольку ряд заканчивается после конечного числа членов:

Поскольку ряд имеет конечное число шагов, он представляет собой матричный полином, который можно эффективно вычислить .

Общий случай

Используя разложение Жордана – Шевалле.

С помощью разложения Жордана – Шевалле любая матрица X с комплексными элементами может быть выражена как

Это означает, что мы можем вычислить экспоненту X , приведя к двум предыдущим случаям:

Обратите внимание, что нам нужна коммутативность A и N , чтобы последний шаг работал.

Используя каноническую форму Джордана

Близко связанный метод состоит в том , чтобы , если поле алгебраически замкнуто , работать с жордановой формой X. Предположим, что X = PJP −1 , где J — жордановая форма X. Затем

Кроме того, поскольку

Поэтому нам нужно только знать, как вычислить матричную экспоненту жорданового блока . Но каждый жорданов блок имеет вид

где N — специальная нильпотентная матрица. Тогда матричная экспонента J определяется выражением

Проекционный корпус

Если P является матрицей проекции (т.е. является идемпотентной : P 2 = P ), ее матричная экспонента равна:

е п знак равно я + ( е - 1) п .

Получая это путем разложения показательной функции, каждая степень P сводится к P , которая становится общим делителем суммы:

Случай вращения

Для простого вращения, при котором перпендикулярные единичные векторы a и b задают плоскость, [19] матрица вращения R может быть выражена через аналогичную экспоненциальную функцию, включающую генератор G и угол θ . [20] [21]

Формула для экспоненты получается в результате уменьшения степеней G при разложении в ряд и идентификации соответствующих коэффициентов ряда G 2 и G с -cos( θ ) и sin( θ ) соответственно. Второе выражение здесь для e такое же, как выражение для R ( θ ) в статье, содержащей вывод генератора , R ( θ ) = e .

В двух измерениях, если и , то , , и

Матрица P = − G 2 проецирует вектор на ab -плоскость, и вращение затрагивает только эту часть вектора. Примером, иллюстрирующим это, является поворот на 30 ° = π/6 в плоскости, охватываемой a и b ,

Пусть N = I - P , поэтому N 2 = N и его произведения на P и G равны нулю. Это позволит нам оценить мощности R .

Оценка по ряду Лорана

В силу теоремы Кэли–Гамильтона матричная экспонента выражается в виде многочлена порядка n −1.

Если P и Q t — ненулевые полиномы от одной переменной, такие, что P ( A ) = 0 , и если мероморфная функция

,
( z ) иzA.

Такой полином Q t ( z ) можно найти следующим образом — см. формулу Сильвестра . Если a является корнем P , Q a,t ( z ) решается из произведения P на главную часть ряда Лорана f в точке a : оно пропорционально соответствующему коварианту Фробениуса . Тогда сумма St Q a ,t , где a пробегает все корни P , может быть принята за конкретное Q t . Все остальные Qt будут получены добавлением кратного P к St ( z ) . В частности, S t ( z ) , полином Лагранжа-Сильвестра , является единственным Q t , степень которого меньше степени P .

Пример . Рассмотрим случай произвольной матрицы 2×2:

Матрица экспоненты e tA в силу теоремы Кэли–Гамильтона должна иметь вид

(Для любого комплексного числа z и любой C -алгебры B мы снова обозначаем через z произведение z на единицу B. )

Пусть α и β — корни характеристического многочлена A ,

Тогда у нас есть

если αβ ; в то время как, если α = β ,

так что

Определение

у нас есть

где sin( qt )/ q равно 0, если t = 0 , и t, если q = 0 .

Таким образом,

Таким образом, как указано выше, матрица А , разложившаяся на сумму двух взаимно коммутирующих частей, следового и бесследового,

матричная экспонента сводится к простому произведению экспонент двух соответствующих частей. Это формула, часто используемая в физике, поскольку она представляет собой аналог формулы Эйлера для спиновых матриц Паули , то есть вращения дублетного представления группы SU(2) .

Полиному St также можно дать следующую « интерполяционную » характеристику. Определим е т ( z ) ≡ е tz и n ≡ deg P . Тогда S t ( z ) является уникальным многочленом степени < n , который удовлетворяет условию S t ( k ) ( a ) = et ( k ) ( a ) всякий раз, когда k меньше кратности a как корня P . Мы предполагаем, как это очевидно возможно, что Pминимальный многочлен от A . Далее мы предполагаем, что Aдиагонализуемая матрица . В частности, корни P просты, а « интерполяционная » характеристика указывает на то, что S t задается интерполяционной формулой Лагранжа, поэтому это полином Лагранжа-Сильвестра .

С другой стороны, если P = ( z - a ) n , то

Самый простой случай, не охваченный приведенными выше наблюдениями, - это когда a b , что дает

Оценка путем реализации формулы Сильвестра

Практическое, ускоренное вычисление вышеизложенного сводится к следующим быстрым шагам. Напомним, что матрица exp( tA ) размера n×n представляет собой линейную комбинацию первых n -1 степеней матрицы A по теореме Кэли–Гамильтона . Для диагонализуемых матриц, как показано выше, например, в случае 2×2, формула Сильвестра дает exp( tA ) = B α exp( ) + B β exp( ) , где B s — коварианты Фробениуса A .

Однако проще всего просто решить эти B напрямую, вычислив это выражение и его первую производную при t = 0 в терминах A и I , чтобы найти тот же ответ, что и выше.

Но эта простая процедура работает и для дефектных матриц, в обобщении Бухгейма. [22] Здесь это показано на примере матрицы размером 4×4, которая не является диагонализуемой , а B не являются матрицами проекций.

Учитывать

λ 1 = 3/4λ 2 = 1

Рассмотрим экспоненту каждого собственного значения, умноженную на t , exp( λ i t ) . Умножьте каждое возведенное в степень собственное значение на соответствующую матрицу неопределенных коэффициентов B i . Если собственные значения имеют алгебраическую кратность больше 1, то повторите процесс, но теперь умножая на дополнительный коэффициент t для каждого повторения, чтобы обеспечить линейную независимость.

(Если бы одно собственное значение имело кратность три, то было бы три члена: Напротив, когда все собственные значения различны, B являются просто ковариантами Фробениуса , и решение для них, как показано ниже, просто сводится к инверсии Матрица Вандермонда этих 4 собственных значений.)

Суммируем все такие слагаемые, вот таких четыре,

Чтобы решить все неизвестные матрицы B с точки зрения первых трех степеней A и единицы, нужны четыре уравнения, причем приведенное выше дает одно такое при t = 0. Далее продифференцируйте его по t ,

и опять,

и еще раз,

(В общем случае необходимо взять n −1 производных.)

Полагая t = 0 в этих четырех уравнениях, теперь можно решить четыре матрицы коэффициентов B s:

уступать

Замена значением A дает матрицы коэффициентов

так что окончательный ответ

Процедура намного короче алгоритма Путцера, иногда используемого в таких случаях.

Иллюстрации

Предположим, что мы хотим вычислить экспоненту

Его жордановая форма :

P

Давайте сначала вычислим exp( J ). У нас есть

Экспонента матрицы 1×1 — это просто экспонента одного элемента матрицы, поэтому exp( J 1 (4)) = [ e 4 ] . Экспоненту J 2 (16) можно вычислить по формуле e I + N ) = e λ e N , упомянутой выше; это дает [23]

Следовательно, экспонента исходной матрицы B равна

Приложения

Линейные дифференциальные уравнения

Матричная экспонента имеет приложения к системам линейных дифференциальных уравнений . (См. также матричное дифференциальное уравнение .) Напомним, ранее в этой статье говорилось, что однородное дифференциальное уравнение вида

e At y (0)

Если мы рассмотрим вектор

неоднородных
анзацаe - At

Второй шаг возможен благодаря тому, что если AB = BA , то e At B = Be At . Итак, вычисление e At приводит к решению системы путем простого интегрирования третьего шага по t .

Решение этой проблемы можно получить путем интегрирования и умножения на для исключения показателя степени в LHS. Обратите внимание, что while является матрицей, учитывая, что это матричная экспонента, мы можем сказать, что . Другими словами, .

Пример (однородный)

Рассмотрим систему

Соответствующая дефектная матрица

Матричная экспонента

так что общее решение однородной системы имеет вид

в размере

Пример (неоднородный)

Рассмотрим теперь неоднородную систему

У нас снова есть

и

Ранее у нас уже было общее решение однородного уравнения. Поскольку сумма однородного и частного решений дает общее решение неоднородной задачи, нам теперь нужно найти только частное решение.

Мы имеем, как указано выше,

cy p

Обобщение неоднородного случая: изменение параметров

Для неоднородного случая можно использовать интегрирующие коэффициенты (метод, аналогичный вариации параметров ). Мы ищем частное решение вида y p ( t ) = exp( tA ) z ( t ) ,

Чтобы y p было решением,

Таким образом,

c

Точнее, рассмотрим уравнение

с начальным условием Y ( t 0 ) = Y 0 , где

Умножение показанного выше равенства слева на e -tA дает

Мы утверждаем, что решение уравнения

с начальными условиями для 0 ≤ k < n

где обозначения следующие:

s k ( t ) — коэффициентв многочлене, обозначенномв подразделе «Оценка рядами Лорана» выше.

Чтобы обосновать это утверждение, мы преобразуем наше скалярное уравнение порядка n в векторное уравнение первого порядка путем обычного сведения к системе первого порядка . Наше векторное уравнение принимает вид

Aтранспонированнаякомпаньон P.

В случае n = 2 получаем следующее утверждение. Решение

является

где функции s 0 и s 1 такие же, как в подразделе «Оценка по рядам Лорана» выше.

Матрично-матричные экспоненты

Матричная экспонента другой матрицы (матрично-матричная экспонента), [24] определяется как

нормальнойнеособойX размера n × nY размера n × n

Для матрично-матричных экспонент существует различие между левой экспонентой Y X и правой экспонентой X Y , поскольку оператор умножения для преобразования матрицы в матрицу не является коммутативным . Более того,

Смотрите также

Рекомендации

  1. ^ Холл, 2015 г., уравнение 2.1.
  2. ^ Зал 2015 г. Предложение 2.3
  3. ^ Холл, 2015 г. Теорема 2.12.
  4. ^ Холл, 2015 г., Теорема 2.11.
  5. Зал 2015, Глава 5.
  6. ^ Бхатия, Р. (1997). Матричный анализ . Тексты для аспирантов по математике. Том. 169. Спрингер. ISBN 978-0-387-94846-1.
  7. ^ Либ, Эллиот Х. (1973). «Выпуклые функции следа и гипотеза Вигнера-Янасе-Дайсона». Достижения в математике . 11 (3): 267–288. дои : 10.1016/0001-8708(73)90011-X .
  8. ^ Х. Эпштейн (1973). «Замечания к двум теоремам Э. Либа». Связь в математической физике . 31 (4): 317–325. Бибкод : 1973CMaPh..31..317E. дои : 10.1007/BF01646492. S2CID  120096681.
  9. ^ Зал 2015 г. Упражнения 2.9 и 2.10.
  10. ^ Р. М. Уилкокс (1967). «Экспоненциальные операторы и дифференцирование параметров в квантовой физике». Журнал математической физики . 8 (4): 962–982. Бибкод : 1967JMP.....8..962W. дои : 10.1063/1.1705306.
  11. ^ Холл, 2015 г., Теорема 5.4.
  12. ^ Льюис, Адриан С.; Сендов, Христо С. (2001). «Дважды дифференцируемые спектральные функции» (PDF) . Журнал SIAM по матричному анализу и приложениям . 23 (2): 368–386. дои : 10.1137/S089547980036838X.См. теорему 3.3.
  13. ^ аб Деледалль, Шарль-Альбан; Денис, Лоик; Тюпин, Флоренция (2022). «Уменьшение спеклов в матрично-логарифмической области для радиолокационных изображений с синтезированной апертурой». Журнал математического изображения и видения . 64 (3): 298–320. дои : 10.1007/s10851-022-01067-1 .См. предложения 1 и 2.
  14. ^ "Матричная экспонента - MATLAB expm - MathWorks Deutschland" . Mathworks.de. 30 апреля 2011 г. Проверено 5 июня 2013 г.
  15. ^ «GNU Octave - Функции матрицы». Network-theory.co.uk. 11 января 2007 г. Архивировано из оригинала 29 мая 2015 г. Проверено 5 июня 2013 г.
  16. ^ "R - pkg {Matrix}: Матричная экспонента" . 28 февраля 2005 г. Проверено 17 июля 2023 г.
  17. ^ "Документация по функциям scipy.linalg.expm" . Сообщество SciPy. 18 января 2015 г. Проверено 29 мая 2015 г.
  18. ^ См. Hall 2015, раздел 2.2.
  19. ^ в евклидовом пространстве
  20. ^ Вейль, Герман (1952). Пространство-время имеет значение. Дувр. п. 142. ИСБН 978-0-486-60267-7.
  21. ^ Бьоркен, Джеймс Д.; Дрелл, Сидни Д. (1964). Релятивистская квантовая механика . МакГроу-Хилл. п. 22.
  22. ^ Райнхарт, РФ (1955). «Эквивалентность определений матричной функции». Американский математический ежемесячник , 62 (6), 395–414.
  23. ^ Это можно обобщить; в общем случае экспонента J n ( a ) представляет собой верхнетреугольную матрицу с e a /0! на главной диагонали e a /1! на приведенном выше, e a /2! на следующем и так далее.
  24. ^ Игнасио Баррадас и Джоэл Э. Коэн (1994). «Итерированное возведение в степень, матричное возведение в степень и энтропия» (PDF) . Academic Press, Inc. Архивировано из оригинала (PDF) 26 июня 2009 г.

Внешние ссылки