Матричная операция, обобщающая возведение в степень скалярных чисел
В математике матричная экспонента — это матричная функция на квадратных матрицах , аналогичная обычной экспоненциальной функции . Он используется для решения систем линейных дифференциальных уравнений. В теории групп Ли матричная экспонента дает экспоненциальное отображение между матричной алгеброй Ли и соответствующей группой Ли .
Пусть X — действительная или комплексная матрица размера n × n . Экспонента X , обозначаемая e X или exp( X ) , представляет собой матрицу размера n × n , заданную степенным рядом
где определяется как единичная матрица тех же размеров, что и . [1] Ряд всегда сходится, поэтому экспонента X четко определена.
Эквивалентно,
Iединичная матрица размера n × nКогда X является диагональной матрицей размера n × n, тогда exp( X ) будет диагональной матрицей размера n × n , где каждый диагональный элемент равен обычной экспоненте , примененной к соответствующему диагональному элементу X .
Характеристики
Элементарные свойства
Пусть X и Y — комплексные матрицы размера n × n , а a и b — произвольные комплексные числа. Обозначим единичную матрицу размера n × n через I , а нулевую матрицу через 0. Матричная экспонента удовлетворяет следующим свойствам. [2]
Начнем со свойств, которые являются непосредственными следствиями определения степенного ряда:
Следующий ключевой результат таков:
- Если тогда .
Доказательство этого тождества такое же, как и стандартное доказательство степенного ряда для соответствующего тождества для экспоненты действительных чисел. То есть, пока и коммутируют , для аргумента не имеет значения, являются ли и числами или матрицами. Важно отметить, что это тождество обычно не выполняется, если и не коммутировать (см. неравенство Голдена-Томпсона ниже).
Следствия предыдущего тождества следующие:
- е aX е bX знак равно е ( а + б ) Икс
- е X е - X = я
Используя приведенные выше результаты, мы можем легко проверить следующие утверждения. Если X симметричен , то e X также симметричен, а если X кососимметричен , то e X ортогонален . Если X эрмитово , то e X также эрмитово, а если X косоэрмитово , то e X унитарно .
Наконец, преобразование Лапласа матричных экспонент сводится к резольвенте ,
sСистемы линейных дифференциальных уравнений
Одной из причин важности матричной экспоненты является то, что ее можно использовать для решения систем линейных обыкновенных дифференциальных уравнений . Решение
AМатричную экспоненту можно использовать и для решения неоднородного уравнения
Для дифференциальных уравнений вида не существует решения в замкнутой форме
Aряд МагнусаОпределитель матричной экспоненты
По формуле Якоби для любой комплексной квадратной матрицы справедливо следующее тождество следа : [3]
Эта формула не только предоставляет вычислительный инструмент, но и демонстрирует, что матричная экспонента всегда является обратимой матрицей . Это следует из того факта, что правая часть приведенного выше уравнения всегда отлична от нуля, и поэтому det( e A ) ≠ 0 , из чего следует, что e A должна быть обратимой.
В действительном случае формула также отображает карту
сюръективнымДействительные симметричные матрицы
Матричная экспонента вещественной симметричной матрицы положительно определена. Пусть — вещественная симметричная матрица размера n × n и вектор-столбец. Используя элементарные свойства матричной экспоненты и симметричных матриц, имеем:
Поскольку обратимо, равенство справедливо только для , и мы имеем для всех ненулевых . Следовательно , положительно определено.
Экспонента сумм
Для любых действительных чисел (скаляров) x и y мы знаем, что экспоненциальная функция удовлетворяет условию e x + y = e x e y . То же самое справедливо и для коммутирующих матриц. Если матрицы X и Y коммутируют (это означает, что XY = YX ), то
Однако для матриц, которые не коммутируют, приведенное выше равенство не обязательно выполняется.
Формула произведения Ли
Даже если X и Y не коммутируют, экспоненту e X + Y можно вычислить по формуле произведения Ли [4]
Использование большого конечного k для аппроксимации вышеизложенного является основой расширения Сузуки-Троттера, часто используемого в числовой эволюции во времени .
Формула Бейкера-Кэмпбелла-Хаусдорфа.
В другом направлении, если X и Y — достаточно малые (но не обязательно коммутирующие) матрицы, мы имеем
ZX
исформулы Бейкера – Кэмпбелла – Хаусдорфа[5] XY.XYZ = X + Y.Неравенства для экспонент эрмитовых матриц
Для эрмитовых матриц существует примечательная теорема, связанная со следом матричных экспонент.
Если A и B — эрмитовые матрицы, то [6]
Требование коммутативности отсутствует. Существуют контрпримеры, показывающие, что неравенство Голдена-Томпсона не может быть распространено на три матрицы – и, в любом случае, tr(exp( A )exp( B )exp( C )) не гарантированно вещественен для эрмитовых A , B , С . Однако Либ доказал [7] [8] , что его можно обобщить на три матрицы, если мы изменим выражение следующим образом:
Экспоненциальная карта
Экспонента матрицы всегда является обратимой матрицей . Обратная матрица e X определяется как e − X . Это аналогично тому факту, что экспонента комплексного числа всегда отлична от нуля. Затем матричная экспонента дает нам карту
nnобщую линейную группуnгруппуразмера nnсюръективно[9]C , а не RДля любых двух матриц X и Y ,
где ‖ · ‖ обозначает произвольную матричную норму . Отсюда следует , что экспоненциальное отображение непрерывно и липшицево непрерывно на компактных подмножествах Mn ( C ) .
Карта
гладкуюt = 0Фактически это дает однопараметрическую подгруппу полной линейной группы, поскольку
Производная этой кривой (или касательного вектора ) в точке t определяется выражением
Производная при t = 0 — это просто матрица X , то есть X порождает эту однопараметрическую подгруппу.
В более общем смысле, [10] для общего t -зависимого показателя X ( t ) ,
Вынеся приведенное выше выражение e X ( t ) за знак интеграла и расширив подынтегральную функцию с помощью леммы Адамара , можно получить следующее полезное выражение для производной матричного показателя степени: [11]
Коэффициенты в приведенном выше выражении отличаются от тех, которые появляются в экспоненте. Для замкнутой формы см. производную экспоненциального отображения .
Производные по направлению при ограничении эрмитовыми матрицами
Пусть – эрмитова матрица с различными собственными значениями. Пусть – его собственное разложение где – унитарная матрица, столбцы которой являются собственными векторами матрицы , – ее сопряженное транспонирование и вектор соответствующих собственных значений. Тогда для любой эрмитовой матрицы производная от at по направлению равна [12] [13]
[13]Вычисление матричной экспоненты
Найти надежные и точные методы вычисления матричной экспоненты сложно, и это все еще является темой серьезных текущих исследований в области математики и численного анализа. Matlab , GNU Octave , R и SciPy используют аппроксимант Паде . [14] [15] [16] [17] В этом разделе мы обсуждаем методы, которые в принципе применимы к любой матрице и которые можно явно реализовать для малых матриц. [18] В последующих разделах описываются методы, подходящие для численного оценивания больших матриц.
Диагонализуемый корпус
Если матрица диагональная :
Этот результат также позволяет возводить в степень диагонализуемые матрицы . Если
А = УДУ -1
и D диагональ, то
е А знак равно Ue D U -1 .
Применение формулы Сильвестра дает тот же результат. (Чтобы убедиться в этом, заметим, что сложение и умножение, а, следовательно, и возведение в степень, диагональных матриц эквивалентно поэлементному сложению и умножению и, следовательно, возведению в степень; в частности, «одномерное» возведение в степень ощущается поэлементно для диагонали. случай.)
Пример: Диагонализуемый
Например, матрица
Таким образом,
Нильпотентный случай
Матрица N нильпотентна , если N q = 0 для некоторого целого числа q . В этом случае матричную экспоненту e N можно вычислить непосредственно из разложения в ряд, поскольку ряд заканчивается после конечного числа членов:
Поскольку ряд имеет конечное число шагов, он представляет собой матричный полином, который можно эффективно вычислить .
Общий случай
Используя разложение Жордана – Шевалле.
С помощью разложения Жордана – Шевалле любая матрица X с комплексными элементами может быть выражена как
- A диагонализуема
- N нильпотентен
- A ездит с N
Это означает, что мы можем вычислить экспоненту X , приведя к двум предыдущим случаям:
Обратите внимание, что нам нужна коммутативность A и N , чтобы последний шаг работал.
Используя каноническую форму Джордана
Близко связанный метод состоит в том , чтобы , если поле алгебраически замкнуто , работать с жордановой формой X. Предположим, что X = PJP −1 , где J — жордановая форма X. Затем
Кроме того, поскольку
Поэтому нам нужно только знать, как вычислить матричную экспоненту жорданового блока . Но каждый жорданов блок имеет вид
где N — специальная нильпотентная матрица. Тогда матричная экспонента J определяется выражением
Проекционный корпус
Если P является матрицей проекции (т.е. является идемпотентной : P 2 = P ), ее матричная экспонента равна:
е п знак равно я + ( е - 1) п .
Получая это путем разложения показательной функции, каждая степень P сводится к P , которая становится общим делителем суммы:
Случай вращения
Для простого вращения, при котором перпендикулярные единичные векторы a и b задают плоскость, [19] матрица вращения R может быть выражена через аналогичную экспоненциальную функцию, включающую генератор G и угол θ . [20] [21]
Формула для экспоненты получается в результате уменьшения степеней G при разложении в ряд и идентификации соответствующих коэффициентов ряда G 2 и G с -cos( θ ) и sin( θ ) соответственно. Второе выражение здесь для e Gθ такое же, как выражение для R ( θ ) в статье, содержащей вывод генератора , R ( θ ) = e Gθ .
В двух измерениях, если и , то , , и
Матрица P = − G 2 проецирует вектор на ab -плоскость, и вращение затрагивает только эту часть вектора. Примером, иллюстрирующим это, является поворот на 30 ° = π/6 в плоскости, охватываемой a и b ,
Пусть N = I - P , поэтому N 2 = N и его произведения на P и G равны нулю. Это позволит нам оценить мощности R .
Оценка по ряду Лорана
В силу теоремы Кэли–Гамильтона матричная экспонента выражается в виде многочлена порядка n −1.
Если P и Q t — ненулевые полиномы от одной переменной, такие, что P ( A ) = 0 , и если мероморфная функция
,
( z ) иzA.Такой полином Q t ( z ) можно найти следующим образом — см. формулу Сильвестра . Если a является корнем P , Q a,t ( z ) решается из произведения P на главную часть ряда Лорана f в точке a : оно пропорционально соответствующему коварианту Фробениуса . Тогда сумма St Q a ,t , где a пробегает все корни P , может быть принята за конкретное Q t . Все остальные Qt будут получены добавлением кратного P к St ( z ) . В частности, S t ( z ) , полином Лагранжа-Сильвестра , является единственным Q t , степень которого меньше степени P .
Пример . Рассмотрим случай произвольной матрицы 2×2:
Матрица экспоненты e tA в силу теоремы Кэли–Гамильтона должна иметь вид
(Для любого комплексного числа z и любой C -алгебры B мы снова обозначаем через z произведение z на единицу B. )
Пусть α и β — корни характеристического многочлена A ,
Тогда у нас есть
если α ≠ β ; в то время как, если α = β ,
так что
Определение
у нас есть
где sin( qt )/ q равно 0, если t = 0 , и t, если q = 0 .
Таким образом,
Таким образом, как указано выше, матрица А , разложившаяся на сумму двух взаимно коммутирующих частей, следового и бесследового,
матричная экспонента сводится к простому произведению экспонент двух соответствующих частей. Это формула, часто используемая в физике, поскольку она представляет собой аналог формулы Эйлера для спиновых матриц Паули , то есть вращения дублетного представления группы SU(2) .
Полиному St также можно дать следующую « интерполяционную » характеристику. Определим е т ( z ) ≡ е tz и n ≡ deg P . Тогда S t ( z ) является уникальным многочленом степени < n , который удовлетворяет условию S t ( k ) ( a ) = et ( k ) ( a ) всякий раз, когда k меньше кратности a как корня P . Мы предполагаем, как это очевидно возможно, что P — минимальный многочлен от A . Далее мы предполагаем, что A — диагонализуемая матрица . В частности, корни P просты, а « интерполяционная » характеристика указывает на то, что S t задается интерполяционной формулой Лагранжа, поэтому это полином Лагранжа-Сильвестра .
С другой стороны, если P = ( z - a ) n , то
Самый простой случай, не охваченный приведенными выше наблюдениями, - это когда a ≠ b , что дает
Оценка путем реализации формулы Сильвестра
Практическое, ускоренное вычисление вышеизложенного сводится к следующим быстрым шагам. Напомним, что матрица exp( tA ) размера n×n представляет собой линейную комбинацию первых n -1 степеней матрицы A по теореме Кэли–Гамильтона . Для диагонализуемых матриц, как показано выше, например, в случае 2×2, формула Сильвестра дает exp( tA ) = B α exp( tα ) + B β exp( tβ ) , где B s — коварианты Фробениуса A .
Однако проще всего просто решить эти B напрямую, вычислив это выражение и его первую производную при t = 0 в терминах A и I , чтобы найти тот же ответ, что и выше.
Но эта простая процедура работает и для дефектных матриц, в обобщении Бухгейма. [22] Здесь это показано на примере матрицы размером 4×4, которая не является диагонализуемой , а B не являются матрицами проекций.
Учитывать
λ 1 = 3/4λ 2 = 1Рассмотрим экспоненту каждого собственного значения, умноженную на t , exp( λ i t ) . Умножьте каждое возведенное в степень собственное значение на соответствующую матрицу неопределенных коэффициентов B i . Если собственные значения имеют алгебраическую кратность больше 1, то повторите процесс, но теперь умножая на дополнительный коэффициент t для каждого повторения, чтобы обеспечить линейную независимость.
(Если бы одно собственное значение имело кратность три, то было бы три члена: Напротив, когда все собственные значения различны, B являются просто ковариантами Фробениуса , и решение для них, как показано ниже, просто сводится к инверсии Матрица Вандермонда этих 4 собственных значений.)
Суммируем все такие слагаемые, вот таких четыре,
Чтобы решить все неизвестные матрицы B с точки зрения первых трех степеней A и единицы, нужны четыре уравнения, причем приведенное выше дает одно такое при t = 0. Далее продифференцируйте его по t ,
и опять,
и еще раз,
(В общем случае необходимо взять n −1 производных.)
Полагая t = 0 в этих четырех уравнениях, теперь можно решить четыре матрицы коэффициентов B s:
уступать
Замена значением A дает матрицы коэффициентов
так что окончательный ответ
Процедура намного короче алгоритма Путцера, иногда используемого в таких случаях.
Иллюстрации
Предположим, что мы хотим вычислить экспоненту
Его жордановая форма :
PДавайте сначала вычислим exp( J ). У нас есть
Экспонента матрицы 1×1 — это просто экспонента одного элемента матрицы, поэтому exp( J 1 (4)) = [ e 4 ] . Экспоненту J 2 (16) можно вычислить по формуле e (λ I + N ) = e λ e N , упомянутой выше; это дает [23]
Следовательно, экспонента исходной матрицы B равна
Приложения
Линейные дифференциальные уравнения
Матричная экспонента имеет приложения к системам линейных дифференциальных уравнений . (См. также матричное дифференциальное уравнение .) Напомним, ранее в этой статье говорилось, что однородное дифференциальное уравнение вида
e At y (0)Если мы рассмотрим вектор
неоднородных анзацаe - AtВторой шаг возможен благодаря тому, что если AB = BA , то e At B = Be At . Итак, вычисление e At приводит к решению системы путем простого интегрирования третьего шага по t .
Решение этой проблемы можно получить путем интегрирования и умножения на для исключения показателя степени в LHS. Обратите внимание, что while является матрицей, учитывая, что это матричная экспонента, мы можем сказать, что . Другими словами, .
Пример (однородный)
Рассмотрим систему
Соответствующая дефектная матрица
Матричная экспонента
так что общее решение однородной системы имеет вид
в размере
Пример (неоднородный)
Рассмотрим теперь неоднородную систему
У нас снова есть
и
Ранее у нас уже было общее решение однородного уравнения. Поскольку сумма однородного и частного решений дает общее решение неоднородной задачи, нам теперь нужно найти только частное решение.
Мы имеем, как указано выше,
cy pОбобщение неоднородного случая: изменение параметров
Для неоднородного случая можно использовать интегрирующие коэффициенты (метод, аналогичный вариации параметров ). Мы ищем частное решение вида y p ( t ) = exp( tA ) z ( t ) ,
Чтобы y p было решением,
Таким образом,
cТочнее, рассмотрим уравнение
с начальным условием Y ( t 0 ) = Y 0 , где
- A - комплексная матрица размера n на n ,
- F — непрерывная функция из некоторого открытого интервала I до Cn ,
- это точка Я , и
- является вектором C n .
Умножение показанного выше равенства слева на e -tA дает
Мы утверждаем, что решение уравнения
с начальными условиями для 0 ≤ k < n
где обозначения следующие:
- — монический полином степени n > 0 ,
- f — непрерывная комплекснозначная функция, определенная на некотором открытом интервале I ,
- это точка Я ,
- является комплексным числом, и
s k ( t ) — коэффициентв многочлене, обозначенномв подразделе «Оценка рядами Лорана» выше.
Чтобы обосновать это утверждение, мы преобразуем наше скалярное уравнение порядка n в векторное уравнение первого порядка путем обычного сведения к системе первого порядка . Наше векторное уравнение принимает вид
Aтранспонированнаякомпаньон P.В случае n = 2 получаем следующее утверждение. Решение
является
где функции s 0 и s 1 такие же, как в подразделе «Оценка по рядам Лорана» выше.
Матрично-матричные экспоненты
Матричная экспонента другой матрицы (матрично-матричная экспонента), [24] определяется как
нормальнойнеособойX размера n × nY размера n × nДля матрично-матричных экспонент существует различие между левой экспонентой Y X и правой экспонентой X Y , поскольку оператор умножения для преобразования матрицы в матрицу не является коммутативным . Более того,
- Если X нормальный и неособый, то X Y и Y X имеют одинаковый набор собственных значений.
- Если X нормальный и неособый, Y нормальный и XY = YX , то X Y = Y X.
- Если X нормально и неособо, и X , Y , Z коммутируют друг с другом, то X Y + Z = X Y · X Z и Y + Z X = Y X · Z X .
Смотрите также
Рекомендации
- ^ Холл, 2015 г., уравнение 2.1.
- ^ Зал 2015 г. Предложение 2.3
- ^ Холл, 2015 г. Теорема 2.12.
- ^ Холл, 2015 г., Теорема 2.11.
- ↑ Зал 2015, Глава 5.
- ^ Бхатия, Р. (1997). Матричный анализ . Тексты для аспирантов по математике. Том. 169. Спрингер. ISBN 978-0-387-94846-1.
- ^ Либ, Эллиот Х. (1973). «Выпуклые функции следа и гипотеза Вигнера-Янасе-Дайсона». Достижения в математике . 11 (3): 267–288. дои : 10.1016/0001-8708(73)90011-X .
- ^ Х. Эпштейн (1973). «Замечания к двум теоремам Э. Либа». Связь в математической физике . 31 (4): 317–325. Бибкод : 1973CMaPh..31..317E. дои : 10.1007/BF01646492. S2CID 120096681.
- ^ Зал 2015 г. Упражнения 2.9 и 2.10.
- ^ Р. М. Уилкокс (1967). «Экспоненциальные операторы и дифференцирование параметров в квантовой физике». Журнал математической физики . 8 (4): 962–982. Бибкод : 1967JMP.....8..962W. дои : 10.1063/1.1705306.
- ^ Холл, 2015 г., Теорема 5.4.
- ^ Льюис, Адриан С.; Сендов, Христо С. (2001). «Дважды дифференцируемые спектральные функции» (PDF) . Журнал SIAM по матричному анализу и приложениям . 23 (2): 368–386. дои : 10.1137/S089547980036838X.См. теорему 3.3.
- ^ аб Деледалль, Шарль-Альбан; Денис, Лоик; Тюпин, Флоренция (2022). «Уменьшение спеклов в матрично-логарифмической области для радиолокационных изображений с синтезированной апертурой». Журнал математического изображения и видения . 64 (3): 298–320. дои : 10.1007/s10851-022-01067-1 .См. предложения 1 и 2.
- ^ "Матричная экспонента - MATLAB expm - MathWorks Deutschland" . Mathworks.de. 30 апреля 2011 г. Проверено 5 июня 2013 г.
- ^ «GNU Octave - Функции матрицы». Network-theory.co.uk. 11 января 2007 г. Архивировано из оригинала 29 мая 2015 г. Проверено 5 июня 2013 г.
- ^ "R - pkg {Matrix}: Матричная экспонента" . 28 февраля 2005 г. Проверено 17 июля 2023 г.
- ^ "Документация по функциям scipy.linalg.expm" . Сообщество SciPy. 18 января 2015 г. Проверено 29 мая 2015 г.
- ^ См. Hall 2015, раздел 2.2.
- ^ в евклидовом пространстве
- ^ Вейль, Герман (1952). Пространство-время имеет значение. Дувр. п. 142. ИСБН 978-0-486-60267-7.
- ^ Бьоркен, Джеймс Д.; Дрелл, Сидни Д. (1964). Релятивистская квантовая механика . МакГроу-Хилл. п. 22.
- ^ Райнхарт, РФ (1955). «Эквивалентность определений матричной функции». Американский математический ежемесячник , 62 (6), 395–414.
- ^ Это можно обобщить; в общем случае экспонента J n ( a ) представляет собой верхнетреугольную матрицу с e a /0! на главной диагонали e a /1! на приведенном выше, e a /2! на следующем и так далее.
- ^ Игнасио Баррадас и Джоэл Э. Коэн (1994). «Итерированное возведение в степень, матричное возведение в степень и энтропия» (PDF) . Academic Press, Inc. Архивировано из оригинала (PDF) 26 июня 2009 г.
- Холл, Брайан К. (2015), Группы Ли, алгебры Ли и представления: элементарное введение , Тексты для выпускников по математике, том. 222 (2-е изд.), Спрингер, ISBN 978-3-319-13466-6
- Хорн, Роджер А.; Джонсон, Чарльз Р. (1991). Темы матричного анализа . Издательство Кембриджского университета . ISBN 978-0-521-46713-1..
- Молер, Клив ; Ван Лоан, Чарльз Ф. (2003). «Девятнадцать сомнительных способов вычисления экспоненты матрицы, двадцать пять лет спустя» (PDF) . Обзор СИАМ . 45 (1): 3–49. Бибкод : 2003SIAMR..45....3M. CiteSeerX 10.1.1.129.9283 . дои : 10.1137/S00361445024180. ISSN 1095-7200..
- Сузуки, Масуо (1985). «Формулы разложения экспоненциальных операторов и экспонент Лия с некоторыми приложениями к квантовой механике и статистической физике». Журнал математической физики . 26 (4): 601–612. Бибкод : 1985JMP....26..601S. дои : 10.1063/1.526596.
- Куртрайт, ТЛ ; Фэрли, Д.Б. ; Захос, СК (2014). «Компактная формула для вращений как полиномов матрицы спина». Симметрия, интегрируемость и геометрия: методы и приложения . 10 : 084.arXiv : 1402.3541 . Бибкод : 2014SIGMA..10..084C. дои : 10.3842/SIGMA.2014.084. S2CID 18776942.
- Домовладелец, Олстон С. (2006). Теория матриц в численном анализе . Дуврские книги по математике. ISBN 978-0-486-44972-2.
- Ван Кортрик, ТС (2016). «Матричные экспоненты, элементы группы SU (N) и действительные полиномиальные корни». Журнал математической физики . 57 (2): 021701. arXiv : 1508.05859 . Бибкод : 2016JMP....57b1701V. дои : 10.1063/1.4938418. S2CID 119647937.
Внешние ссылки