Диагонализуемая матрица

В линейной алгебре квадратная матрица называется диагонализируемой или недефектной, если она подобна диагональной матрице . То есть, если существуют обратимая матрица и диагональная матрица такие, что . Это эквивалентно . (Такие , не единственны.) Это свойство существует для любого линейного отображения: для конечномерного векторного пространства линейное отображение называется диагонализуемым , если существует упорядоченный базис , состоящий из собственных векторов . Эти определения эквивалентны: если имеет матричное представление, как указано выше, то векторы-столбцы образуют базис, состоящий из собственных векторов , а диагональные элементы являются соответствующими собственными значениями ; относительно этого базиса собственных векторов представляется как . $А$ $P$ $D$ $P^{-1}AP=D$ $A=PDP^{-1}$ $P$ $D$ $V$ $T:V\to V$ $V$ $Т$ $Т$ $T=PDP^{-1}$ $P$ $Т$ $D$ $Т$ $Т$ $D$

Диагонализация — это процесс поиска вышеизложенного, который упрощает многие последующие вычисления. Можно возвести диагональную матрицу в степень, просто возведя диагональные элементы в эту степень. Определитель диагональной матрицы — это просто произведение всех диагональных элементов. Такие вычисления легко обобщаются на . $P$ $D$ $D$ $A=PDP^{-1}$

Геометрическое преобразование, представленное диагонализуемой матрицей, представляет собой неоднородное расширение (или анизотропное масштабирование ). То есть он может масштабировать пространство на разную величину в разных направлениях. Направление каждого собственного вектора масштабируется коэффициентом, заданным соответствующим собственным значением.

Квадратная матрица, не диагонализируемая, называется дефектной . Может случиться так, что матрица с действительными элементами дефектна по действительным числам, а это означает, что это невозможно для любой обратимой и диагональной матрицы с действительными элементами, но это возможно с комплексными элементами, так что это диагонализуется по комплексным числам. Например, это относится к общей матрице вращения . $А$ $A=PDP^{-1}$ $P$ $D$ $А$

Многие результаты для диагонализируемых матриц верны только над алгебраически замкнутым полем (например, над комплексными числами). В этом случае диагонализируемые матрицы плотны в пространстве всех матриц, а это означает, что любая дефектная матрица может быть деформирована в диагонализуемую матрицу небольшим возмущением ; а теорема Жордана о нормальной форме утверждает, что любая матрица является однозначно суммой диагонализуемой матрицы и нильпотентной матрицы . Над алгебраически замкнутым полем диагонализируемые матрицы эквивалентны полупростым матрицам .

Определение

Квадратная матрица , с элементами в поле , называется диагонализируемой или недефектной, если существует обратимая матрица (т.е. элемент общей линейной группы GL _n ( F )), такая, что является диагональной матрицей. Формально, $n\times n$ $А$ $F$ $n\times n$ $P$ $P^{-1}AP$

$A\in F^{n\times n}{\text{диагонализуемый}} \iff \exists \,P\in \operatorname {GL} _{n}(F):\;P^{-1 }\!AP{\text{диагональ}}$

Характеристика

Фундаментальный факт о диагонализуемых отображениях и матрицах выражается в следующем:

Матрица над полем диагонализуема тогда и только тогда, когда сумма размерностей ее собственных пространств равна , что имеет место тогда и только тогда, когда существует базис , состоящий из собственных векторов . Если такой базис был найден, можно сформировать матрицу, имеющую эти базисные векторы в качестве столбцов, и это будет диагональная матрица, диагональные элементы которой являются собственными значениями . Матрица известна как модальная матрица для . $n\times n$ $А$ $F$ $п$ $F^{n}$ $А$ $P$ $P^{-1}AP$ $А$ $P$ $А$
Линейное отображение диагонализуемо тогда и только тогда, когда сумма размерностей его собственных пространств равна , что имеет место тогда и только тогда, когда существует базис, состоящий из собственных векторов . По отношению к такому базису будет представлена диагональная матрица. Диагональные элементы этой матрицы являются собственными значениями . $T:V\to V$ ${\ displaystyle \ dim (V)}$ $V$ $Т$ $Т$ $Т$

Часто бывает полезно следующее достаточное (но не необходимое) условие.

Матрица диагонализуема по полю , если она имеет различные собственные значения в , т. е. если ее характеристический полином имеет различные корни в ; однако обратное может быть ложным. Учитывать $n\times n$ $А$ $F$ $п$ $F$ $п$ $F$ ${\begin{bmatrix}-1&3&-1\\-3&5&-1\\-3&3&1\end{bmatrix}},$ который имеет собственные значения 1, 2, 2 (не все различны ) и диагонализируем с диагональной формой ( аналогично ) $А$ ${\begin{bmatrix}1&0&0\\0&2&0\\0&0&2\end{bmatrix}}$ и изменение базовой матрицы : $P$ ${\begin{bmatrix}1&1&-1\\1&1&0\\1&0&3\end{bmatrix}}.$ Обратное не работает, если собственное пространство имеет размерность выше 1. В этом примере собственное пространство, связанное с собственным значением 2, имеет размерность 2. $А$ $А$
Линейное отображение с диагонализуемо, если оно имеет различные собственные значения, т. е. если его характеристический многочлен имеет различные корни в . $T:V\to V$ ${\ displaystyle n = \ dim (V)}$ $п$ $п$ $F$

Пусть – матрица над . Если диагонализуема, то и любая ее степень диагонализируема. И наоборот, если обратимо, алгебраически замкнуто и диагонализуемо для некоторых значений , не кратных характеристике , то диагонализуемо. Доказательство: Если диагонализуемо, то аннулируется некоторым многочленом , который не имеет кратного корня (поскольку ) и делится на минимальный многочлен . $А$ $F$ $А$ $А$ $F$ $A^{n}$ $п$ $F$ $А$ $A^{n}$ $А$ $\left(x^{n}-\lambda _{1}\right)\cdots \left(x^{n}-\lambda _{k}\right)$ $\lambda _{j}\neq 0$ $А$

В комплексных числах почти каждая матрица диагонализуема. Точнее: множество комплексных матриц, не диагонализируемых над , рассматриваемое как подмножество , имеет нулевую меру Лебега . Можно также сказать, что диагонализуемые матрицы образуют плотное подмножество относительно топологии Зариского : недиагонализируемые матрицы лежат внутри исчезающего множества дискриминанта характеристического многочлена, которое является гиперповерхностью . Отсюда следует и плотность в обычной ( сильной ) топологии, заданной нормой . То же самое не относится к . $\mathbb {C}$ $n\times n$ $\mathbb {C}$ $\mathbb {C} ^{n\times n}$ $\mathbb {R}$

Разложение Жордана – Шевалле выражает оператор как сумму его полупростой (т. е. диагонализируемой) части и нильпотентной части. Следовательно, матрица диагонализуема тогда и только тогда, когда ее нильпотентная часть равна нулю. Другими словами, матрица диагонализируема, если каждый блок в ее жордановой форме не имеет нильпотентной части; т.е. каждый «блок» представляет собой поочередную матрицу.

Диагонализация

Диагонализацию симметричной матрицы можно интерпретировать как поворот осей для выравнивания их по собственным векторам.

Если матрицу можно диагонализовать, т.е. $А$

P^{-1}AP={\begin{bmatrix}\lambda _{1}&0&\cdots &0\\0&\lambda _{2}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &\lambda _{n}\end{bmatrix}},

затем:

AP=P{\begin{bmatrix}\lambda _{1}&0&\cdots &0\\0&\lambda _{2}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\ 0&0&\cdots &\lambda _{n}\end{bmatrix}}.

Запись в виде блочной матрицы векторов-столбцов $P$ ${\boldsymbol {\alpha }}_{i}$

P={\begin{bmatrix}{\boldsymbol {\alpha }}_{1} & {\boldsymbol {\alpha }}_{2}&\cdots &{\boldsymbol {\alpha }}_{ n}\end{bmatrix}},

приведенное выше уравнение можно переписать как

A{\boldsymbol {\alpha }}_{i}=\lambda _{i}{\boldsymbol {\alpha }}_{i}\qquad (i=1,2,\dots,n).

Таким образом, векторы-столбцы являются правыми собственными векторами , а соответствующий диагональный элемент является соответствующим собственным значением . Обратимость также предполагает, что собственные векторы линейно независимы и составляют основу . Это необходимое и достаточное условие диагонализуемости и канонического подхода диагонализации. Векторы - строки являются левыми собственными векторами . $P$ $А$ $P$ $F^{n}$ $P^{-1}$ $А$

Когда комплексная матрица является эрмитовой матрицей (или, в более общем смысле, нормальной матрицей ), собственные векторы могут быть выбраны для формирования ортонормированного базиса и могут быть выбраны в качестве унитарной матрицы . Если, кроме того, является вещественной симметричной матрицей , то ее собственные векторы могут быть выбраны в качестве ортонормированного базиса и могут быть выбраны в качестве ортогональной матрицы . $A\in \mathbb {C} ^{n\times n}$ $А$ $\mathbb {C} ^{n}$ $P$ $A\in \mathbb {R} ^{n\times n}$ $\mathbb {R} ^{n}$ $P$

Для большинства практических работ матрицы диагонализируются численно с использованием компьютерного программного обеспечения. Для этого существует множество алгоритмов .

Одновременная диагонализация

Набор матриц называется одновременно диагонализируемым, если существует единственная обратимая матрица, такая что каждая матрица в наборе является диагональной . Следующая теорема характеризует одновременно диагонализируемые матрицы: множество диагонализируемых матриц коммутирует тогда и только тогда, когда это множество одновременно диагонализуемо. ^[1]^{: с.}⁶⁴ $P$ $P^{-1}AP$ $А$

Множество всех диагонализируемых матриц (над ) с не является одновременно диагонализируемым. Например, матрицы $n\times n$ $\mathbb {C}$ $n>1$

{\begin{bmatrix}1&0\\0&0\end{bmatrix}}\quad {\text{and}}\quad {\begin{bmatrix}1&1\\0&0\end{bmatrix}}

диагонализуемы, но не диагонализуемы одновременно, поскольку они не коммутируют.

Множество состоит из коммутирующих нормальных матриц тогда и только тогда, когда оно одновременно диагонализуемо унитарной матрицей ; то есть существует унитарная матрица, такая что диагональна для всех в множестве. $U$ $U^{*}AU$ $A$

На языке теории Ли набор одновременно диагонализируемых матриц порождает торическую алгебру Ли .

Примеры

Диагонализуемые матрицы

Инволюции диагонализуемы по действительным числам (да и вообще по любому полю характеристики, отличной от 2), с ±1 на диагонали.
Эндоморфизмы конечного порядка диагонализуемы над (или любым алгебраически замкнутым полем, где характеристика поля не делит порядок эндоморфизма) с корнями из единицы на диагонали. Это следует из того, что минимальный полином отделим , поскольку корни из единицы различны. $\mathbb {C}$
Проекции являются диагонализуемыми, с 0 и 1 на диагонали.
Действительные симметричные матрицы диагонализуемы ортогональными матрицами ; т.е., учитывая вещественную симметричную матрицу , является диагональной для некоторой ортогональной матрицы . В более общем смысле, матрицы диагонализуемы унитарными тогда и только тогда, когда они нормальны . В случае вещественной симметричной матрицы мы видим, что , так что очевидно, выполняется. Примерами нормальных матриц являются вещественные симметричные (или кососимметричные ) матрицы (например, ковариационные матрицы) и эрмитовые матрицы (или косоэрмитовые матрицы). См. спектральные теоремы для обобщений на бесконечномерные векторные пространства. $A$ $Q^{\mathrm {T} }AQ$ $Q$ $A=A^{\mathrm {T} }$ $AA^{\mathrm {T} }=A^{\mathrm {T} }A$

Матрицы, недиагонализуемые

В общем, матрица вращения не диагонализируема по действительным числам, но все матрицы вращения диагонализуемы по комплексному полю. Даже если матрица недиагонализуема, всегда можно «сделать все возможное» и найти матрицу с теми же свойствами, состоящую из собственных значений на главной диагонали и единиц или нулей на супердиагонали, известную как жорданова нормаль. форма .

Некоторые матрицы не диагонализуемы ни в каком поле, особенно ненулевые нильпотентные матрицы . В более общем случае это происходит, если алгебраическая и геометрическая кратности собственного значения не совпадают. Например, рассмотрим

C={\begin{bmatrix}0&1\\0&0\end{bmatrix}}.

Эта матрица недиагонализуема: не существует матрицы, которая была бы диагональной. Действительно, имеет одно собственное значение (а именно ноль), и это собственное значение имеет алгебраическую кратность 2 и геометрическую кратность 1. $U$ $U^{-1}CU$ $C$

Некоторые действительные матрицы не диагонализуемы по действительным числам. Рассмотрим, например, матрицу

B=\left[{\begin{array}{rr}0&1\\\!-1&0\end{array}}\right].

Матрица не имеет действительных собственных значений, поэтому не существует такой действительной матрицы , которая была бы диагональной матрицей. Однако мы можем провести диагонализацию, если допустим комплексные числа. Действительно, если мы возьмем $B$ $Q$ $Q^{-1}BQ$ $B$

Q={\begin{bmatrix}1&i\\i&1\end{bmatrix}},

тогда диагональ. Легко найти, что это матрица вращения, которая вращается против часовой стрелки на угол $Q^{-1}BQ$ $B$ ${\textstyle \theta =-{\frac {\pi }{2}}}$

Обратите внимание, что приведенные выше примеры показывают, что сумма диагонализуемых матриц не обязательно должна быть диагонализуемой.

Как диагонализировать матрицу

Диагонализация матрицы — это тот же процесс, что и нахождение ее собственных значений и собственных векторов , в случае, если собственные векторы образуют базис. Например, рассмотрим матрицу

A=\left[{\begin{array}{rrr}0&1&\!\!\!-2\\0&1&0\\1&\!\!\!-1&3\end{array}}\right].

Корнями характеристического многочлена являются собственные значения . Решение линейной системы дает собственные векторы и , а дает ; то есть для . Эти векторы образуют основу , поэтому мы можем собрать их как векторы-столбцы матрицы изменения базиса , чтобы получить: $p(\lambda )=\det(\lambda I-A)$ $\lambda _{1}=1,\lambda _{2}=1,\lambda _{3}=2$ $\left(I-A\right)\mathbf {v} =\mathbf {0}$ $\mathbf {v} _{1}=(1,1,0)$ $\mathbf {v} _{2}=(0,2,1)$ $\left(2I-A\right)\mathbf {v} =\mathbf {0}$ $\mathbf {v} _{3}=(1,0,-1)$ $A\mathbf {v} _{i}=\lambda _{i}\mathbf {v} _{i}$ $i=1,2,3$ $V=\mathbb {R} ^{3}$ $P$

P^{-1}AP=\left[{\begin{array}{rrr}1&0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]^{-1}\left[{\begin{array}{rrr}0&1&\!\!\!-2\\0&1&0\\1&\!\!\!-1&3\end{array}}\right]\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]={\begin{bmatrix}1&0&0\\0&1&0\\0&0&2\end{bmatrix}}=D.

поэтому

P

P\mathbf {e} _{i}=\mathbf {v} _{i}

P^{-1}AP\mathbf {e} _{i}=P^{-1}A\mathbf {v} _{i}=P^{-1}(\lambda _{i}\mathbf {v} _{i})=\lambda _{i}\mathbf {e} _{i},

P^{-1}AP

D

Обратите внимание, что не существует предпочтительного порядка собственных векторов в ; изменение порядка собственных векторов просто меняет порядок собственных значений в диагонализованной форме . ^[2] $P$ $P$ $A$

Приложение к матричным функциям

Диагонализацию можно использовать для эффективного вычисления степеней матрицы : $A=PDP^{-1}$

{\begin{aligned}A^{k}&=\left(PDP^{-1}\right)^{k}=\left(PDP^{-1}\right)\left(PDP^{-1}\right)\cdots \left(PDP^{-1}\right)\\&=PD\left(P^{-1}P\right)D\left(P^{-1}P\right)\cdots \left(P^{-1}P\right)DP^{-1}=PD^{k}P^{-1},\end{aligned}}

а последнее легко вычислить, поскольку оно включает только степени диагональной матрицы. Например, для матрицы с собственными значениями в приведенном выше примере мы вычисляем: $A$ $\lambda =1,1,2$

{\begin{aligned}A^{k}=PD^{k}P^{-1}&=\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]{\begin{bmatrix}1^{k}&0&0\\0&1^{k}&0\\0&0&2^{k}\end{bmatrix}}\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]^{-1}\\[1em]&={\begin{bmatrix}2-2^{k}&-1+2^{k}&2-2^{k+1}\\0&1&0\\-1+2^{k}&1-2^{k}&-1+2^{k+1}\end{bmatrix}}.\end{aligned}}

Этот подход можно обобщить на матричную экспоненту и другие матричные функции , которые можно определить как степенные ряды. Например, определяя , мы имеем: ${\textstyle \exp(A)=I+A+{\frac {1}{2!}}A^{2}+{\frac {1}{3!}}A^{3}+\cdots }$

{\begin{aligned}\exp(A)=P\exp(D)P^{-1}&=\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]{\begin{bmatrix}e^{1}&0&0\\0&e^{1}&0\\0&0&e^{2}\end{bmatrix}}\left[{\begin{array}{rrr}1&\,0&1\\1&2&0\\0&1&\!\!\!\!-1\end{array}}\right]^{-1}\\[1em]&={\begin{bmatrix}2e-e^{2}&-e+e^{2}&2e-2e^{2}\\0&e&0\\-e+e^{2}&e-e^{2}&-e+2e^{2}\end{bmatrix}}.\end{aligned}}

Это особенно полезно при поиске выражений в замкнутой форме для членов линейных рекурсивных последовательностей , таких как числа Фибоначчи .

Особое применение

Например, рассмотрим следующую матрицу:

M={\begin{bmatrix}a&b-a\\0&b\end{bmatrix}}.

Вычисление различных степеней обнаруживает удивительную закономерность: $M$

M^{2}={\begin{bmatrix}a^{2}&b^{2}-a^{2}\\0&b^{2}\end{bmatrix}},\quad M^{3}={\begin{bmatrix}a^{3}&b^{3}-a^{3}\\0&b^{3}\end{bmatrix}},\quad M^{4}={\begin{bmatrix}a^{4}&b^{4}-a^{4}\\0&b^{4}\end{bmatrix}},\quad \ldots

Вышеописанное явление можно объяснить диагонализацией . Для этого нам понадобится базис, состоящий из собственных векторов . Один из таких базисов собственных векторов определяется выражением $M$ $\mathbb {R} ^{2}$ $M$

\mathbf {u} ={\begin{bmatrix}1\\0\end{bmatrix}}=\mathbf {e} _{1},\quad \mathbf {v} ={\begin{bmatrix}1\\1\end{bmatrix}}=\mathbf {e} _{1}+\mathbf {e} _{2},

где e _i обозначает стандартный базис R ⁿ . Обратная замена базиса определяется выражением

\mathbf {e} _{1}=\mathbf {u} ,\qquad \mathbf {e} _{2}=\mathbf {v} -\mathbf {u} .

Непосредственные расчеты показывают, что

M\mathbf {u} =a\mathbf {u} ,\qquad M\mathbf {v} =b\mathbf {v} .

Таким образом, a и b — собственные значения, соответствующие u и v соответственно. Ввиду линейности умножения матриц имеем, что

M^{n}\mathbf {u} =a^{n}\mathbf {u} ,\qquad M^{n}\mathbf {v} =b^{n}\mathbf {v} .

Возвращаясь к стандартной основе, мы имеем

{\begin{aligned}M^{n}\mathbf {e} _{1}&=M^{n}\mathbf {u} =a^{n}\mathbf {e} _{1},\\M^{n}\mathbf {e} _{2}&=M^{n}\left(\mathbf {v} -\mathbf {u} \right)=b^{n}\mathbf {v} -a^{n}\mathbf {u} =\left(b^{n}-a^{n}\right)\mathbf {e} _{1}+b^{n}\mathbf {e} _{2}.\end{aligned}}

Предыдущие соотношения, выраженные в матричной форме, имеют вид

M^{n}={\begin{bmatrix}a^{n}&b^{n}-a^{n}\\0&b^{n}\end{bmatrix}},

тем самым объясняя вышеупомянутое явление.

Квантово-механическое применение

В квантово-механических и квантово-химических расчетах диагонализация матрицы является одним из наиболее часто применяемых численных процессов. Основная причина заключается в том, что независимое от времени уравнение Шредингера является уравнением собственных значений, хотя в большинстве физических ситуаций в бесконечномерном гильбертовом пространстве .

Очень распространенным приближением является усечение гильбертова пространства до конечной размерности, после чего уравнение Шредингера можно сформулировать как проблему собственных значений вещественной симметричной или комплексной эрмитовой матрицы. Формально это приближение основано на вариационном принципе , справедливом для ограниченных снизу гамильтонианов.

Теория возмущений первого порядка также приводит к матричной проблеме собственных значений для вырожденных состояний.

Смотрите также

Дефектная матрица
Масштабирование (геометрия)
Треугольная матрица
Полупростой оператор
Диагонализуемая группа
Джордан в нормальной форме
Весовой модуль – обобщение ассоциативной алгебры
Ортогональная диагонализация