В линейной алгебре диагональная матрица — это матрица , в которой все элементы за пределами главной диагонали равны нулю; этот термин обычно относится к квадратным матрицам . Элементы главной диагонали могут быть как нулевыми, так и ненулевыми. Примером диагональной матрицы 2×2 является , в то время как примером диагональной матрицы 3×3 является . Единичная матрица любого размера или любого кратного ей является диагональной матрицей, называемой скалярной матрицей, например, . В геометрии диагональная матрица может использоваться в качестве масштабирующей матрицы , поскольку умножение матриц на нее приводит к изменению масштаба (размера) и, возможно, также формы ; только скалярная матрица приводит к равномерному изменению масштаба.
Как указано выше, диагональная матрица — это матрица, в которой все недиагональные элементы равны нулю. То есть матрица D = ( d i , j ) с n столбцами и n строками является диагональной, если
Однако входы по главной диагонали не ограничены.
Термин «диагональная матрица» иногда может относиться кпрямоугольная диагональная матрица , которая являетсяm-на-nсо всеми элементами не вида d i , i равно нулю. Например:
Однако чаще всего диагональная матрица относится к квадратным матрицам, которые можно явно указать какКвадратно-диагональная матрица . Квадратно-диагональная матрица являетсясимметричной матрицей, поэтому ее также можно назватьсимметричная диагональная матрица .
Следующая матрица является квадратной диагональной матрицей:
Если элементы являются действительными числами или комплексными числами , то это также обычная матрица .
В оставшейся части статьи мы будем рассматривать только квадратные диагональные матрицы и называть их просто «диагональными матрицами».
Диагональную матрицу можно построить из вектора с помощью оператора:
Более компактно это можно записать как .
Этот же оператор используется для представления блочно-диагональных матриц , где каждый аргумент является матрицей.
Оператор можно записать как: где представляет собой произведение Адамара , а — постоянный вектор с элементами 1.
Оператор обратного преобразования матрицы в вектор иногда обозначается одноименным оператором , где аргументом теперь является матрица, а результатом — вектор ее диагональных элементов.
Имеет место следующее свойство:
Диагональная матрица с равными диагональными элементами является скалярной матрицей ; то есть скалярным кратным λ единичной матрицы I. Ее влияние на вектор — скалярное умножение на λ . Например, скалярная матрица 3×3 имеет вид:
Скалярные матрицы являются центром алгебры матриц: то есть, они являются именно теми матрицами, которые коммутируют со всеми другими квадратными матрицами того же размера. [a] Напротив, над полем (например, действительными числами) диагональная матрица со всеми диагональными элементами, отличными друг от друга, коммутирует только с диагональными матрицами (ее централизатор — это множество диагональных матриц). Это потому, что если диагональная матрица имеет , то заданную матрицу с членом произведений: и и (так как можно делить на ), то они не коммутируют, если только недиагональные члены не равны нулю. [b] Диагональные матрицы, где диагональные элементы не все равны или не все различны, имеют централизаторы, промежуточные между всем пространством и только диагональными матрицами. [1]
Для абстрактного векторного пространства V (а не конкретного векторного пространства ) аналогом скалярных матриц являются скалярные преобразования . Это справедливо в более общем случае для модуля M над кольцом R , при этом алгебра эндоморфизмов End( M ) (алгебра линейных операторов на M ) заменяет алгебру матриц. Формально скалярное умножение является линейным отображением, индуцирующим отображение (из скаляра λ в его соответствующее скалярное преобразование, умножение на λ ), представляющее End( M ) как R - алгебру . Для векторных пространств скалярные преобразования являются в точности центром алгебры эндоморфизмов, и, аналогично, скалярные обратимые преобразования являются центром общей линейной группы GL( V ). Первый из них в более общем случае является истинным свободным модулем , для которого алгебра эндоморфизмов изоморфна матричной алгебре.
Умножение вектора на диагональную матрицу умножает каждый из членов на соответствующую диагональную запись. При наличии диагональной матрицы и вектора произведение равно:
Это можно выразить более компактно, используя вектор вместо диагональной матрицы, и взяв произведение Адамара векторов (поэлементное произведение), обозначаемое :
Это математически эквивалентно, но позволяет избежать хранения всех нулевых членов этой разреженной матрицы . Таким образом, этот продукт используется в машинном обучении , например, для вычисления произведений производных в обратном распространении или умножения весов IDF в TF-IDF , [2] поскольку некоторые фреймворки BLAS , которые эффективно умножают матрицы, не включают возможности произведения Адамара напрямую. [3]
Операции сложения и умножения матриц особенно просты для диагональных матриц. Запишите diag( a 1 , ..., a n ) для диагональной матрицы, диагональные элементы которой, начинающиеся в верхнем левом углу, равны a 1 , ..., a n . Тогда для сложения мы имеем
и для умножения матриц ,
Диагональная матрица diag( a 1 , ..., a n ) обратима тогда и только тогда, когда элементы a 1 , ..., a n все ненулевые. В этом случае мы имеем
В частности, диагональные матрицы образуют подкольцо кольца всех матриц размера n на n .
Умножение матрицы A размером n на n слева на diag ( a 1 , ..., an ) равносильно умножению i -й строки матрицы A на a i для всех i ; умножение матрицы A справа на diag ( a 1 , ..., an ) равносильно умножению i -го столбца матрицы A на a i для всех i .
Как объяснялось при определении коэффициентов операторной матрицы , существует специальный базис, e 1 , ..., e n , для которого матрица принимает диагональную форму. Следовательно, в определяющем уравнении все коэффициенты с i ≠ j равны нулю, оставляя только один член в сумме. Оставшиеся диагональные элементы, , известны как собственные значения и обозначены в уравнении, которое сводится к . Полученное уравнение известно как уравнение собственных значений [4] и используется для вывода характеристического полинома и, далее, собственных значений и собственных векторов .
Другими словами, собственными значениями diag ( λ 1 , ..., λ n ) являются λ 1 , ..., λ n с соответствующими собственными векторами e 1 , ..., e n .
Диагональные матрицы встречаются во многих областях линейной алгебры. Из-за простого описания матричной операции и собственных значений/собственных векторов, приведенных выше, обычно желательно представлять заданную матрицу или линейную карту диагональной матрицей.
Фактически, заданная n -на- n матрица A подобна диагональной матрице ( что означает, что существует матрица X такая, что X −1 AX является диагональной) тогда и только тогда, когда она имеет n линейно независимых собственных векторов. Такие матрицы называются диагонализируемыми .
Над полем действительных или комплексных чисел верно больше. Спектральная теорема утверждает , что каждая нормальная матрица унитарно подобна диагональной матрице (если AA ∗ = A ∗ A, то существует унитарная матрица U такая, что UAU ∗ диагональна). Более того, разложение по сингулярным значениям подразумевает, что для любой матрицы A существуют унитарные матрицы U и V такие, что U ∗ AV диагональна с положительными элементами.
В теории операторов , в частности, при изучении уравнений в частных производных , операторы особенно легко понять, а уравнения в частных производных легко решить, если оператор диагонален по отношению к базису, с которым мы работаем; это соответствует разделимому уравнению в частных производных . Поэтому ключевым приемом для понимания операторов является изменение координат — на языке операторов, интегральное преобразование — которое изменяет базис на собственный базис собственных функций : что делает уравнение разделимым. Важным примером этого является преобразование Фурье , которое диагонализирует операторы дифференцирования с постоянным коэффициентом (или, в более общем смысле, инвариантные относительно трансляции операторы), такие как оператор Лапласа, скажем, в уравнении теплопроводности .
Особенно просты операторы умножения , которые определяются как умножение на (значения) фиксированной функции – значения функции в каждой точке соответствуют диагональным элементам матрицы.