stringtranslate.com

Диагональная матрица

В линейной алгебре диагональная матрица — это матрица , в которой все элементы за пределами главной диагонали равны нулю; этот термин обычно относится к квадратным матрицам . Элементы главной диагонали могут быть нулевыми или ненулевыми. Примером диагональной матрицы 2×2 является , а примером диагональной матрицы 3×3 – . Единичная матрица любого размера или любого кратного ему размера представляет собой диагональную матрицу, называемую скалярной матрицей, например . В геометрии диагональная матрица может использоваться как матрица масштабирования , поскольку умножение матрицы на нее приводит к изменению масштаба (размера) и, возможно, также формы ; только скалярная матрица приводит к равномерному изменению масштаба.

Определение

Как указано выше, диагональная матрица — это матрица, в которой все недиагональные элементы равны нулю. То есть матрица D = ( d i , j ) с n столбцами и n строками является диагональной, если

Однако основные диагональные входы не ограничены.

Термин «диагональная матрица» иногда может относиться кпрямоугольная диагональная матрица , которая представляет собойразмеромmnсо всеми элементами, отличными от формы d i , i равным нулю. Например:

Однако чаще диагональная матрица относится к квадратным матрицам, которые можно явно указать какквадратная диагональная матрица . Квадратная диагональная матрица являетсясимметричной матрицей, поэтому ее также можно назватьсимметричная диагональная матрица .

Следующая матрица является квадратной диагональной матрицей:

Если записи представляют собой действительные числа или комплексные числа , то это также нормальная матрица .

В оставшейся части этой статьи мы будем рассматривать только квадратные диагональные матрицы и называть их просто «диагональными матрицами».

Оператор преобразования вектора в матрицу

Диагональную матрицу можно построить из вектора с помощью оператора:

Более компактно это можно записать как .

Тот же оператор также используется для представления блочных диагональных матриц , где каждый аргумент является матрицей.

Оператор можно записать как:

произведение Адамара

Оператор преобразования матрицы в вектор

Оператор обратного преобразования матрицы в вектор иногда обозначается одноименным оператором, где аргументом теперь является матрица, а результатом является вектор ее диагональных элементов.

Следующее свойство имеет:

Скалярная матрица

Диагональная матрица с равными диагональными элементами является скалярной матрицей ; то есть скалярное кратное λ единичной матрицы I . Его эффект на векторскалярное умножение на λ . Например, скалярная матрица 3×3 имеет вид:

Скалярные матрицы являются центром алгебры матриц: то есть это именно те матрицы, которые коммутируют со всеми другими квадратными матрицами того же размера. [a] Напротив, над полем (как и в случае действительных чисел) диагональная матрица, все диагональные элементы которой различны, коммутирует только с диагональными матрицами (ее централизатор - это набор диагональных матриц). Это потому, что если диагональная матрица затем дала матрицу с членами произведений: и и (поскольку можно разделить на ), то они не коммутируют, если недиагональные члены не равны нулю. [b] Диагональные матрицы, в которых не все диагональные элементы равны или не все различны, имеют центраторы, промежуточные между всем пространством и только диагональными матрицами. [1]

Для абстрактного векторного пространства V (а не для конкретного векторного пространства ) аналогом скалярных матриц являются скалярные преобразования . В более общем смысле это верно для модуля M над кольцом R с алгеброй эндоморфизмов End( M ) (алгеброй линейных операторов на M ), заменяющей алгебру матриц. Формально скалярное умножение представляет собой линейное отображение, индуцирующее отображение (от скаляра λ к соответствующему скалярному преобразованию, умножению на λ ), демонстрирующее End( M ) как R - алгебру . Для векторных пространств скалярные преобразования являются в точности центром алгебры эндоморфизмов, и, аналогично, скалярные обратимые преобразования являются центром общей линейной группы GL( V ). Первый в более общем смысле представляет собой свободные модули , для которых алгебра эндоморфизмов изоморфна матричной алгебре.

Векторные операции

Умножение вектора на диагональную матрицу умножает каждый из членов на соответствующий диагональный элемент. Учитывая диагональную матрицу и вектор , произведение будет:

Это можно выразить более компактно, используя вектор вместо диагональной матрицы и взяв произведение Адамара векторов (поэлементное произведение), обозначенное :

Это математически эквивалентно, но позволяет избежать хранения всех нулевых членов этой разреженной матрицы . Таким образом, этот продукт используется в машинном обучении , например, для вычисления продуктов производных при обратном распространении ошибки или умножения весов IDF в TF-IDF , [2] поскольку некоторые структуры BLAS , которые эффективно умножают матрицы, не включают возможности произведения Адамара напрямую. [3]

Матричные операции

Операции сложения и умножения матриц особенно просты для диагональных матриц. Запишите Diag( a 1 , ..., an n ) для диагональной матрицы, диагональные элементы которой, начиная с верхнего левого угла, равны a 1 , ..., an n . Тогда для сложения имеем

и для умножения матриц ,

Диагональная матрица Diag( a 1 , ..., an ) обратима тогда и только тогда, когда все элементы a 1 , ..., an n не равны нулю. В этом случае мы имеем

В частности, диагональные матрицы образуют подкольцо кольца всех матриц размера n x n .

Умножение nn-матрицы A слева на Diag ( a 1 , ... , an ) равносильно умножению i - й строки A на a i для всех i ; умножение матрицы A справа на Diag( a 1 , ... , an ) равносильно умножению i -го столбца A на a i для всех i .

Операторная матрица в собственном базисе

Как объяснялось при определении коэффициентов операторной матрицы , существует специальный базис e 1 , ..., en , для которого матрица принимает диагональную форму. Следовательно, в определяющем уравнении все коэффициенты с ij равны нулю, поэтому в каждой сумме остается только один член. Сохранившиеся диагональные элементы известны как собственные значения и обозначаются в уравнении, которое сводится к . Полученное уравнение известно как уравнение собственных значений [4] и используется для вывода характеристического полинома и, далее, собственных значений и собственных векторов .

Другими словами, собственными значениями функцииdiag ( λ 1 ,..., λ n ) являются λ 1 , ..., λ n с соответствующими собственными векторами e 1 , ..., e n .

Характеристики

Приложения

Диагональные матрицы встречаются во многих областях линейной алгебры. Из-за простого описания матричной операции и собственных значений/собственных векторов, приведенных выше, обычно желательно представлять данную матрицу или линейную карту диагональной матрицей.

Фактически, данная матрица A размером n x n подобна диагональной матрице (это означает, что существует матрица X такая, что X −1 AX является диагональной) тогда и только тогда, когда она имеет n линейно независимых собственных векторов. Такие матрицы называются диагонализуемыми .

В отношении действительных или комплексных чисел верно больше . Спектральная теорема гласит, что каждая нормальная матрица унитарно подобна диагональной матрице (если AA = A A , то существует унитарная матрица U такая, что UAU диагональна). Более того, разложение по сингулярным значениям означает, что для любой матрицы A существуют унитарные матрицы U и V такие, что U AV диагональна с положительными элементами.

Теория операторов

В теории операторов , особенно при изучении УЧП , операторы особенно легко понять, а УЧП легко решить, если оператор диагональен относительно базиса, с которым он работает; это соответствует разделимому уравнению в частных производных . Следовательно, ключевой метод понимания операторов — это замена координат (на языке операторов это интегральное преобразование ), которая меняет основу на собственный базис собственных функций : что делает уравнение разделимым. Важным примером этого является преобразование Фурье , которое диагонализует операторы дифференцирования с постоянными коэффициентами (или, в более общем плане, операторы, инвариантные к сдвигу), такие как оператор Лапласа, скажем, в уравнении теплопроводности .

Особенно простыми являются операторы умножения , которые определяются как умножение на (значения) фиксированной функции: значения функции в каждой точке соответствуют диагональным элементам матрицы.

Смотрите также

Примечания

  1. ^ Доказательство: учитывая элементарную матрицу , это матрица только с i -й строкой M и квадратная матрица только с M j -м столбцом, поэтому недиагональные элементы должны быть нулевыми, а i- й диагональный элемент во многом совпадает с j- й диагональной записью.
  2. ^ Для более общих колец это не так, потому что делить не всегда можно.

Рекомендации

  1. ^ «Всегда ли диагональные матрицы коммутируют?» Обмен стеками. 15 марта 2016 года . Проверено 4 августа 2018 г.
  2. ^ Сахами, Мехран (15 июня 2009 г.). Анализ текста: классификация, кластеризация и приложения. ЦРК Пресс. п. 14. ISBN 9781420059458.
  3. ^ «Поэлементное векторно-векторное умножение в BLAS?». stackoverflow.com . 01.10.2011 . Проверено 30 августа 2020 г.
  4. ^ Близится, Джеймс (2010). «Глава 7.9: Собственные значения и собственные векторы» (PDF) . Математические инструменты физики. ISBN 978-0486482125. Проверено 1 января 2012 г.

Источники