stringtranslate.com

След (линейная алгебра)

В линейной алгебре след квадратной матрицы A , обозначаемый tr( A ) , [ 1] представляет собой сумму элементов на ее главной диагонали , . Он определен только для квадратной матрицы ( n × n ).

В математической физике, если tr( A ) = 0, то говорят, что матрица не имеет следа . Это неправильное название широко используется, как в определении матриц Паули .

След матрицы — это сумма ее собственных значений (подсчитанных с кратностями). Также tr( AB ) = tr( BA ) для любых матриц A и B одинакового размера. Таким образом, подобные матрицы имеют одинаковый след. Как следствие, можно определить след линейного оператора, отображающего конечномерное векторное пространство в себя, поскольку все матрицы, описывающие такой оператор относительно базиса, подобны.

След связан с производной определителя ( см. формулу Якоби ).

Определение

След квадратной матрицы A размером n × n определяется как [1] ​​[2] [3] : 34  , где a ii обозначает элемент i  -й строки и i-  го столбца матрицы A. Элементами матрицы A могут быть действительные числа , комплексные числа или, в более общем случае, элементы поля F. След не определен для неквадратных матриц.

Пример

Пусть A — матрица, причем

Затем

Характеристики

Основные свойства

След представляет собой линейное отображение . То есть, [1] [2] для всех квадратных матриц A и B и всех скаляров c . [3] : 34 

Матрица и ее транспонированная матрица имеют одинаковый след: [1] [2] [3] : 34 

Это непосредственно следует из того факта, что транспонирование квадратной матрицы не влияет на элементы вдоль главной диагонали.

След продукта

След квадратной матрицы, которая является произведением двух матриц, можно переписать как сумму произведений их элементов по элементам, т.е. как сумму всех элементов их произведения Адамара . Выражаясь напрямую, если A и B — две матрицы m × n , то:

Если рассматривать любую вещественную матрицу m × n как вектор длины mn (операция, называемая векторизацией ), то указанная выше операция над A и B совпадает со стандартным скалярным произведением . Согласно приведенному выше выражению, tr( A A ) является суммой квадратов и, следовательно, является неотрицательным, равным нулю тогда и только тогда, когда A равно нулю. [4] : 7  Кроме того, как отмечено в приведенной выше формуле, tr( A B ) = tr( B A ) . Это демонстрирует положительную определенность и симметрию, требуемые для скалярного произведения ; принято называть tr( A B ) скалярным произведением Фробениуса для A и B . Это естественное скалярное произведение на векторном пространстве всех вещественных матриц фиксированных размерностей. Норма , полученная из этого скалярного произведения, называется нормой Фробениуса , и она удовлетворяет субмультипликативному свойству, что можно доказать с помощью неравенства Коши–Шварца : если A и B — действительные положительно полуопределенные матрицы одинакового размера. Скалистый продукт и норма Фробениуса часто возникают в матричном исчислении и статистике .

Скалярное произведение Фробениуса можно расширить до эрмитова скалярного произведения на комплексном векторном пространстве всех комплексных матриц фиксированного размера, заменив B на его комплексно сопряженную матрицу .

Симметрию внутреннего произведения Фробениуса можно выразить более прямо следующим образом: матрицы в следе произведения можно менять местами без изменения результата. Если A и B — это действительные или комплексные матрицы m × n и n × m соответственно, то [1] [2] [3] : 34  [примечание 1]

Это примечательно как тем фактом, что AB обычно не равно BA , так и тем, что след любого из них обычно не равен tr( A )tr( B ) . [примечание 2] Инвариантность подобия следа, означающая, что tr( A ) = tr( P −1 AP ) для любой квадратной матрицы A и любой обратимой матрицы P тех же размеров, является фундаментальным следствием. Это доказывается Инвариантность подобия является важнейшим свойством следа для обсуждения следов линейных преобразований , как показано ниже.

Кроме того, для действительных векторов-столбцов и след внешнего произведения эквивалентен внутреннему произведению:

Циклическое свойство

В более общем случае след инвариантен относительно круговых сдвигов , то есть,

Это известно как циклическое свойство .

Произвольные перестановки не допускаются: в общем случае,

Однако, если рассматриваются произведения трех симметричных матриц, любая перестановка допускается, поскольку: где первое равенство возникает из-за того, что следы матрицы и ее транспонированной матрицы равны. Обратите внимание, что это неверно в общем случае для более чем трех факторов.

След продукта Кронекера

След произведения Кронекера двух матриц равен произведению их следов:

Характеристика следа

Следующие три свойства характеризуют след с точностью до скалярного множителя в следующем смысле: если — линейный функционал на пространстве квадратных матриц, удовлетворяющий условию , то и пропорциональны. [примечание 3]

Для матриц применение нормализации делает их равными следу.

След как сумма собственных значений

Для любой матрицы A размера n × n существует

где λ 1 , ..., λ nсобственные значения матрицы A , подсчитанные с учетом кратности. Это справедливо даже в том случае, если A — вещественная матрица, а некоторые (или все) собственные значения — комплексные числа. Это можно рассматривать как следствие существования канонической формы Жордана вместе с инвариантностью следа относительно подобия, обсуждавшейся выше.

След коммутатора

Когда и A, и B являются матрицами n × n, след (теоретически-кольцевого) коммутатора A и B исчезает: tr([ A , B ] ) = 0 , поскольку tr ( AB ) = tr ( BA ) и tr линейна . Можно сформулировать это как « след является отображением алгебр Ли gl nk из операторов в скаляры», поскольку коммутатор скаляров тривиален (это абелева алгебра Ли ). В частности, используя инвариантность подобия, следует, что единичная матрица никогда не подобна коммутатору любой пары матриц.

Наоборот, любая квадратная матрица с нулевым следом является линейной комбинацией коммутаторов пар матриц. [примечание 4] Более того, любая квадратная матрица с нулевым следом унитарно эквивалентна квадратной матрице с диагональю, состоящей из одних нулей.

Следы особых видов матриц

Связь с характеристическим многочленом

След матрицы — это коэффициент в характеристическом многочлене , возможно, с изменённым знаком, в соответствии с соглашением, принятым в определении характеристического многочлена.

Связь с собственными значениями

Если A — линейный оператор , представленный квадратной матрицей с действительными или комплексными элементами, и если λ 1 , ..., λ nсобственные значения A (перечисленные в соответствии с их алгебраическими кратностями ), то

Это следует из того факта, что A всегда подобна своей жордановой форме , верхней треугольной матрице, имеющей λ 1 , ..., λ n на главной диагонали. Напротив, определитель A является произведением его собственных значений; то есть,

Все в настоящем разделе применимо также к любой квадратной матрице с коэффициентами в алгебраически замкнутом поле .

Производные отношения

Если ΔA — квадратная матрица с малыми элементами, а I обозначает единичную матрицу , то мы имеем приблизительно

Именно это означает , что след является производной детерминантной функции при единичной матрице. Формула Якоби

является более общим и описывает дифференциал определителя в произвольной квадратной матрице в терминах следа и сопряженного элемента матрицы.

Из этого (или из связи между следом и собственными значениями) можно вывести соотношение между функцией следа, матричной экспоненциальной функцией и определителем:

Связанная характеристика следа применима к линейным векторным полям . Для данной матрицы A определите векторное поле F на R n как F ( x ) = Ax . Компоненты этого векторного поля являются линейными функциями (заданными строками A ). Его дивергенция div F является постоянной функцией, значение которой равно tr( A ) .

По теореме о дивергенции это можно интерпретировать в терминах потоков: если F ( x ) представляет собой скорость жидкости в точке x, а U — область в R n , то чистый поток жидкости из U определяется как tr( A ) · vol( U ) , где vol( U )объем U .

След является линейным оператором, поэтому он коммутирует с производной:

След линейного оператора

В общем случае, если задано некоторое линейное отображение f  : VV (где V — конечномерное векторное пространство ), мы можем определить след этого отображения, рассматривая след матричного представления f , то есть выбирая базис для V и описывая f как матрицу относительно этого базиса, и взяв след этой квадратной матрицы. Результат не будет зависеть от выбранного базиса, поскольку разные базисы будут порождать похожие матрицы , что позволяет определить след линейного отображения независимо от базиса.

Такое определение можно дать, используя канонический изоморфизм между пространством End( V ) линейных отображений на V и VV * , где V *двойственное пространство V . Пусть v находится в V , а g — в V * . Тогда след неразложимого элемента vg определяется как g ( v ) ; след общего элемента определяется линейностью. След линейного отображения f  : VV тогда можно определить как след, в указанном выше смысле, элемента VV * , соответствующего f при указанном выше каноническом изоморфизме. Используя явный базис для V и соответствующий двойственный базис для V * , можно показать, что это дает то же самое определение следа, что и приведенное выше.

Числовые алгоритмы

Стохастическая оценка

След можно оценить беспристрастно с помощью «трюка Хатчинсона»: [5]

Учитывая любую матрицу и любые случайные числа с , мы имеем . (Доказательство: непосредственно разложить математическое ожидание.)

Обычно случайный вектор выбирается из (нормального распределения) или ( распределения Радемахера ).

Были разработаны более сложные стохастические оценки следа. [6]

Приложения

Если действительная матрица 2 x 2 имеет нулевой след, то ее квадрат является диагональной матрицей .

След комплексной матрицы 2 × 2 используется для классификации преобразований Мёбиуса . Сначала матрица нормализуется, чтобы сделать ее определитель равным единице. Затем, если квадрат следа равен 4, соответствующее преобразование является параболическим . Если квадрат находится в интервале [0,4) , он является эллиптическим . Наконец, если квадрат больше 4, преобразование является локсодромическим . См. классификацию преобразований Мёбиуса .

След используется для определения характеров представлений групп . Два представления A , B  : GGL ( V ) группы G эквивалентны (с точностью до смены базиса на V ), если tr( A ( g )) = tr( B ( g )) для всех gG.

След также играет центральную роль в распределении квадратичных форм .

алгебра Ли

След представляет собой отображение алгебр Ли из алгебры Ли линейных операторов на n -мерном пространстве ( матрицы размера n × n с элементами в ) в алгебру Ли K скаляров; поскольку K абелева (скобка Ли равна нулю), тот факт, что это отображение алгебр Ли, в точности соответствует утверждению о том, что след скобки равен нулю:

Ядро этой карты, матрица, след которой равен нулю , часто называетсябесследный илине имеют следов , и эти матрицы образуютпростую алгебру Ли , которая являетсяалгеброй Лиспециальнойлинейной группыматриц с определителем 1. Специальная линейная группа состоит из матриц, не изменяющих объем, в то время какспециальная линейная алгебра Ли— это матрицы, не изменяющие объембесконечно малыхмножеств.

Фактически, существует внутренняя прямая сумма разложения операторов/матриц в бесследовые операторы/матрицы и скалярные операторы/матрицы. Проекционное отображение на скалярные операторы может быть выражено в терминах следа, конкретно как:

Формально можно составить след ( карту коединицы ) с картой единиц «включения скаляров », чтобы получить карту, отображающую скаляры, и умножить на n . Деление на n делает это проекцией, что дает формулу выше.

В терминах коротких точных последовательностей , есть что аналогично (где ) для групп Ли . Однако след расщепляется естественным образом (через скаляры), так что , но расщепление определителя будет как корень n-й степени, умноженный на скаляры, и это в общем случае не определяет функцию, поэтому определитель не расщепляется, а общая линейная группа не разлагается:

Билинейные формы

Билинейная форма (где X , Y — квадратные матрицы) называется формой Киллинга и используется для классификации алгебр Ли.

След определяет билинейную форму:

Форма симметрична, невырождена [примечание 5] и ассоциативна в том смысле, что:

Для сложной простой алгебры Ли (такой как n ) каждая такая билинейная форма пропорциональна друг другу; в частности, форме Киллинга [ требуется ссылка ] .

Две матрицы X и Y называются след-ортогональными, если

Существует обобщение на общее представление алгебры Ли , такое, что является гомоморфизмом алгебр Ли . Форма следа на определяется, как указано выше. Билинейная форма симметрична и инвариантна из-за цикличности.

Обобщения

Понятие следа матрицы обобщается на класс следов компактных операторов в гильбертовых пространствах , а аналог нормы Фробениуса называется нормой Гильберта–Шмидта .

Если K — оператор класса следа, то для любого ортонормированного базиса след задается выражением и является конечным и независимым от ортонормированного базиса. [7]

Частичный след — это еще одно обобщение следа, который является операторнозначным. След линейного оператора Z , который живет на пространстве произведений AB, равен частичным следам над A и B :

Дополнительные свойства и обобщение частичного следа см. в разделе трассированные моноидальные категории .

Если A — общая ассоциативная алгебра над полем k , то след на A часто определяется как любое отображение tr : Ak, которое обращается в нуль на коммутаторах; tr([ a , b ]) = 0 для всех a , bA . Такой след не определен однозначно; его всегда можно по крайней мере изменить путем умножения на ненулевой скаляр.

Суперслед — это обобщение следа на случай супералгебр .

Операция тензорной контракции обобщает след на произвольные тензоры.

Гомме и Кляйн (2011) определяют оператор матричного следа , который работает с блочными матрицами и использует его для вычисления решений возмущений второго порядка для динамических экономических моделей без необходимости использования тензорной нотации . [8]

Следы на языке тензорных произведений

Если задано векторное пространство V , то существует естественное билинейное отображение V × V F , заданное отправкой ( v , φ) в скаляр φ( v ) . Универсальное свойство тензорного произведения VV автоматически подразумевает, что это билинейное отображение индуцируется линейным функционалом на VV . [9]

Аналогично, существует естественное билинейное отображение V × V → Hom( V , V ), заданное отправкой ( v , φ) в линейное отображение w ↦ φ( w ) v . Универсальное свойство тензорного произведения, как и ранее, говорит, что это билинейное отображение индуцируется линейным отображением VV → Hom( V , V ) . Если V конечномерно, то это линейное отображение является линейным изоморфизмом . [9] Этот фундаментальный факт является прямым следствием существования (конечного) базиса V , и его также можно сформулировать так, что любое линейное отображение VV может быть записано как сумма (конечного числа) линейных отображений ранга один. Составление обратного изоморфизма с линейным функционалом, полученным выше, приводит к линейному функционалу на Hom( V , V ) . Этот линейный функционал в точности совпадает со следом.

Используя определение следа как суммы диагональных элементов, формула матрицы tr( AB ) = tr( BA ) легко доказывается, и она была приведена выше. В настоящей перспективе рассматриваются линейные отображения S и T , и они рассматриваются как суммы отображений ранга один, так что существуют линейные функционалы φ i и ψ j и ненулевые векторы v i и w j такие, что S ( u ) = Σ φ i ( u ) v i и T ( u ) = Σ ψ j ( u ) w j для любого u в V . Тогда

для любого u из V. Линейное отображение ранга один uψ j ( u ) φ i ( w j ) v i имеет след ψ j ( v i ) φ i ( w j ) и поэтому

Следуя той же процедуре , поменяв местами S и T , можно получить точно такую ​​же формулу, доказывающую, что tr( ST ) равно tr( TS ) .

Приведенное выше доказательство можно рассматривать как основанное на тензорных произведениях, учитывая, что фундаментальное тождество End( V ) с VV эквивалентно выразимости любого линейного отображения в виде суммы линейных отображений ранга один. Таким образом, доказательство может быть записано в обозначениях тензорных произведений. Тогда можно рассмотреть полилинейное отображение V × V × V × V VV ∗, заданное отправкой ( v , φ , w , ψ ) в φ ( w ) vψ . Дальнейшая композиция с отображением следа затем приводит к φ ( w ) ψ ( v ) , и это не изменится, если бы вместо этого начать с ( w , ψ , v , φ ) . Можно также рассмотреть билинейное отображение End( V ) × End( V ) → End( V ), заданное отправкой ( f , g ) в композицию fg , которая затем индуцируется линейным отображением End( V ) ⊗ End( V ) → End( V ) . Можно видеть, что это совпадает с линейным отображением VV VV VV . Установленная симметрия при композиции с отображением следа затем устанавливает равенство двух следов. [9]

Для любого конечномерного векторного пространства V существует естественное линейное отображение FVV ' ; на языке линейных отображений оно сопоставляет скаляру c линейное отображение c ⋅id V . Иногда это называется отображением кооценки , а след VV 'F называется отображением оценки . [9] Эти структуры могут быть аксиоматизированы для определения категориальных следов в абстрактной обстановке теории категорий .

Смотрите также

Примечания

  1. ^ Это следует непосредственно из определения матричного произведения :
  2. ^ Например, если то произведение равно и следы равны tr( AB ) = 1 ≠ 0 ⋅ 0 = tr( A )tr( B ) .
  3. ^ Доказательство: Пусть стандартный базис и заметим, что тогда и только тогда, когда и Более абстрактно, это соответствует разложению, поскольку (эквивалентно, ) определяет след, на котором имеет дополнение скалярных матриц, и оставляет одну степень свободы: любое такое отображение определяется своим значением на скалярах, которое является одним скалярным параметром и, следовательно, все являются кратными следу, ненулевому такому отображению.
  4. ^ Доказательство: является полупростой алгеброй Ли , и поэтому каждый ее элемент является линейной комбинацией коммутаторов некоторых пар элементов, в противном случае производная алгебра была бы собственным идеалом.
  5. ^ Это следует из того факта, что tr( A * A ) = 0 тогда и только тогда, когда A = 0 .

Ссылки

  1. ^ abcde "Ранг, след, определитель, транспонирование и обратная матрица". fourier.eng.hmc.edu . Получено 2020-09-09 .
  2. ^ abcd Weisstein, Eric W. (2003) [1999]. "Trace (matrix)". В Weisstein, Eric W. (ред.). CRC Concise Encyclopedia of Mathematics (2-е изд.). Boca Raton, FL: Chapman & Hall . doi :10.1201/9781420035223. ISBN 1-58488-347-2. МР  1944431. Збл  1079.00009 . Проверено 9 сентября 2020 г.
  3. ^ abcd Липшуц, Сеймур; Липсон, Марк (сентябрь 2005 г.). Теория и проблемы линейной алгебры . Очерк Шаума. McGraw-Hill. ISBN 9780070605022.
  4. ^ Хорн, Роджер А.; Джонсон, Чарльз Р. (2013). Матричный анализ (2-е изд.). Cambridge University Press. ISBN 9780521839402.
  5. ^ Хатчинсон, МФ (январь 1989). «Стохастическая оценка следа матрицы влияния для сглаживающих сплайнов Лапласа». Communications in Statistics - Simulation and Computation . 18 (3): 1059–1076. doi :10.1080/03610918908812806. ISSN  0361-0918.
  6. ^ Аврон, Хаим; Толедо, Сиван (2011-04-11). «Рандомизированные алгоритмы для оценки следа неявной симметричной положительно полуопределенной матрицы». Журнал ACM . 58 (2): 8:1–8:34. doi :10.1145/1944345.1944349. ISSN  0004-5411. S2CID  5827717.
  7. ^ Тешль, Г. (30 октября 2014 г.). Математические методы в квантовой механике . Аспирантура по математике. Т. 157 (2-е изд.). Американское математическое общество. ISBN 978-1470417048.
  8. ^ П. Гомме, П. Кляйн (2011). «Второе приближение динамических моделей без использования тензоров». Журнал экономической динамики и управления . 35 : 604–615.
  9. ^ abcd Кассель, Кристиан (1995). Квантовые группы . Graduate Texts in Mathematics . Vol. 155. Нью-Йорк: Springer-Verlag . doi :10.1007/978-1-4612-0783-2. ISBN 0-387-94370-6. MR  1321145. Zbl  0808.17003.

Внешние ссылки