stringtranslate.com

Определенная матрица

В математике симметричная матрица с действительными элементами является положительно определенной, если действительное число положительно для каждого ненулевого вещественного вектора-столбца где - транспонирование . [1] В более общем смысле, эрмитова матрица (то есть комплексная матрица , равная ее сопряженному транспонированию ) является положительно определенной , если действительное число положительно для каждого ненулевого комплексного вектора-столбца где обозначает сопряженное транспонирование

Положительные полуопределенные матрицы определяются аналогично, за исключением того, что скаляры и должны быть положительными или нулевыми (то есть неотрицательными). Отрицательно-определенные и отрицательно-полуопределенные матрицы определяются аналогично. Матрицу, которая не является ни положительно-полуопределенной, ни отрицательно-полуопределенной, иногда называют неопределенной .

Таким образом, матрица является положительно определенной тогда и только тогда, когда она является матрицей положительно определенной квадратичной формы или эрмитовой формы . Другими словами, матрица является положительно определенной тогда и только тогда, когда она определяет скалярный продукт .

Положительно-определенные и положительно-полуопределенные матрицы можно охарактеризовать по-разному, что может объяснить важность этой концепции в различных частях математики. Матрица M является положительно определенной тогда и только тогда, когда она удовлетворяет любому из следующих эквивалентных условий.

Матрица является положительно-полуопределенной, если она удовлетворяет аналогичным эквивалентным условиям, где «положительная» заменяется на «неотрицательную», «обратимая матрица» заменяется на «матрица», а слово «ведущая» удаляется.

Положительно-определенные и положительно-полуопределенные вещественные матрицы лежат в основе выпуклой оптимизации , поскольку, если дана дважды дифференцируемая функция нескольких действительных переменных , то если ее матрица Гессе (матрица ее вторых частных производных) положительно определена при в точке p , то функция выпукла вблизи p , и, наоборот, если функция выпукла вблизи p , то матрица Гессе положительно-полуопределенна в точке p .

Множество положительно определенных матриц представляет собой открытый выпуклый конус , а множество положительно определенных матриц — замкнутый выпуклый конус. [2]

Некоторые авторы используют более общие определения определенности, включая некоторые несимметричные действительные матрицы или неэрмитовы комплексные.

Определения

В следующих определениях является транспонированием , сопряженным транспонированием и обозначает n -мерный нулевой вектор.

Определения действительных матриц

Симметричная вещественная матрица называется положительно определенной, если для всех ненулевых значений в . Формально,

Симметричная вещественная матрица называется положительно-полуопределенной или неотрицательно-определенной, если для всех из . Формально,

Симметричная вещественная матрица называется отрицательно определенной, если для всех ненулевых значений в . Формально,

Симметричная вещественная матрица называется отрицательно-полуопределенной или неположительно-определенной, если для всех из . Формально,

Симметричная вещественная матрица, которая не является ни положительно-полуопределенной, ни отрицательно-полуопределенной, называется неопределенной .

Определения комплексных матриц

Следующие определения включают в себя этот термин . Обратите внимание, что это всегда действительное число для любой эрмитовой квадратной матрицы .

Эрмитова комплексная матрица называется положительно определенной, если для всех ненулевых значений в . Формально,

Эрмитова комплексная матрица называется положительно-полуопределенной или неотрицательно-определенной, если для всех из . Формально,

Эрмитова комплексная матрица называется отрицательно определенной, если для всех ненулевых значений в . Формально,

Эрмитова комплексная матрица называется отрицательно-полуопределенной или неположительно-определенной, если для всех из . Формально,

Эрмитова комплексная матрица, которая не является ни положительно-полуопределенной, ни отрицательно-полуопределенной, называется неопределенной .

Согласованность между реальными и сложными определениями

Поскольку каждая действительная матрица также является комплексной матрицей, определения «определенности» для этих двух классов должны согласовываться.

Для комплексных матриц наиболее распространенное определение гласит, что они являются положительно определенными тогда и только тогда, когда они вещественны и положительны для всех ненулевых комплексных векторов-столбцов . Из этого условия следует, что оно является эрмитовым (т.е. его транспонирование равно сопряженному), поскольку , будучи действительным, оно равно сопряженному транспонированию для каждого , что подразумевает .

По этому определению положительно определенная действительная матрица является эрмитовой и, следовательно, симметричной; и положителен для всех ненулевых действительных векторов-столбцов . Однако одного только последнего условия недостаточно для положительной определенности. Например, если

тогда для любого вещественного вектора с записями и мы имеем , который всегда положителен, если не равен нулю. Однако, если комплексный вектор с записями и , получается

что не реально. Следовательно, не является положительно-определенным.

С другой стороны, для симметричной вещественной матрицы условие « для всех ненулевых действительных векторов » подразумевает , что она положительно определена в комплексном смысле.

Обозначения

Если эрмитова матрица положительно полуопределенна, иногда пишут , а если положительно определена, пишут . Чтобы обозначить, что это отрицательно-полуопределенное, пишут, а чтобы обозначить, что оно отрицательно-определенное, пишут .

Это понятие пришло из функционального анализа , где положительные полуопределенные матрицы определяют положительные операторы . Если две матрицы и удовлетворяют , мы можем определить нестрогий частичный порядок , который является рефлексивным , антисимметричным и транзитивным ; Однако это не тотальный порядок , поскольку в целом он может быть неопределенным.

Распространенными альтернативными обозначениями являются , , и для положительно-полуопределенных и положительно-определенных, отрицательно-полуопределенных и отрицательно-определенных матриц соответственно. Это может сбить с толку, поскольку иногда так обозначают и неотрицательные матрицы (соответственно, неположительные).

Примеры

Собственные значения

Пусть — эрмитова матрица (сюда входят вещественные симметричные матрицы ). Все собственные значения оператора действительны, а их знак характеризует его определенность:

Пусть - собственное разложение , где - унитарная комплексная матрица , столбцы которой содержат ортонормированный базис собственных векторов , и - действительная диагональная матрица , главная диагональ которой содержит соответствующие собственные значения . Матрицу можно рассматривать как диагональную матрицу , перевыраженную в координатах базиса (собственных векторов) . Иными словами, применение к некоторому вектору z , дающее M z , - это то же самое, что изменение базиса системы координат собственного вектора с использованием P -1 , давая P -1 z , применение преобразования растяжения D к результату, давая DP -1 z , а затем снова меняя базис с помощью P , получая PDP −1 z .

Имея это в виду, замена переменной один к одному показывает, что она действительна и положительна для любого комплексного вектора тогда и только тогда, когда она действительна и положительна для любого ; другими словами, если положительно определено. Для диагональной матрицы это верно только в том случае, если каждый элемент главной диагонали, то есть каждое собственное значение, положителен. Поскольку спектральная теорема гарантирует, что все собственные значения эрмитовой матрицы вещественны, положительность собственных значений можно проверить с помощью правила чередования знаков Декарта, когда доступен характеристический полином действительной симметричной матрицы .

Разложение

Пусть – эрмитова матрица . является положительно полуопределенным тогда и только тогда, когда его можно разложить в произведение

сопряженным транспонированием

Если действительно, то оно также может быть реальным, и разложение можно записать как

положительно определен тогда и только тогда, когда такое разложение существует с обратимым . В более общем смысле, является положительно полуопределенным с рангом тогда и только тогда, когда существует разложение с матрицей полного ранга строки (т. е. ранга ). Более того, для любого разложения , . [3]

Доказательство

Если , то , so является положительно полуопределенным. Если при этом обратимо, то неравенство является строгим для , поэтому является положительно определенным. Если имеет ранг , то .

В другом направлении предположим, что оно положительно полуопределено. Поскольку она является эрмитовой, она имеет собственное разложение , где является унитарной и является диагональной матрицей, элементы которой являются собственными значениями. Поскольку она положительно полуопределена, собственные значения являются неотрицательными действительными числами, поэтому ее можно определить как диагональную матрицу, элементы которой неотрицательны. квадратные корни из собственных значений. Тогда для . Если более того, оно положительно определено, то собственные значения (строго) положительны, поэтому оно обратимо и, следовательно, также обратимо. Если имеет ранг , то у него ровно положительные собственные значения, а остальные равны нулю, следовательно, во всех строках, кроме строк, обнуляются. Вырезание нулевых строк дает матрицу такую, что .

Столбцы можно рассматривать как векторы в комплексном или действительном векторном пространстве соответственно. Тогда элементы являются внутренними продуктами (то есть скалярными произведениями в реальном случае) этих векторов

матрицей Грамалинейно независимыхохватываемого[4]

Единственность с точностью до унитарных преобразований.

Разложение неоднозначно: если для некоторой матрицы и если — любая унитарная матрица (имеется в виду ), то для .

Однако это единственный способ, которым могут различаться два разложения: разложение единственно с точностью до унитарных преобразований . Более формально, если матрица и матрица такая, что , то существует матрица с ортонормированными столбцами (что означает ) такая, что . [5] Когда это средство унитарно .

В реальном случае это утверждение имеет интуитивную геометрическую интерпретацию: пусть столбцы и будут векторами и в . Действительная унитарная матрица — это ортогональная матрица , которая описывает жесткое преобразование (изометрию евклидова пространства ), сохраняющее нулевую точку (т. е. вращения и отражения без перемещений). Следовательно, скалярные произведения и равны тогда и только тогда, когда какое-то жесткое преобразование преобразует векторы в (и 0 в 0).

Квадратный корень

Эрмитова матрица является положительно полуопределенной тогда и только тогда, когда существует положительно полуопределенная матрица (в частности , эрмитова, поэтому ), удовлетворяющая . Эта матрица уникальна, [6] называется неотрицательным квадратным корнем из и обозначается . Когда является положительно определенным, то и , следовательно, его также называют положительным квадратным корнем из .

Неотрицательный квадратный корень не следует путать с другими разложениями . Некоторые авторы используют название квадратный корень и для любого такого разложения, или конкретно для разложения Холецкого , или любого разложения формы ; другие используют его только для получения неотрицательного квадратного корня.

Если тогда .

Разложение Холецкого

Эрмитова положительная полуопределенная матрица может быть записана как , где – нижняя треугольная с неотрицательной диагональю (эквивалентно где – верхняя треугольная); это разложение Холецкого . Если положительно определена, то диагональ положительна и разложение Холецкого единственно. И наоборот, если нижний треугольный с неотрицательной диагональю, то он положительно полуопределенный. Разложение Холецкого особенно полезно для эффективных численных расчетов. Близкородственное разложение – это разложение ЛПНП , , где – диагональ, а – нижний унитреугольный .

Другие характеристики

Пусть – вещественная симметричная матрица , и пусть – «единичный шар», определяемый . Тогда мы имеем следующее

Пусть – эрмитова матрица . Следующие свойства эквивалентны положительно определенным:

Соответствующая полуторалинейная форма является внутренним продуктом
Полуторалинейная форма определяется функцией от до такой, что для всех и в , где – сопряженное транспонирование . Для любой комплексной матрицы эта форма линейна и полулинейна по . Следовательно, форма является внутренним произведением тогда и только тогда, когда она действительна и положительна для всех ненулевых значений ; то есть тогда и только тогда, когда положительно определенное. (Фактически, каждый внутренний продукт возникает таким образом из эрмитовой положительно определенной матрицы.)
Все его ведущие основные миноры положительные.
k - й главный минор матрицы является определителем ее верхней левой подматрицы. Оказывается, матрица положительно определена тогда и только тогда, когда все эти определители положительны. Это условие известно как критерий Сильвестра и обеспечивает эффективную проверку положительной определенности симметричной вещественной матрицы. А именно, матрица сводится к верхней треугольной матрице с помощью элементарных операций над строками , как в первой части метода исключения Гаусса , стараясь сохранить знак ее определителя во время процесса поворота . Поскольку k -й главный минор треугольной матрицы является произведением ее диагональных элементов до строки , критерий Сильвестра эквивалентен проверке, все ли ее диагональные элементы положительны. Это условие можно проверять каждый раз при получении новой строки треугольной матрицы.

Положительная полуопределенная матрица является положительно определенной тогда и только тогда, когда она обратима . [7] Матрица является отрицательно (полу)определенной тогда и только тогда, когда она положительно (полу)определена.

Квадратичные формы

(Чисто) квадратичная форма , связанная с вещественной матрицей, — это функция , такая, что для всех . можно считать симметричным, заменив его на .

Симметричная матрица является положительно определенной тогда и только тогда, когда ее квадратичная форма является строго выпуклой функцией .

В более общем смысле, любую квадратичную функцию от до можно записать в следующем виде: где — симметричная матрица, — действительный вектор и действительная константа. В данном случае это парабола, и так же, как и в случае, имеем

Теорема: Эта квадратичная функция строго выпукла и, следовательно, имеет единственный конечный глобальный минимум тогда и только тогда, когда она положительно определена.

Доказательство: если функция положительно определена, то функция строго выпуклая. Ее градиент равен нулю в единственной точке , которая должна быть глобальным минимумом, поскольку функция строго выпуклая. Если не является положительно определенным, то существует некоторый вектор такой, что , поэтому функция представляет собой прямую или нисходящую параболу, поэтому не является строго выпуклой и не имеет глобального минимума.

По этой причине положительно определенные матрицы играют важную роль в задачах оптимизации .

Одновременная диагонализация

Одну симметричную матрицу и другую матрицу, одновременно симметричную и положительно определенную, можно одновременно диагонализировать . Это так, хотя одновременная диагонализация не обязательно выполняется с преобразованием подобия . Этот результат не распространяется на случай трех и более матриц. В этом разделе мы пишем для реального случая. Распространение на сложный случай происходит немедленно.

Пусть – симметричная и симметричная положительно определенная матрица. Запишите обобщенное уравнение собственных значений так, как мы налагаем, что оно должно быть нормализовано, т.е. Теперь мы используем разложение Холецкого , чтобы записать обратную величину as . Умножив на и пропустив , получим , что можно переписать как где . Манипуляция теперь дает где – матрица, имеющая в качестве столбцов обобщенные собственные векторы, и – диагональная матрица обобщенных собственных значений. Теперь предварительное умножение с дает окончательный результат: и , но обратите внимание, что это уже не ортогональная диагонализация по отношению к скалярному произведению где . Фактически, мы провели диагонализацию по скалярному произведению, индуцированному . [8]

Обратите внимание, что этот результат не противоречит тому, что сказано об одновременной диагонализации в статье « Диагонализуемая матрица» , где говорится об одновременной диагонализации с помощью преобразования подобия. Наш результат больше похож на одновременную диагонализацию двух квадратичных форм и полезен для оптимизации одной формы при условиях другой.

Характеристики

Вызванный частичный порядок

Для произвольных квадратных матриц пишем if ie , является положительно полуопределенным. Это определяет частичный порядок на множестве всех квадратных матриц. Аналогичным образом можно определить строгий частичный порядок . Этот порядок называется порядком Левнера .

Обратная положительно определенная матрица

Любая положительно определенная матрица обратима , и ее обратная также положительно определена. [9] Если тогда . [10] Более того, по теореме о мин-максе , k -е наибольшее собственное значение больше или равно k- му наибольшему собственному значению .

Масштабирование

Если положительно определенное и является действительным числом, то положительно определенное. [11]

Добавление

Умножение

След

Диагональные элементы положительно-полуопределенной матрицы вещественны и неотрицательны. Как следствие след , . Более того, [13] поскольку каждая главная подматрица (в частности, 2х2) положительно полуопределена,

и таким образом, когда

Эрмитова матрица является положительно определенной, если она удовлетворяет следующим неравенствам следов: [14]

Другой важный результат состоит в том, что для любых и положительно-полуопределенных матриц . Это следует путем записи . Матрица является положительно-полуопределенной и, следовательно, имеет неотрицательные собственные значения, сумма которых, след, поэтому также неотрицательна.

Произведение Адамара

Если , хотя и не является обязательно положительно полуопределенным, произведение Адамара есть (этот результат часто называют теоремой Шура о произведении ). [15]

Что касается произведения Адамара двух положительных полуопределенных матриц , , есть два примечательных неравенства:

Продукт Кронекера

Если , хотя и не обязательно положительно полуопределенный, произведение Кронекера .

Продукт Фробениуса

Если , хотя и не является обязательно положительно полуопределенным, внутренний продукт Фробениуса (Ланкастер-Тисменецкий, Теория матриц , стр. 218).

Выпуклость

Множество положительных полуопределенных симметричных матриц выпукло . То есть, если и положительно полуопределены, то любое число от 0 до 1 также является положительно полуопределенным. Для любого вектора :

Это свойство гарантирует, что задачи полуопределенного программирования сходятся к глобально оптимальному решению.

Связь с косинусом

Положительная определенность матрицы означает, что угол между любым вектором и его изображением всегда равен :

Дополнительные свойства

  1. Если - симметричная матрица Теплица , т.е. элементы задаются как функция их абсолютных разностей индексов: , и выполняется строгое неравенство , то она строго положительно определена.
  2. Пусть и Эрмитиан. Если (соответственно ), то (соответственно ). [18]
  3. Если действительно, то существует такое , что , где – единичная матрица .
  4. If обозначает ведущий минор, является k- м стержнем во время разложения LU .
  5. Матрица является отрицательно определенной, если ее главный минор k- го порядка отрицательен, когда она нечетна, и положителен, когда она четна.
  6. Если – действительная положительно определенная матрица, то существует такое положительное действительное число, что для каждого вектора , .
  7. Эрмитова матрица является положительно полуопределенной тогда и только тогда, когда все ее главные миноры неотрицательны. Однако недостаточно учитывать только ведущие главные миноры, как это проверяется на диагональной матрице с элементами 0 и -1.

Блочные матрицы и подматрицы

Положительная матрица также может быть определена блоками :

где находится каждый блок . Применяя условие положительности, сразу следует, что и эрмитовы, и .

У нас это есть для всех сложных , и в частности для . Затем

Аналогичный аргумент можно применить к , и таким образом мы заключаем, что оба и должны быть положительно определенными. Этот аргумент можно расширить, чтобы показать, что любая главная подматрица сама по себе положительно определена.

Обратные результаты можно доказать с более сильными условиями на блоки, например, используя дополнение Шура .

Локальные экстремумы

Общую квадратичную форму действительных переменных всегда можно записать так: где — вектор-столбец с этими переменными, а — симметричная действительная матрица. Следовательно, положительно определенная матрица означает, что она имеет единственный минимум (ноль), когда равна нулю, и строго положительна для любого другого .

В более общем смысле, дважды дифференцируемая действительная функция по действительным переменным имеет локальный минимум в аргументах , если ее градиент равен нулю, а ее гессиан (матрица всех вторых производных) является положительно полуопределенным в этой точке. Аналогичные утверждения можно сделать для отрицательно определенных и полуопределенных матриц.

Ковариация

В статистике ковариационная матрица многомерного распределения вероятностей всегда положительно полуопределена; и она положительно определена, если только одна переменная не является точной линейной функцией других. И наоборот, каждая положительная полуопределенная матрица является ковариационной матрицей некоторого многомерного распределения.

Расширение для неэрмитовых квадратных матриц

Определение положительно определенной можно обобщить, обозначив любую комплексную матрицу (например, действительную несимметричную) как положительно определенную, если для всех ненулевых комплексных векторов где обозначает действительную часть комплексного числа . [19] Только эрмитова часть определяет, является ли матрица положительно определенной, и оценивается в более узком смысле выше. Точно так же, если и действительны, мы имеем для всех вещественных ненулевых векторов тогда и только тогда, когда симметричная часть положительно определена в более узком смысле. Сразу понятно, что он нечувствителен к транспозиции M .

Следовательно, несимметричная вещественная матрица только с положительными собственными значениями не обязательно должна быть положительно определенной. Например, матрица имеет положительные собственные значения, но не является положительно определенной; в частности , при выборе получается отрицательное значение (который является собственным вектором, связанным с отрицательным собственным значением симметричной части ).

Подводя итог, можно сказать, что отличительной чертой вещественного и комплексного случаев является то, что ограниченный положительный оператор в комплексном гильбертовом пространстве обязательно является эрмитовым или самосопряженным. Общее утверждение можно аргументировать, используя тождество поляризации . В реальном случае это уже не так.

Приложения

Матрица теплопроводности

Закон теплопроводности Фурье, выражающий тепловой поток через градиент температуры, для анизотропных сред записывается как , где – симметричная матрица теплопроводности . Отрицательное значение введено в закон Фурье, чтобы отразить ожидание того, что тепло всегда будет течь от горячего к холодному. Другими словами, поскольку температурный градиент всегда направлен от холода к горячему, ожидается, что тепловой поток будет иметь отрицательный внутренний продукт, так что . Тогда замена закона Фурье дает это ожидание как , подразумевая, что матрица проводимости должна быть положительно определенной.

Смотрите также

Примечания

  1. ^ «Приложение C: Положительные полуопределенные и положительно определенные матрицы». Оценка параметров для ученых и инженеров : 259–263. дои : 10.1002/9780470173862.app3.
  2. ^ Бойд, Стивен; Ванденберге, Ливен (8 марта 2004 г.). Выпуклая оптимизация. Издательство Кембриджского университета. ISBN 978-0-521-83378-3.
  3. ^ Хорн и Джонсон (2013), с. 440, Теорема 7.2.7.
  4. ^ Хорн и Джонсон (2013), с. 441, Теорема 7.2.10.
  5. ^ Хорн и Джонсон (2013), с. 452, Теорема 7.3.11.
  6. ^ Хорн и Джонсон (2013), с. 439, теорема 7.2.6 с
  7. ^ Хорн и Джонсон (2013), с. 431, следствие 7.1.7.
  8. ^ Хорн и Джонсон (2013), с. 485, Теорема 7.6.1.
  9. ^ Хорн и Джонсон (2013), с. 438, Теорема 7.2.1.
  10. ^ Хорн и Джонсон (2013), с. 495, следствие 7.7.4(а)
  11. ^ ab Horn & Johnson (2013), с. 430, Замечание 7.1.3
  12. ^ Хорн и Джонсон (2013), с. 431, Замечание 7.1.8
  13. ^ Хорн и Джонсон (2013), с. 430
  14. ^ Волкович, Генри; Стян, Джордж П.Х. (1980). «Границы собственных значений с использованием трассировок». Линейная алгебра и ее приложения . Эльзевир (29): 471–506.
  15. ^ Хорн и Джонсон (2013), с. 479, Теорема 7.5.3.
  16. ^ Хорн и Джонсон (2013), с. 509, Теорема 7.8.16.
  17. ^ Стян, врач общей практики (1973). «Произведения Адамара и многомерный статистический анализ». Линейная алгебра и ее приложения . 6 : 217–240., следствие 3.6, с. 227
  18. ^ Бхатия, Раджендра (2007). Положительно определенные матрицы . Принстон, Нью-Джерси: Издательство Принстонского университета. п. 8. ISBN  978-0-691-12918-1.
  19. ^ Вайсштейн, Эрик В. Положительно определенная матрица. Из MathWorld — веб-ресурса Wolfram . Доступ: 26 июля 2012 г.

Рекомендации

Внешние ссылки