stringtranslate.com

Определенная матрица

В математике симметричная матрица с действительными элементами является положительно определенной, если действительное число положительно для каждого ненулевого действительного вектора-столбца, где — транспонированный вектор -строка [1]. В более общем смысле, эрмитова матрица (то есть комплексная матрица, равная своему сопряженному транспонированному элементу ) является положительно определенной , если действительное число положительно для каждого ненулевого комплексного вектора-столбца , где обозначает сопряженный транспонированный элемент.

Положительно-полуопределенные матрицы определяются аналогично, за исключением того, что скаляры и должны быть положительными или нулевыми (то есть неотрицательными). Отрицательно-определенные и отрицательно-полуопределенные матрицы определяются аналогично. Матрица, которая не является положительно-полуопределенной и не является отрицательно-полуопределенной, иногда называется неопределенной .

Последствия

Из приведенных выше определений следует, что матрица положительно определена тогда и только тогда, когда она является матрицей положительно определенной квадратичной формы или эрмитовой формы . Другими словами, матрица положительно определена тогда и только тогда, когда она определяет скалярное произведение .

Положительно-определенные и положительно-полуопределенные матрицы можно характеризовать многими способами, что может объяснить важность этого понятия в различных разделах математики. Матрица M является положительно-определенной тогда и только тогда, когда она удовлетворяет любому из следующих эквивалентных условий.

Матрица является положительно полуопределенной, если она удовлетворяет аналогичным эквивалентным условиям, где «положительная» заменяется на «неотрицательная», «обратимая матрица» заменяется на «матрица», а слово «ведущая» удаляется.

Положительно-определенные и положительно-полуопределенные вещественные матрицы лежат в основе выпуклой оптимизации , поскольку, если задана функция многих вещественных переменных, которая дважды дифференцируема , то если ее матрица Гессе (матрица ее вторых частных производных) положительно определена в точке , то функция выпукла вблизи точки p , и, наоборот, если функция выпукла вблизи точки p, то матрица Гессе положительно-полуопределена в точке p.

Множество положительно определенных матриц представляет собой открытый выпуклый конус , тогда как множество положительно полуопределенных матриц представляет собой замкнутый выпуклый конус. [2]

Некоторые авторы используют более общие определения определенности, включая некоторые несимметричные действительные матрицы или неэрмитовы комплексные матрицы.

Определения

В следующих определениях — транспонирование — сопряженное транспонирование и обозначает n - мерный нулевой вектор.

Определения для действительных матриц

Симметричная вещественная матрица называется положительно определенной, если для всех ненулевых матриц Формально ,

Симметричная действительная матрица называется положительно-полуопределенной или неотрицательно-определенной, если для всех Формально ,

Симметричная вещественная матрица называется отрицательно определенной, если для всех ненулевых матриц Формально ,

Симметричная действительная матрица называется отрицательно-полуопределенной или неположительно-определенной, если для всех из Формально,

Симметричная действительная матрица, которая не является ни положительно полуопределенной, ни отрицательно полуопределенной, называется неопределенной .

Определения комплексных матриц

Все следующие определения включают в себя термин Обратите внимание, что это всегда действительное число для любой эрмитовой квадратной матрицы

Эрмитова комплексная матрица называется положительно определенной, если для всех ненулевых в Формально,

Эрмитова комплексная матрица называется положительно полуопределенной или неотрицательно определенной, если для всех из Формально,

Эрмитова комплексная матрица называется отрицательно определенной, если для всех ненулевых матриц Формально ,

Эрмитова комплексная матрица называется отрицательно полуопределенной или неположительно определенной, если для всех из Формально,

Эрмитова комплексная матрица, которая не является ни положительно полуопределенной, ни отрицательно полуопределенной, называется неопределенной .

Согласованность между реальными и сложными определениями

Поскольку каждая действительная матрица также является комплексной матрицей, определения «определенности» для двух классов должны совпадать.

Для комплексных матриц наиболее общее определение гласит, что является положительно определенной тогда и только тогда, когда является действительной и положительной для каждого ненулевого комплексного вектора-столбца. Это условие подразумевает, что является эрмитовой (т.е. ее транспонированная матрица равна своей сопряженной), поскольку , будучи действительной, она равна своей сопряженной транспонированной матрице для каждого , что подразумевает

По этому определению положительно определенная вещественная матрица является эрмитовой, следовательно, симметричной; и положительна для всех ненулевых вещественных векторов-столбцов. Однако одного последнего условия недостаточно, чтобы быть положительно определенной. Например, если

тогда для любого действительного вектора с элементами и мы имеем который всегда положителен, если не равен нулю. Однако, если это комплексный вектор с элементами 1 и получаем

что не является реальным. Следовательно, не является положительно-определенным.

С другой стороны, для симметричной действительной матрицы условие « для всех ненулевых действительных векторов» подразумевает , что она положительно определена в комплексном смысле.

Обозначение

Если эрмитова матрица положительно полуопределена, то иногда пишут , а если положительно определена, то пишут , чтобы обозначить , что отрицательно полуопределена, то пишут , а чтобы обозначить , что отрицательно определена, то пишут

Понятие пришло из функционального анализа , где положительные полуопределенные матрицы определяют положительные операторы . Если две матрицы и удовлетворяют, мы можем определить нестрогий частичный порядок , который является рефлексивным , антисимметричным и транзитивным ; Это не полный порядок , однако, как и в общем случае, может быть неопределенным.

Распространенной альтернативной записью является и для положительно полуопределенных и положительно определенных, отрицательно полуопределенных и отрицательно определенных матриц соответственно. Это может сбивать с толку, так как иногда неотрицательные матрицы (соответственно, неположительные матрицы) также обозначаются таким образом.

Примеры

Собственные значения

Пусть — эрмитова матрица (сюда входят и действительные симметричные матрицы ). Все собственные значения действительны, а их знак характеризует ее определенность:

Пусть будет собственным разложением , где — унитарная комплексная матрица , столбцы которой образуют ортонормированный базис собственных векторов , а — вещественная диагональная матрица , главная диагональ которой содержит соответствующие собственные значения . Матрицу можно рассматривать как диагональную матрицу , которая была перевыражена в координатах базиса (собственных векторов) Иными словами, применение к некоторому вектору дает то же самое, что и изменение базиса на систему координат собственного вектора с помощью дает применение преобразования растяжения к результату, дает и затем изменение базиса обратно с помощью дает

Имея это в виду, однозначная замена переменной показывает, что является действительным и положительным для любого комплексного вектора тогда и только тогда, когда является действительным и положительным для любого, другими словами, если является положительно определенным. Для диагональной матрицы это верно только в том случае, если каждый элемент главной диагонали – то есть каждое собственное значение – является положительным. Поскольку спектральная теорема гарантирует, что все собственные значения эрмитовой матрицы являются действительными, положительность собственных значений можно проверить с помощью правила Декарта чередования знаков , когда доступен характеристический многочлен действительной симметричной матрицы .

Разложение

Пусть — эрмитова матрица . Она положительно полуопределена тогда и только тогда, когда ее можно разложить в произведение матрицы на ее сопряженную транспонированную матрицу .

Когда является действительным, может быть также действительным и разложение может быть записано как

положительно определена тогда и только тогда, когда существует такое разложение с обратимым . В более общем смысле, положительно полуопределена с рангом тогда и только тогда, когда существует разложение с матрицей полного ранга строки (т.е. ранга ). Более того, для любого разложения [3]

Доказательство

Если то so положительно полуопределен. Если более того обратим, то неравенство строгое, так как so положительно определен. Если имеет ранг , то

В другом направлении, предположим, что является положительно полуопределенной. Так как является эрмитовой, она имеет собственное разложение , где является унитарным и является диагональной матрицей, элементы которой являются собственными значениями Поскольку является положительно полуопределенной, собственные значения являются неотрицательными действительными числами, поэтому можно определить как диагональную матрицу, элементы которой являются неотрицательными квадратными корнями собственных значений. Тогда для Если к тому же является положительно определенной, то собственные значения (строго) положительны, поэтому является обратимой, и, следовательно, также является обратимой. Если имеет ранг, то она имеет точно положительные собственные значения, а остальные равны нулю, следовательно, во всех, кроме строк, все обнуляются. Обрезание нулевых строк дает матрицу , такую ​​что

Столбцы можно рассматривать как векторы в комплексном или действительном векторном пространстве соответственно. Тогда элементы являются внутренними произведениями (то есть скалярными произведениями в действительном случае) этих векторов Другими словами, эрмитова матрица положительно полуопределена тогда и только тогда, когда она является матрицей Грама некоторых векторов Она положительно определена тогда и только тогда, когда она является матрицей Грама некоторых линейно независимых векторов. В общем случае ранг матрицы Грама векторов равен размерности пространства, охватываемого этими векторами. [4]

Единственность с точностью до унитарных преобразований

Разложение не является единственным: если для некоторой матрицы и если — любая унитарная матрица (имеется в виду ), то для

Однако это единственный способ, которым два разложения могут различаться: Разложение уникально с точностью до унитарных преобразований . Более формально, если — матрица и — матрица такая, что тогда существует матрица с ортонормированными столбцами (значение ), такая, что [5] Когда это означает — унитарно .

Это утверждение имеет интуитивную геометрическую интерпретацию в вещественном случае: пусть столбцы и будут векторами и в Действительная унитарная матрица является ортогональной матрицей , которая описывает жесткое преобразование (изометрию евклидова пространства ), сохраняющее точку 0 (т.е. вращения и отражения , без переносов). Следовательно, скалярные произведения и равны тогда и только тогда, когда некоторое жесткое преобразование преобразует векторы в (и 0 в 0).

Квадратный корень

Эрмитова матрица положительно полуопределена тогда и только тогда, когда существует положительно полуопределенная матрица (в частности , эрмитова, поэтому ), удовлетворяющая Эта матрица уникальна, [6] называется неотрицательным квадратным корнем из и обозначается Когда является положительно определенной, поэтому является , поэтому она также называется положительным квадратным корнем из

Неотрицательный квадратный корень не следует путать с другими разложениями. Некоторые авторы используют название квадратный корень для любого такого разложения, или в частности для разложения Холецкого , или любого разложения вида; другие используют его только для неотрицательного квадратного корня.

Если тогда

Разложение Холецкого

Эрмитову положительно полуопределенную матрицу можно записать как , где — нижняя треугольная с неотрицательной диагональю (эквивалентно , где — верхняя треугольная ); это разложение Холецкого . Если — положительно определенная, то диагональ положительна и разложение Холецкого уникально. Наоборот, если — нижняя треугольная с неотрицательной диагональю , то — положительно полуопределенная. Разложение Холецкого особенно полезно для эффективных численных вычислений. Близким разложением является разложение ЛПН , где — диагональная и — нижняя унитреугольная .

Теорема Уильямсона

Любая положительно определенная эрмитова вещественная матрица может быть диагонализирована с помощью симплектических (вещественных) матриц. Точнее, теорема Уильямсона гарантирует существование симплектических и диагональных вещественных положительных матриц, таких что .

Другие характеристики

Пусть будет действительной симметричной матрицей , и пусть будет «единичным шаром», определяемым формулой Тогда мы имеем следующее

Пусть — эрмитова матрица . Следующие свойства эквивалентны положительной определенности:

Соответствующая полуторалинейная форма является внутренним произведением
Полуторалинейная форма , определяемая как , является функцией от до , такой что для всех и в , где — сопряженное транспонирование Для любой комплексной матрицы эта форма линейна по и полулинейна по Следовательно, форма является скалярным произведением на тогда и только тогда, когда является вещественной и положительной для всех ненулевых , то есть тогда и только тогда, когда является положительно определенной. (На самом деле, каждое скалярное произведение на возникает таким образом из эрмитовой положительно определенной матрицы.)
Все его главные главные второстепенные мелодии положительны
k - й ведущий главный минор матрицы является определителем ее верхней левой подматрицы. Оказывается, матрица положительно определена тогда и только тогда, когда все эти определители положительны. Это условие известно как критерий Сильвестра и обеспечивает эффективную проверку положительной определенности симметричной вещественной матрицы. А именно, матрица сводится к верхней треугольной матрице с помощью элементарных строчных операций , как в первой части метода исключения Гаусса , заботясь о сохранении знака ее определителя во время процесса поворота . Поскольку k -й ведущий главный минор треугольной матрицы является произведением ее диагональных элементов до строки, критерий Сильвестра эквивалентен проверке того, являются ли все ее диагональные элементы положительными. Это условие можно проверять каждый раз, когда получается новая строка треугольной матрицы.

Положительно полуопределенная матрица положительно определена тогда и только тогда, когда она обратима . [7] Матрица отрицательно (полу)определена тогда и только тогда, когда она положительно (полу)определена.

Квадратичные формы

(Чисто) квадратичная форма, связанная с действительной матрицей , — это функция , которую для всех можно считать симметричной, заменив ее на , поскольку любая асимметричная часть будет обнулена в двустороннем произведении.

Симметричная матрица положительно определена тогда и только тогда, когда ее квадратичная форма является строго выпуклой функцией .

В более общем случае любая квадратичная функция от до может быть записана как где — симметричная матрица, — действительный вектор n , а — действительная константа. В этом случае это парабола, и, как и в случае, мы имеем

Теорема: Эта квадратичная функция строго выпукла и, следовательно, имеет единственный конечный глобальный минимум тогда и только тогда, когда она положительно определена.

Доказательство: Если положительно определена, то функция строго выпукла. Ее градиент равен нулю в единственной точке, которая должна быть глобальным минимумом, поскольку функция строго выпукла. Если не положительно определена, то существует некоторый вектор , такой что функция является прямой или нисходящей параболой, то есть не строго выпуклой и не имеющей глобального минимума.

По этой причине положительно определенные матрицы играют важную роль в задачах оптимизации .

Одновременная диагонализация

Одну симметричную матрицу и другую матрицу, которая является как симметричной, так и положительно определенной, можно одновременно диагонализировать . Это так, хотя одновременная диагонализация не обязательно выполняется с преобразованием подобия . Этот результат не распространяется на случай трех и более матриц. В этом разделе мы пишем для действительного случая. Расширение на комплексный случай происходит немедленно.

Пусть будет симметричной и симметричной и положительно определенной матрицей. Запишем обобщенное уравнение собственных значений как , где мы накладываем , что будет нормализовано, т.е. Теперь мы используем разложение Холецкого , чтобы записать обратное как Умножая на и позволяя мы получаем что можно переписать как где Манипуляция теперь дает где — матрица, имеющая в качестве столбцов обобщенные собственные векторы и — диагональная матрица обобщенных собственных значений. Теперь предварительное умножение с дает окончательный результат: и но обратите внимание, что это больше не ортогональная диагонализация относительно внутреннего произведения , где На самом деле мы диагонализировали относительно внутреннего произведения, индуцированного [8]

Обратите внимание, что этот результат не противоречит тому, что говорится об одновременной диагонализации в статье Diagonalizable matrix , которая относится к одновременной диагонализации с помощью преобразования подобия. Наш результат здесь больше похож на одновременную диагонализацию двух квадратичных форм и полезен для оптимизации одной формы при условиях на другой.

Характеристики

Индуцированный частичный порядок

Для произвольных квадратных матриц мы пишем , если ie, является положительно полуопределенной. Это определяет частичный порядок на множестве всех квадратных матриц. Аналогично можно определить строгий частичный порядок. Порядок называется порядком Левнера .

Обратная положительно определенная матрица

Каждая положительно определенная матрица обратима , и ее обратная матрица также положительно определена. [9] Если то [10] Более того, по теореме о минимуме-максимуме k -е наибольшее собственное значение больше или равно k -му наибольшему собственному значению

Масштабирование

Если положительно определено и является действительным числом, то положительно определено. [11]

Добавление

Умножение

След

Диагональные элементы положительно-полуопределенной матрицы являются действительными и неотрицательными. Как следствие , след , Кроме того, [13] поскольку каждая главная подматрица (в частности, 2-на-2) является положительно-полуопределенной,

и таким образом, когда

Эрмитова матрица положительно определена, если она удовлетворяет следующим неравенствам следов: [14]

Другим важным результатом является то, что для любых и положительно-полуопределенных матриц Это следует из записи: Матрица является положительно-полуопределенной и, таким образом, имеет неотрицательные собственные значения, сумма которых, след, поэтому также неотрицательна.

продукт Адамара

Если хотя не обязательно положительно полуопределено, произведение Адамара равно (этот результат часто называют теоремой о произведении Шура ). [15]

Относительно произведения Адамара двух положительно полуопределенных матриц имеются два примечательных неравенства:

продукт Кронекера

Если хотя не обязательно положительно полуопределен, произведение Кронекера

Произведение Фробениуса

Если хотя не обязательно положительно полуопределено, то скалярное произведение Фробениуса (Ланкастер–Тисменецкий, Теория матриц , стр. 218).

Выпуклость

Множество положительно полуопределенных симметричных матриц является выпуклым . То есть, если и положительно полуопределены, то для любого между 0 и 1 также положительно полуопределено. Для любого вектора :

Это свойство гарантирует, что задачи полуопределенного программирования сходятся к глобально оптимальному решению.

Связь с косинусом

Положительная определенность матрицы выражает то, что угол между любым вектором и его изображением всегда равен

угол между и

Дополнительные свойства

  1. Если — симметричная матрица Тёплица , т.е. элементы заданы как функция их абсолютных разностей индексов: и выполняется строгое неравенство , то является строго положительно определенной.
  2. Пусть и эрмитовы. Если (соотв., ), то (соотв., ). [18]
  3. Если является действительным, то существует такое , что где — единичная матрица .
  4. Если обозначает ведущий минор, то является k -м опорным элементом при LU-разложении .
  5. Матрица отрицательно определена, если ее старший главный минор порядка k отрицателен, когда нечетен, и положителен, когда четен.
  6. Если — действительная положительно определенная матрица, то существует положительное действительное число такое, что для любого вектора
  7. Эрмитова матрица положительно полуопределена тогда и только тогда, когда все ее главные миноры неотрицательны. Однако недостаточно рассматривать только ведущие главные миноры, как это проверяется на диагональной матрице с элементами 0 и −1.

Блочные матрицы и подматрицы

Положительная матрица также может быть определена блоками :

где каждый блок Применяя условие положительности, немедленно следует, что и являются эрмитовыми, и

У нас это есть для всех комплексов и в частности для Тогда

Аналогичный аргумент можно применить к и, таким образом, мы приходим к выводу, что и и должны быть положительно определенными. Аргумент можно расширить, чтобы показать, что любая главная подматрица сама по себе положительно определена.

Обратные результаты можно доказать, наложив более сильные условия на блоки, например, используя дополнение Шура .

Локальные экстремумы

Общую квадратичную форму на действительных переменных всегда можно записать как где — вектор-столбец с этими переменными, а — симметричная действительная матрица. Таким образом, положительно определенная матрица означает, что имеет единственный минимум (ноль), когда — ноль, и строго положительна для любого другого

В более общем случае дважды дифференцируемая действительная функция от действительных переменных имеет локальный минимум в аргументах , если ее градиент равен нулю, а ее гессиан (матрица всех вторых производных) положительно полуопределен в этой точке. Аналогичные утверждения можно сделать для отрицательно определенных и полуопределенных матриц.

Ковариация

В статистике ковариационная матрица многомерного распределения вероятностей всегда положительно полуопределена; и она положительно определена, если только одна переменная не является точной линейной функцией других. Наоборот, каждая положительно полуопределенная матрица является ковариационной матрицей некоторого многомерного распределения.

Расширение для неэрмитовых квадратных матриц

Определение положительно определенной можно обобщить, обозначив любую комплексную матрицу (например, действительную несимметричную) как положительно определенную, если для всех ненулевых комплексных векторов , где обозначает действительную часть комплексного числа [19] Только эрмитова часть определяет, является ли матрица положительно определенной, и оценивается в более узком смысле выше. Аналогично, если и являются действительными, мы имеем для всех действительных ненулевых векторов тогда и только тогда, когда симметричная часть положительно определена в более узком смысле. Сразу ясно, что нечувствительна к транспонированию

Следовательно, несимметричная вещественная матрица с только положительными собственными значениями не обязательно должна быть положительно определенной. Например, матрица имеет положительные собственные значения, но не является положительно определенной; в частности, отрицательное значение получается при выборе (который является собственным вектором, связанным с отрицательным собственным значением симметричной части ).

Подводя итог, можно сказать, что отличительной чертой между реальным и комплексным случаем является то, что ограниченный положительный оператор в комплексном гильбертовом пространстве обязательно является эрмитовым или самосопряженным. Общее утверждение можно аргументировать с помощью тождества поляризации . В реальном случае это уже не так.

Приложения

Матрица теплопроводности

Закон теплопроводности Фурье, дающий тепловой поток в терминах градиента температуры , записывается для анизотропных сред как , в которой есть симметричная матрица теплопроводности . Отрицательное вставлено в закон Фурье, чтобы отразить ожидание того, что тепло всегда будет течь от горячего к холодному. Другими словами, поскольку градиент температуры всегда направлен от холодного к горячему, ожидается, что тепловой поток будет иметь отрицательное внутреннее произведение с , так что Подстановка закона Фурье затем дает это ожидание как подразумевающее, что матрица теплопроводности должна быть положительно определенной.

Смотрите также

Ссылки

  1. ^ van den Bos, Adriaan (март 2007). "Приложение C: Положительно-полуопределенные и положительно-определенные матрицы". Оценка параметров для ученых и инженеров (.pdf) (онлайн-ред.). John Wiley & Sons. стр. 259–263. doi :10.1002/9780470173862. ISBN 978-047-017386-2.Печатное издание. ISBN 9780470147818 
  2. ^ Бойд, Стивен; Ванденберг, Ливен (8 марта 2004 г.). Выпуклая оптимизация . Cambridge University Press. doi :10.1017/cbo9780511804441. ISBN 978-0-521-83378-3.
  3. ^ Хорн и Джонсон (2013), стр. 440, Теорема 7.2.7
  4. ^ Хорн и Джонсон (2013), стр. 441, Теорема 7.2.10
  5. ^ Хорн и Джонсон (2013), стр. 452, Теорема 7.3.11
  6. ^ Хорн и Джонсон (2013), стр. 439, Теорема 7.2.6 с
  7. ^ Хорн и Джонсон (2013), стр. 431, Следствие 7.1.7
  8. ^ Хорн и Джонсон (2013), стр. 485, Теорема 7.6.1
  9. ^ Хорн и Джонсон (2013), стр. 438, Теорема 7.2.1
  10. ^ Хорн и Джонсон (2013), стр. 495, Следствие 7.7.4(a)
  11. ^ ab Horn & Johnson (2013), стр. 430, Наблюдение 7.1.3
  12. ^ Хорн и Джонсон (2013), стр. 431, Наблюдение 7.1.8
  13. ^ Хорн и Джонсон (2013), стр. 430
  14. ^ Волкович, Генри; Стиан, Джордж PH (1980). «Границы собственных значений с использованием следов». Линейная алгебра и ее приложения (29). Elsevier: 471–506.
  15. ^ Хорн и Джонсон (2013), стр. 479, Теорема 7.5.3
  16. ^ Хорн и Джонсон (2013), стр. 509, Теорема 7.8.16
  17. ^ Styan, GP (1973). «Продукты Адамара и многомерный статистический анализ». Линейная алгебра и ее приложения . 6 : 217–240., Следствие 3.6, стр. 227
  18. ^ Бхатия, Раджендра (2007). Положительно определенные матрицы . Принстон, Нью-Джерси: Princeton University Press. стр. 8. ISBN  978-0-691-12918-1.
  19. ^ Weisstein, Eric W. "Положительно определенная матрица". MathWorld . Wolfram Research . Получено 26 июля 2012 г. .

Источники

Внешние ссылки