stringtranslate.com

Ковариационная матрица

Двумерная гауссова функция плотности вероятности с центром в точке (0, 0) с ковариационной матрицей, заданной выражением
Точки выборки из двумерного распределения Гаусса со стандартным отклонением 3 примерно в нижнем левом – верхнем правом направлении и 1 в ортогональном направлении. Поскольку компоненты x и y изменяются совместно, дисперсии и не полностью описывают распределение. Необходима ковариационная матрица ; направления стрелок соответствуют собственным векторам этой ковариационной матрицы, а их длины — квадратным корням собственных значений .

В теории вероятностей и статистике ковариационная матрица (также известная как матрица автоковариации , матрица дисперсии , матрица дисперсии или матрица дисперсии-ковариации ) представляет собой квадратную матрицу , дающую ковариацию между каждой парой элементов данного случайного вектора .

Интуитивно, ковариационная матрица обобщает понятие дисперсии на несколько измерений. Например, изменение набора случайных точек в двумерном пространстве не может быть полностью охарактеризовано одним числом, а отклонения в направлениях и не будут содержать всю необходимую информацию; матрица будет необходима для полной характеристики двумерного варианта.

Любая ковариационная матрица симметрична и положительно полуопределена , а ее главная диагональ содержит дисперсии (т. е. ковариацию каждого элемента с самим собой).

Ковариационная матрица случайного вектора обычно обозначается , или .

Определение

В этой статье жирный шрифт без индексов используется для обозначения случайных векторов, а римский шрифт с индексами используется для обозначения скалярных случайных величин.

Если записи в вектор-столбце

являются случайными переменными , каждая из которых имеет конечную дисперсию и ожидаемое значение , то матрица ковариации — это матрица, элементом которой является ковариация [1] : p. 177 

где оператор обозначает ожидаемое значение (среднее значение) своего аргумента.

Противоречивые номенклатуры и обозначения

Номенклатуры различаются. Некоторые статистики, следуя за вероятностом Уильямом Феллером в его двухтомной книге « Введение в теорию вероятностей и ее приложения» , [2] называют матрицу дисперсией случайного вектора , поскольку это естественное обобщение на более высокие измерения одномерного вектора. дисперсия. Другие называют ее ковариационной матрицей , потому что это матрица ковариаций между скалярными компонентами вектора .

Обе формы вполне стандартны, и между ними нет никакой двусмысленности. Матрицу также часто называют дисперсионно-ковариационной матрицей , поскольку диагональные члены на самом деле являются дисперсиями.

Для сравнения, обозначение матрицы взаимной ковариации между двумя векторами имеет вид

Характеристики

Связь с матрицей автокорреляции

Матрица автоковариации связана с матрицей автокорреляции соотношением

где матрица автокорреляции определяется как .

Связь с корреляционной матрицей

Объектом, тесно связанным с ковариационной матрицей, является матрица коэффициентов корреляции моментов произведения Пирсона между каждой из случайных величин в случайном векторе , которую можно записать как

где - матрица диагональных элементов (т.е. диагональная матрица дисперсий для ).

Аналогично, корреляционную матрицу можно рассматривать как ковариационную матрицу стандартизированных случайных величин для .

Каждый элемент на главной диагонали корреляционной матрицы представляет собой корреляцию случайной величины с самой собой, которая всегда равна 1. Каждый недиагональный элемент находится в диапазоне от -1 до +1 включительно.

Обратная ковариационная матрица

Обратная матрица, если она существует, является обратной ковариационной матрицей (или обратной матрицей концентрации), также известной как матрица точности (или матрица концентрации ). [3]

Точно так же, как ковариационная матрица может быть записана как масштабирование корреляционной матрицы с помощью предельных отклонений:

Итак, используя идею частичной корреляции и частичной дисперсии, обратную ковариационную матрицу можно выразить аналогичным образом:

Эта двойственность мотивирует ряд других двойственностей между маргинализацией и обусловленностью гауссовских случайных величин.

Основные свойства

Для и , где – -мерная случайная величина, применяются следующие основные свойства: [4]

  1. является положительно-полуопределенным , т.е.
  2. симметричен , т.е.
  3. Для любой постоянной (т.е. неслучайной) матрицы и постоянного вектора имеем
  4. Если – другой случайный вектор той же размерности , что и , то где – матрица взаимной ковариации и .

Блочные матрицы

Совместная средняя и совместная ковариационная матрица и могут быть записаны в блочной форме.

где и . _

и могут быть идентифицированы как матрицы дисперсии предельных распределений для и соответственно.

Если и совместно нормально распределены ,

тогда условное распределение для данного определяется выражением

[5]

определяется условным средним

и условная дисперсия

Матрица известна как матрица коэффициентов регрессии , а в линейной алгебре является дополнением Шура в .

Матрица коэффициентов регрессии часто может быть задана в транспонированной форме, подходящей для последующего умножения вектора-строки независимых переменных, а не для предварительного умножения вектора-столбца . В таком виде они соответствуют коэффициентам, полученным обращением матрицы нормальных уравнений обыкновенного наименьших квадратов (МНК).

Частичная ковариационная матрица

Ковариационная матрица со всеми ненулевыми элементами говорит нам, что все отдельные случайные величины взаимосвязаны. Это означает, что переменные не только напрямую коррелируют, но и косвенно коррелируют через другие переменные. Часто такие косвенные синфазные корреляции тривиальны и неинтересны. Их можно подавить, вычислив частичную ковариационную матрицу, то есть часть ковариационной матрицы, которая показывает только интересную часть корреляций.

Если два вектора случайных величин и коррелируют через другой вектор , то последние корреляции подавляются в матрице [6]

Матрица частичной ковариации фактически представляет собой простую ковариационную матрицу , как если бы неинтересные случайные величины оставались постоянными.

Ковариационная матрица как параметр распределения

Если вектор-столбец возможно коррелированных случайных величин совместно нормально распределен или, в более общем случае , эллиптически распределен , то его функция плотности вероятности может быть выражена через ковариационную матрицу следующим образом [6]

где и является определителем . _

Ковариационная матрица как линейный оператор

Применительно к одному вектору ковариационная матрица отображает линейную комбинацию c случайных величин X на вектор ковариаций с этими переменными: . Рассматриваемый как билинейная форма , он дает ковариацию между двумя линейными комбинациями: . Тогда дисперсия линейной комбинации — это ее ковариация сама с собой.

Точно так же (псевдо) обратная ковариационная матрица обеспечивает внутренний продукт , который индуцирует расстояние Махаланобиса , меру «маловероятности» c . [ нужна цитата ]

Какие матрицы являются ковариационными?

Из тождества, приведенного выше, пусть будет вектор с действительным знаком, тогда

которая всегда должна быть неотрицательной, поскольку это дисперсия действительной случайной величины, поэтому ковариационная матрица всегда является положительно-полуопределенной матрицей .

Приведенный выше аргумент можно расширить следующим образом:

И наоборот, каждая симметричная положительно полуопределенная матрица является ковариационной матрицей. Чтобы убедиться в этом, предположим, что это симметричная положительно-полуопределенная матрица. Из конечномерного случая спектральной теоремы следует, что имеет неотрицательный симметричный квадратный корень , который можно обозначить через M 1/2 . Пусть — любая случайная величина со значением вектора-столбца, чья ковариационная матрица является единичной матрицей. Затем

Сложные случайные векторы

Дисперсия сложной скалярной случайной величины с ожидаемым значением традиционно определяется с помощью комплексного сопряжения :

где обозначается комплексно-сопряженное комплексное число ; таким образом, дисперсия комплексной случайной величины является действительным числом.

Если - вектор-столбец случайных величин с комплексными значениями, то сопряженное транспонирование формируется как транспонированием, так и сопряжением. В следующем выражении произведение вектора на сопряженное с ним транспонирование дает в качестве математического ожидания квадратную матрицу, называемую ковариационной матрицей : [7] : p. 293 

,

Полученная таким образом матрица будет эрмитовой положительно-полуопределенной [ 8] с действительными числами на главной диагонали и комплексными числами на внедиагональной.

Характеристики

Псевдоковариационная матрица

Для комплексных случайных векторов другой вид второго центрального момента — матрица псевдоковариации (также называемая матрицей отношений ) определяется следующим образом:

В отличие от ковариационной матрицы, определенной выше, эрмитова транспозиция заменяется транспозицией в определении. Его диагональные элементы могут иметь комплексное значение; это сложная симметричная матрица .

Оценка

Если и являются центрированными матрицами данных размерности и соответственно, т.е. с n столбцами наблюдений p и q строк переменных, из которых были вычтены средние значения строк, то, если средние значения строк были оценены на основе данных, выборочные ковариационные матрицы и можно определить как

или, если средние значения строки были известны априори,

Эти ковариационные матрицы эмпирической выборки являются наиболее простыми и наиболее часто используемыми оценщиками для ковариационных матриц, но существуют и другие оценки, в том числе регуляризованные оценки или оценки сжатия, которые могут иметь лучшие свойства.

Приложения

Ковариационная матрица является полезным инструментом во многих различных областях. Из него может быть получена матрица преобразования , называемая преобразованием отбеливания , позволяющая полностью декоррелировать данные [ нужна цитата ] или, с другой точки зрения, найти оптимальную основу для представления данных в компактном виде [ цитата] требуется ] ( формальное доказательство и дополнительные свойства ковариационных матриц см. в разделе «Фактор Рэлея »). Это называется анализом главных компонент (PCA) и преобразованием Карунена-Лоэва (KL-преобразованием).

Ковариационная матрица играет ключевую роль в финансовой экономике , особенно в теории портфеля и ее теореме о разделении взаимных фондов , а также в модели ценообразования капитальных активов . Матрица ковариаций доходности различных активов используется для определения, при определенных допущениях, относительных сумм различных активов, которые инвесторы должны (в нормативном анализе ) или, по прогнозам, (в позитивном анализе ) предпочитают держать в контексте диверсификация .

Использование в оптимизации

Стратегия эволюции , особое семейство эвристик рандомизированного поиска, в своем механизме фундаментально опирается на ковариационную матрицу. Оператор характеристической мутации извлекает шаг обновления из многомерного нормального распределения, используя развивающуюся ковариационную матрицу. Существует формальное доказательство того, что ковариационная матрица стратегии эволюции адаптируется к обратной матрице Гессе ландшафта поиска, с точностью до скалярного коэффициента и небольших случайных флуктуаций (доказано для стратегии с одним родителем и статической модели, как численность популяции увеличивается, исходя из квадратичного приближения). [9] Интуитивно этот результат подтверждается тем, что оптимальное ковариационное распределение может предлагать этапы мутации, контуры вероятности эквивалентности которых соответствуют наборам уровней ландшафта, и поэтому они максимизируют скорость прогресса.

Ковариационное отображение

При ковариационном отображении значения матрицы или отображаются в виде двумерной карты. Когда векторы и являются дискретными случайными функциями , карта показывает статистические отношения между различными областями случайных функций. Статистически независимые области функций отображаются на карте как равнины нулевого уровня, а положительные или отрицательные корреляции отображаются соответственно в виде холмов или долин.

На практике векторы-столбцы и получаются экспериментально как строки выборок, например

где – i - е дискретное значение j -й выборки случайной функции . Ожидаемые значения, необходимые в формуле ковариации, оцениваются с использованием выборочного среднего значения , например

а ковариационная матрица оценивается с помощью выборочной ковариационной матрицы

где угловые скобки обозначают выборочное усреднение, как и раньше, за исключением того, что во избежание систематической ошибки необходимо внести поправку Бесселя . Используя эту оценку, матрицу частичной ковариации можно рассчитать как

где обратная косая черта обозначает левый оператор деления матрицы , который обходит требование инвертировать матрицу и доступен в некоторых вычислительных пакетах, таких как Matlab . [10]

Рисунок 1: Построение карты частичной ковариации молекул N 2 , подвергающихся кулоновскому взрыву, вызванному лазером на свободных электронах. [11] Панели a и b отображают два члена ковариационной матрицы, которая показана на панели c . Панель d отображает синфазные корреляции через флуктуации интенсивности лазера. Панель e отображает матрицу частичной ковариации, в которую исправлены флуктуации интенсивности. Панель f показывает, что 10%-ная чрезмерная коррекция улучшает карту и делает ион-ионные корреляции четко видимыми. Благодаря сохранению импульса эти корреляции выглядят как линии, приблизительно перпендикулярные линии автокорреляции (и периодическим модуляциям, вызываемым звоном детектора).

На рис. 1 показано, как строится карта частичной ковариации на примере эксперимента, проведенного на лазере на свободных электронах FLASH в Гамбурге. [11] Случайная функция представляет собой времяпролетный спектр ионов от кулоновского взрыва молекул азота, многократно ионизированных лазерным импульсом. Поскольку при каждом лазерном импульсе ионизируется всего несколько сотен молекул, спектры одиночных импульсов сильно флуктуируют. Однако обычно сбор таких спектров и их усреднение дает гладкий спектр , который показан красным внизу на рис. 1. Средний спектр обнаруживает несколько ионов азота в виде пиков, уширенных их кинетической энергией, но Чтобы найти корреляции между стадиями ионизации и импульсами ионов, необходимо рассчитать ковариационную карту.

В примере рис. 1 спектры и одинаковы, за исключением того, что различается диапазон времени пролета . На панели a показано , на панели b показано и на панели c показано их отличие, которое (обратите внимание на изменение цветовой шкалы). К сожалению, эта карта перегружена неинтересными синфазными корреляциями, вызванными колебаниями интенсивности лазера от выстрела к выстрелу. Чтобы подавить такие корреляции, интенсивность лазера регистрируется при каждом выстреле, вводится и рассчитывается, как показано на панелях d и e . Однако подавление неинтересных корреляций несовершенно, поскольку существуют и другие источники синфазных флуктуаций, помимо интенсивности лазера, и в принципе все эти источники должны контролироваться в векторе . Тем не менее, на практике часто бывает достаточно сверхкомпенсации частичной ковариационной коррекции, как показано на панели f , где теперь ясно видны интересные корреляции импульсов ионов в виде прямых линий, центрированных на стадиях ионизации атомарного азота.

Двумерная инфракрасная спектроскопия

Двумерная инфракрасная спектроскопия использует корреляционный анализ для получения двумерных спектров конденсированной фазы . Существует две версии этого анализа: синхронная и асинхронная . Математически первое выражается через выборочную ковариационную матрицу, и этот метод эквивалентен ковариационному картированию. [12]

Смотрите также

Рекомендации

  1. ^ abc Парк, Кун Иль (2018). Основы теории вероятности и случайных процессов с приложениями к средствам связи . Спрингер. ISBN 978-3-319-68074-3.
  2. ^ Уильям Феллер (1971). Введение в теорию вероятностей и ее приложения. Уайли. ISBN 978-0-471-25709-7. Проверено 10 августа 2012 г.
  3. ^ Вассерман, Ларри (2004). Вся статистика: краткий курс статистических выводов. Спрингер. ISBN 0-387-40272-1.
  4. ^ Табога, Марко (2010). «Лекции по теории вероятностей и математической статистике».
  5. ^ Итон, Моррис Л. (1983). Многомерная статистика: векторно-пространственный подход . Джон Уайли и сыновья. стр. 116–117. ISBN 0-471-02776-6.
  6. ^ ab WJ Кржановский «Принципы многомерного анализа» (Oxford University Press, Нью-Йорк, 1988), гл. 14,4; К. В. Мардиа, Дж. Т. Кент и Дж. М. Бибби «Многомерный анализ» (Academic Press, Лондон, 1997), глава 6.5.3; Т. В. Андерсон «Введение в многомерный статистический анализ» (Wiley, Нью-Йорк, 2003), 3-е изд., Главы 2.5.1 и 4.3.1.
  7. ^ Лапидот, Амос (2009). Фонд цифровых коммуникаций . Издательство Кембриджского университета. ISBN 978-0-521-19395-5.
  8. ^ Брукс, Майк. «Справочное руководство по матрицам». {{cite journal}}: Требуется цитировать журнал |journal=( помощь )
  9. ^ Шир, ОМ; А. Иегудаев (2020). «О ковариационно-гессианском отношении в эволюционных стратегиях». Теоретическая информатика . Эльзевир. 801 : 157–174. arXiv : 1806.03674 . дои : 10.1016/j.tcs.2019.09.002 .
  10. ^ Л. Дж. Фрасински «Методы ковариационного отображения» J. Phys. Летучая мышь. Мол. Опция Физ. 49 152004 (2016), открытый доступ
  11. ^ ab О Корнилов, М. Экстайн, М. Розенблатт, К. П. Шульц, К. Мотомура, А. Рузе, Дж. Клей, Л. Фукар, М. Сиано, А. Любке, Ф. Шаппер, П. Джонссон, DMP Holland, Т. Шлатхольтер, Т. Марченко, С. Дюстерер , К. Уеда, М.Дж. Враккинг и Л.Дж. Фрасински «Кулоновский взрыв двухатомных молекул в интенсивных XUV-полях, отображенный с помощью частичной ковариации» J. Phys. Летучая мышь. Мол. Опция Физ. 46 164028 (2013), открытый доступ
  12. ^ I Нода «Обобщенный метод двумерной корреляции, применимый к инфракрасной, рамановской и другим типам спектроскопии» Прикл. Спектроск. 47 1329–36 (1993)

дальнейшее чтение