В теории вероятностей и статистике ковариационная матрица (также известная как автоковариационная матрица , дисперсионная матрица , дисперсионная матрица или дисперсионно-ковариационная матрица ) — это квадратная матрица, задающая ковариацию между каждой парой элементов заданного случайного вектора .
Интуитивно, ковариационная матрица обобщает понятие дисперсии на множество измерений. Например, вариация в наборе случайных точек в двумерном пространстве не может быть полностью охарактеризована одним числом, и дисперсии в направлениях и не будут содержать всю необходимую информацию; для полной характеристики двумерной вариации потребуется матрица.
Ковариационная матрица случайного вектора обычно обозначается как , или .
Определение
В этой статье жирным шрифтом без нижнего индекса обозначаются случайные векторы, а римскими шрифтами с нижним индексом обозначаются скалярные случайные величины.
Номенклатуры различаются. Некоторые статистики, следуя вероятностнику Уильяму Феллеру в его двухтомной книге « Введение в теорию вероятностей и ее приложения» [2] , называют матрицу дисперсией случайного вектора , потому что она является естественным обобщением на более высокие измерения одномерной дисперсии. Другие называют ее ковариационной матрицей , потому что она является матрицей ковариаций между скалярными компонентами вектора .
Обе формы вполне стандартны, и между ними нет никакой двусмысленности. Матрицу также часто называют матрицей дисперсии-ковариации , поскольку диагональные члены на самом деле являются дисперсиями.
Автоковариационная матрица связана с автокорреляционной матрицей соотношением,
где автокорреляционная матрица определяется как .
Отношение к корреляционной матрице
Сущность, тесно связанная с ковариационной матрицей, — это матрица коэффициентов корреляции Пирсона между каждой из случайных величин в случайном векторе , которую можно записать как ,
где — матрица диагональных элементов (т.е. диагональная матрица дисперсий для ) .
Эквивалентно, корреляционную матрицу можно рассматривать как ковариационную матрицу стандартизированных случайных величин для .
Каждый элемент на главной диагонали корреляционной матрицы представляет собой корреляцию случайной величины с самой собой, которая всегда равна 1. Каждый недиагональный элемент находится в диапазоне от −1 до +1 включительно.
Обратная ковариационная матрица
Обратная матрица этой матрицы , если она существует, является обратной ковариационной матрицей (или обратной матрицей концентрации [ сомнительно – обсудить ] ), также известной как матрица точности (или матрица концентрации ). [3]
Точно так же, как ковариационная матрица может быть записана как масштабирование корреляционной матрицы по предельным дисперсиям:
Таким образом, используя идею частичной корреляции и частичной дисперсии, обратную ковариационную матрицу можно выразить аналогично:
Эта двойственность обусловливает ряд других двойственностей между маргинализацией и обусловливанием для гауссовских случайных величин.
Основные свойства
Для и , где — -мерная случайная величина, применяются следующие основные свойства: [4]
Матрица известна как матрица коэффициентов регрессии , в то время как в линейной алгебре она является дополнением Шура для .
Матрица коэффициентов регрессии часто может быть задана в транспонированной форме, , подходящей для последующего умножения вектора-строки объясняющих переменных, а не предварительного умножения вектора-столбца . В этой форме они соответствуют коэффициентам, полученным путем инвертирования матрицы нормальных уравнений обычных наименьших квадратов (OLS).
Частичная ковариационная матрица
Ковариационная матрица со всеми ненулевыми элементами говорит нам, что все отдельные случайные величины взаимосвязаны. Это означает, что переменные не только напрямую коррелируют, но и косвенно коррелируют через другие переменные. Часто такие косвенные, синфазные корреляции тривиальны и неинтересны. Их можно подавить, вычислив частичную ковариационную матрицу, то есть часть ковариационной матрицы, которая показывает только интересную часть корреляций.
Если два вектора случайных величин и коррелируют через другой вектор , то последние корреляции подавляются в матрице [6].
Частичная ковариационная матрица фактически является простой ковариационной матрицей, как если бы неинтересные случайные величины оставались постоянными.
Примененная к одному вектору, ковариационная матрица отображает линейную комбинацию c случайных величин X на вектор ковариаций с этими переменными: . Рассматриваемая как билинейная форма , она дает ковариацию между двумя линейными комбинациями: . Дисперсия линейной комбинации тогда равна , ее ковариации с самой собой.
Аналогично, (псевдо)обратная ковариационная матрица обеспечивает внутренний продукт , который индуцирует расстояние Махаланобиса , меру «маловероятности» c . [ необходима ссылка ]
Какие матрицы являются ковариационными?
Из тождества, приведенного выше, пусть будет действительным вектором, тогда
который всегда должен быть неотрицательным, поскольку он представляет собой дисперсию действительной случайной величины, поэтому ковариационная матрица всегда является положительно-полуопределенной матрицей .
Приведенный выше аргумент можно расширить следующим образом: где последнее неравенство следует из наблюдения, которое является скаляром.
Наоборот, каждая симметричная положительно полуопределенная матрица является ковариационной матрицей. Чтобы увидеть это, предположим, что является симметричной положительно полуопределенной матрицей. Из конечномерного случая спектральной теоремы следует, что имеет неотрицательный симметричный квадратный корень , который можно обозначить как M 1/2 . Пусть будет любой случайной величиной со значением вектора-столбца, ковариационная матрица которой является единичной матрицей. Тогда
Сложные случайные векторы
Дисперсия комплексной скалярной случайной величины с ожидаемым значением традиционно определяется с помощью комплексного сопряжения :
где комплексно сопряженное число комплексного числа обозначается ; таким образом , дисперсия комплексной случайной величины является действительным числом.
Если — вектор-столбец комплекснозначных случайных величин, то сопряженное транспонирование формируется как транспонированием, так и сопряжением. В следующем выражении произведение вектора на сопряженное транспонирование приводит к квадратной матрице, называемой ковариационной матрицей , как и ее ожидание: [7] : 293
Полученная таким образом матрица будет эрмитовой положительно-полуопределенной , [8] с действительными числами на главной диагонали и комплексными числами вне диагонали.
Диагональные элементы ковариационной матрицы действительны. [1] : 179
Псевдоковариационная матрица
Для сложных случайных векторов другой вид второго центрального момента — псевдоковариационная матрица (также называемая матрицей отношений ) — определяется следующим образом:
В отличие от ковариационной матрицы, определенной выше, эрмитово транспонирование заменяется транспозицией в определении. Его диагональные элементы могут быть комплекснозначными; это комплексная симметричная матрица .
Оценка
Если и являются центрированными матрицами данных размерности и соответственно, т.е. с n столбцами наблюдений p и q строк переменных, из которых были вычтены средние значения строк, то, если средние значения строк были оценены из данных, выборочные ковариационные матрицы и могут быть определены как
или, если средние значения строк были известны априори,
Эти эмпирические выборочные ковариационные матрицы являются наиболее простыми и наиболее часто используемыми оценщиками для ковариационных матриц, но существуют и другие оценщики, включая регуляризованные или сжатые оценщики, которые могут иметь лучшие свойства.
Стратегия эволюции , особое семейство эвристик рандомизированного поиска, в основе своей опирается на ковариационную матрицу в своем механизме. Оператор характеристической мутации извлекает шаг обновления из многомерного нормального распределения с использованием развивающейся ковариационной матрицы. Существует формальное доказательство того, что ковариационная матрица стратегии эволюции адаптируется к обратной матрице Гессе поискового ландшафта с точностью до скалярного множителя и небольших случайных колебаний (доказано для стратегии с одним родителем и статической модели по мере увеличения размера популяции с опорой на квадратичное приближение). [10]
Интуитивно этот результат подтверждается обоснованием того, что оптимальное ковариационное распределение может предлагать шаги мутации, чьи контуры вероятности равной плотности соответствуют уровням ландшафта, и поэтому они максимизируют скорость прогресса.
Ковариационное картирование
В ковариационном отображении значения матрицы или отображаются в виде двумерной карты. Когда векторы и являются дискретными случайными функциями , карта показывает статистические связи между различными областями случайных функций. Статистически независимые области функций отображаются на карте как равнина нулевого уровня, в то время как положительные или отрицательные корреляции отображаются, соответственно, как холмы или долины.
На практике векторы столбцов и получаются экспериментально как строки выборок, например,
где - i -е дискретное значение в выборке j случайной функции . Ожидаемые значения, необходимые в формуле ковариации, оцениваются с использованием выборочного среднего , например
, а ковариационная матрица оценивается с помощью выборочной ковариационной матрицы
, где угловые скобки обозначают выборочное усреднение, как и прежде, за исключением того, что следует сделать поправку Бесселя, чтобы избежать смещения . Используя эту оценку, частичная ковариационная матрица может быть вычислена как,
где обратная косая черта обозначает левый оператор деления матрицы , который обходит требование инвертировать матрицу и доступен в некоторых вычислительных пакетах, таких как Matlab . [11]
Рис. 1 иллюстрирует, как строится частичная ковариационная карта на примере эксперимента, проведенного на лазере на свободных электронах FLASH в Гамбурге. [12] Случайная функция представляет собой спектр времени пролета ионов от кулоновского взрыва молекул азота, многократно ионизированных лазерным импульсом. Поскольку при каждом лазерном импульсе ионизируется всего несколько сотен молекул, спектры одиночных импульсов сильно флуктуируют. Однако сбор таких спектров, как правило , и их усреднение по дает гладкий спектр , который показан красным в нижней части рис. 1. Средний спектр показывает несколько ионов азота в виде пиков, уширенных их кинетической энергией, но для нахождения корреляций между стадиями ионизации и импульсами ионов требуется вычислить ковариационную карту.
В примере на рис. 1 спектры и одинаковы, за исключением того, что диапазон времени пролета отличается. Панель a показывает , панель b показывает , а панель c показывает их разницу, которая составляет (обратите внимание на изменение цветовой шкалы). К сожалению, эта карта перегружена неинтересными синфазными корреляциями, вызванными интенсивностью лазера, флуктуирующей от выстрела к выстрелу. Для подавления таких корреляций интенсивность лазера регистрируется при каждом выстреле, помещается в и рассчитывается, как показывают панели d и e . Подавление неинтересных корреляций, однако, несовершенно, поскольку существуют другие источники синфазных флуктуаций, кроме интенсивности лазера, и в принципе все эти источники должны контролироваться в векторе . Однако на практике часто бывает достаточно перекомпенсировать частичную ковариационную поправку, как показывает панель f , где интересные корреляции импульсов ионов теперь четко видны в виде прямых линий, центрированных на стадиях ионизации атомарного азота.
Двумерная инфракрасная спектроскопия
Двумерная инфракрасная спектроскопия использует корреляционный анализ для получения 2D-спектров конденсированной фазы . Существует две версии этого анализа: синхронная и асинхронная . Математически первая выражается в терминах матрицы ковариации образца, а метод эквивалентен ковариационному отображению. [13]
^ abc Park, Kun Il (2018). Основы вероятности и стохастических процессов с приложениями к коммуникациям . Springer. ISBN 978-3-319-68074-3.
^ Уильям Феллер (1971). Введение в теорию вероятностей и ее приложения. Wiley. ISBN978-0-471-25709-7. Получено 10 августа 2012 г.
^ Вассерман, Ларри (2004). Вся статистика: краткий курс статистического вывода. Springer. ISBN0-387-40272-1.
^ Табога, Марко (2010). «Лекции по теории вероятностей и математической статистике».
^ Итон, Моррис Л. (1983). Многомерная статистика: подход векторного пространства . John Wiley and Sons. стр. 116–117. ISBN0-471-02776-6.
^ ab WJ Krzanowski "Принципы многомерного анализа" (Oxford University Press, Нью-Йорк, 1988), Глава 14.4; KV Mardia, JT Kent и JM Bibby "Многомерный анализ" (Academic Press, Лондон, 1997), Глава 6.5.3; TW Anderson "Введение в многомерный статистический анализ" (Wiley, Нью-Йорк, 2003), 3-е изд., Главы 2.5.1 и 4.3.1.
^ Лапидот, Амос (2009). Основы цифровой коммуникации . Cambridge University Press. ISBN978-0-521-19395-5.
^ Брукс, Майк. «Справочное руководство по Матрице».
^ Кесси, Агнан; Стриммер, Корбиниан; Левин, Алекс (2018). «Оптимальное отбеливание и декорреляция». Американский статистик . 72 (4). Тейлор и Фрэнсис: 309–314. arXiv : 1512.00809 . doi : 10.1080/00031305.2016.1277159.
^ Шир, ОМ; А. Йехудайофф (2020). «О ковариационно-гессеновской связи в эволюционных стратегиях». Теоретическая информатика . 801. Elsevier: 157–174. arXiv : 1806.03674 . doi : 10.1016/j.tcs.2019.09.002 .
^ LJ Frasinski "Методы ковариационного картирования" J. Phys. B: At. Mol. Opt. Phys. 49 152004 (2016), открытый доступ
^ ab O Kornilov, M Eckstein, M Rosenblatt, CP Schulz, K Motomura, A Rouzée, J Klei, L Foucar, M Siano, A Lübcke, F. Schapper, P Johnsson, DMP Holland, T Schlatholter, T Marchenko, S Düsterer, K Ueda, MJJ Vrakking и LJ Frasinski "Кулоновский взрыв двухатомных молекул в интенсивных полях XUV, отображенных с помощью частичной ковариации" J. Phys. B: At. Mol. Opt. Phys. 46 164028 (2013), открытый доступ
^ I Noda "Обобщенный метод двумерной корреляции, применимый к инфракрасной, рамановской и другим типам спектроскопии" Appl. Spectrosc. 47 1329–36 (1993)