stringtranslate.com

Распределение Марченко – Пастура

График распределения Марченко-Пастура для различных значений лямбда

В математической теории случайных матриц распределение Марченко –Пастура , или закон Марченко–Пастура , описывает асимптотическое поведение сингулярных чисел больших прямоугольных случайных матриц . Теорема названа в честь советских математиков Владимира Марченко и Леонида Пастура , которые доказали этот результат в 1967 году.

Если обозначает случайную матрицу, элементы которой являются независимыми одинаково распределенными случайными величинами со средним значением 0 и дисперсией , пусть

и пусть будут собственными значениями ( рассматриваемыми как случайные величины ). Наконец, рассмотрим случайную меру

подсчет количества собственных значений в подмножестве, включенном в .

Теорема . [ требуется ссылка ] Предположим, что так что отношение . Тогда (в слабой* топологии в распределении ), где

и

с

Закон Марченко–Пастура возникает также как свободный закон Пуассона в свободной теории вероятностей, имеющий скорость и размер скачка .

Моменты

Для каждого его -й момент равен [1]

Некоторые преобразования этого закона

Преобразование Стилтьеса определяется как

для комплексных чисел z с положительной мнимой частью, где комплексный квадратный корень также принимается имеющим положительную мнимую часть. [2] Преобразование Стилтьеса можно переупаковать в виде R-преобразования, которое задается как [3]

S-преобразование определяется как [3]

Для случая -преобразование [3] определяется выражением , где удовлетворяет закону Марченко-Пастура.

где

Для точного анализа регрессии высокой размерности в пропорциональном асимптотическом режиме часто удобной формой является упрощение

Следующие функции и , где удовлетворяет закону Марченко-Пастура, проявляются в предельных Bias и Variance соответственно, гребневой регрессии и других регуляризованных линейной регрессии. Можно показать, что и .

Применение к корреляционным матрицам

Для частного случая корреляционных матриц мы знаем, что и . Это ограничивает массу вероятности в интервале, определяемом как

Поскольку это распределение описывает спектр случайных матриц со средним значением 0, собственные значения корреляционных матриц, которые попадают в вышеупомянутый интервал, можно считать ложными или шумовыми. Например, получение корреляционной матрицы 10 доходностей акций, рассчитанных за период в 252 торговых дня, даст . Таким образом, из 10 собственных значений указанной корреляционной матрицы только значения выше 1,43 будут считаться существенно отличающимися от случайных.

Смотрите также

Ссылки

  1. ^ Бай и Сильверстайн 2010, Раздел 3.1.1.
  2. ^ Бай и Сильверстайн 2010, Раздел 3.3.1.
  3. ^ abc Тулино и Верду 2004, Раздел 2.2.