Отбеливающее преобразование или сферическое преобразование — это линейное преобразование , которое преобразует вектор случайных величин с известной ковариационной матрицей в набор новых переменных, ковариация которых является единичной матрицей , что означает, что они некоррелированы и каждая имеет дисперсию 1. [1] Преобразование называется «отбеливанием», потому что оно изменяет входной вектор на вектор белого шума .
С отбеливанием тесно связаны и некоторые другие преобразования:
Предположим, что — случайный вектор (столбец) с невырожденной ковариационной матрицей и средним значением . Тогда преобразование с отбеливающей матрицей, удовлетворяющей условию, дает отбеленный случайный вектор с единичной диагональной ковариацией.
Существует бесконечно много возможных матриц отбеливания , которые удовлетворяют вышеуказанному условию. Обычно используются следующие варианты: (Mahalanobis или ZCA-отбеливание), где — разложение Холецкого (отбеливание Холецкого), [3] или собственная система (PCA-отбеливание). [4]
Оптимальные отбеливающие преобразования можно выделить, исследуя кросс-ковариацию и кросс-корреляцию и . [3] Например, единственное оптимальное отбеливающее преобразование, достигающее максимальной покомпонентной корреляции между исходным и отбеленным изображением, создается с помощью отбеливающей матрицы , где — матрица корреляции и диагональная матрица дисперсии.
Отбеливание матрицы данных следует тем же преобразованиям, что и для случайных величин. Эмпирическое отбеливающее преобразование получается путем оценки ковариации (например, по максимальному правдоподобию ) и последующего построения соответствующей оценочной матрицы отбеливания (например, по разложению Холецкого ).
Эта модальность является обобщением процедуры предварительного отбеливания, распространенной на более общие пространства, где обычно предполагается, что это случайная функция или другие случайные объекты в гильбертовом пространстве . Одной из основных проблем расширения отбеливания на бесконечные измерения является то, что ковариационный оператор имеет неограниченную обратную функцию в . Тем не менее, если предположить, что условие Пикара выполняется для в пространстве диапазонов ковариационного оператора, отбеливание становится возможным. [5] Затем отбеливающий оператор может быть определен из факторизации обратного оператора Мура-Пенроуза ковариационного оператора, который имеет эффективное отображение на расширениях типа Карунена-Лоэва . Преимущество этих отбеливающих преобразований состоит в том, что их можно оптимизировать в соответствии с базовыми топологическими свойствами данных, тем самым создавая более надежные отбеливающие представления. Высокоразмерные характеристики данных могут быть использованы с помощью регрессоров ядра или систем базисных функций. [6]
Реализация нескольких процедур отбеливания в R , включая ZCA-беление и PCA-беление, а также CCA-беление , доступна в пакете R "whitening" [7], опубликованном на CRAN . Пакет R "pfica" [8] позволяет вычислять многомерные представления отбеливания с использованием систем базисных функций ( B-сплайны , базис Фурье и т. д.).