Преобразование отбеливания или сферическое преобразование — это линейное преобразование , которое преобразует вектор случайных величин с известной ковариационной матрицей в набор новых переменных, ковариация которых является единичной матрицей , что означает, что они некоррелированы и каждая имеет дисперсию 1. [ 1] Преобразование называется «отбеливанием», поскольку оно превращает входной вектор в вектор белого шума .
С отбеливанием тесно связаны и другие трансформации:
Предположим, это случайный вектор (столбец) с неособой ковариационной матрицей и средним значением . Тогда преобразование с матрицей отбеливания, удовлетворяющей условию , дает выбеленный случайный вектор с единичной диагональной ковариацией.
Существует бесконечно много возможных матриц отбеливания , каждая из которых удовлетворяет вышеуказанному условию. Обычно используемые варианты: (отбеливание Махаланобиса или ZCA), где - разложение Холецкого (отбеливание Холецкого), [3] или собственная система (отбеливание PCA). [4]
Оптимальные преобразования отбеливания можно выделить путем исследования перекрестной ковариации и взаимной корреляции и . [3] Например, уникальное оптимальное преобразование отбеливания, обеспечивающее максимальную покомпонентную корреляцию между исходным и отбеленным, производится с помощью матрицы отбеливания, где – матрица корреляции и матрица отклонений.
Отбеливание матрицы данных происходит так же, как и для случайных величин. Эмпирическое преобразование отбеливания получается путем оценки ковариации (например, по максимальному правдоподобию ) и последующего построения соответствующей оцененной матрицы отбеливания (например, путем разложения Холецкого ).
Эта модальность является обобщением процедуры предварительного отбеливания, распространенной на более общие пространства, где обычно предполагается случайная функция или другие случайные объекты в гильбертовом пространстве . Одна из основных проблем распространения отбеливания на бесконечные измерения заключается в том, что ковариационный оператор имеет неограниченный обратный оператор по . Тем не менее, если предположить, что условие Пикара выполняется в пространстве значений ковариационного оператора, отбеливание становится возможным. [5] Затем оператор отбеливания может быть определен на основе факторизации Мура-Пенроуза, обратного ковариационному оператору, который имеет эффективное отображение на разложениях типа Карунена-Лоэва . Преимущество этих преобразований отбеливания заключается в том, что их можно оптимизировать в соответствии с основными топологическими свойствами данных (гладкость, непрерывность и непрерывность), создавая тем самым более надежные представления отбеливания. Многомерные характеристики данных можно использовать с помощью регрессоров ядра или систем базисных функций. [6]
Реализация нескольких процедур отбеливания в R , включая ZCA-отбеливание и PCA-отбеливание, а также CCA-отбеливание , доступна в «отбеливающем» пакете R [7], опубликованном на CRAN . Пакет R «pfica» [8] позволяет рассчитывать многомерные представления отбеливания с использованием систем базисных функций ( B-сплайны , базис Фурье и т. д.).