stringtranslate.com

QR-разложение

В линейной алгебре QR -разложение , также известное как QR-факторизация или QU-факторизация , представляет собой разложение матрицы A в произведение A =  QR  ортонормированной матрицы Q и верхней треугольной матрицы R. QR-разложение часто используется для решения линейной задачи наименьших квадратов (LLS) и является основой для конкретного алгоритма собственных значенийалгоритма QR .

Случаи и определения

Квадратная матрица

Любая действительная квадратная матрица A может быть разложена как

где Qортогональная матрица (ее столбцы — ортогональные единичные векторы , что означает ) , а R — верхнетреугольная матрица (также называемая правотреугольной матрицей). Если A обратим , то факторизация уникальна, если мы требуем, чтобы диагональные элементы R были положительными.

Если вместо этого A — комплексная квадратная матрица, то существует разложение A = QR , где Qунитарная матрица (поэтому сопряженное транспонирование ).

Если A имеет n линейно независимых столбцов, то первые n столбцов Q образуют ортонормированный базис для пространства столбцов A . В более общем смысле, первые k столбцов Q образуют ортонормированный базис для диапазона первых k столбцов A для любого 1 ≤ kn . [1] Тот факт, что любой столбец k таблицы A зависит только от первых k столбцов Q, соответствует треугольной форме  R . [1]

Прямоугольная матрица

В более общем смысле, мы можем факторизовать комплексную матрицу A размера m × n с mn как произведение унитарной матрицы Q размера m × m и верхней треугольной матрицы размера m × n R . Поскольку нижние ( mn ) строки верхней треугольной матрицы размера m × n полностью состоят из нулей, часто бывает полезно разделить R или оба R и Q :

где R 1 — верхнетреугольная матрица размера n × n , 0 — нулевая матрица ( mn ) × n , Q 1 — это m × n , Q 2 — это m ×( mn ) , а Q 1 и Q 2 оба иметь ортогональные столбцы.

Голуб и Ван Лоан (1996, §5.2) называют Q 1 R 1 тонкой QR -факторизацией A ; Трефетен и Бау называют это сокращенной QR-факторизацией . [1] Если A имеет полный ранг n и мы требуем, чтобы диагональные элементы R 1 были положительными, тогда R 1 и Q 1 уникальны, но в общем случае Q 2 нет. Тогда R 1 равен верхнему треугольному множителю разложения Холецкого A * A (AT A, если A вещественное ).

Разложения QL, RQ и LQ

Аналогично мы можем определить разложения QL, RQ и LQ, где Lнижняя треугольная матрица.

Вычисление QR-разложения

Существует несколько методов фактического вычисления QR-разложения, таких как процесс Грама-Шмидта , преобразования Хаусхолдера или вращения Гивенса . Каждый из них имеет ряд преимуществ и недостатков.

Использование процесса Грама – Шмидта

Рассмотрим процесс Грама – Шмидта, примененный к столбцам матрицы полного ранга столбца со скалярным произведением (или для сложного случая).

Определите проекцию :

затем:

Теперь мы можем выразить s в нашем недавно вычисленном ортонормированном базисе:

где . Это можно записать в матричной форме:

где:

и

Пример

Рассмотрим разложение

Напомним, что ортонормированная матрица обладает свойством .

Тогда мы можем рассчитать с помощью Грама – Шмидта следующим образом:

Таким образом, мы имеем

Связь с разложением RQ

Разложение RQ преобразует матрицу A в произведение верхнетреугольной матрицы R (также известной как правотреугольная) и ортогональной матрицы Q. Единственное отличие от QR-разложения — это порядок этих матриц.

QR-разложение представляет собой ортогонализацию по Граму-Шмидту столбцов A , начиная с первого столбца.

Разложение RQ представляет собой ортогонализацию по Граму – Шмидту строк A , начиная с последней строки.

Преимущества и недостатки

Процесс Грама-Шмидта по своей природе численно нестабильен. Хотя применение проекций имеет привлекательную геометрическую аналогию с ортогонализацией, сама ортогонализация подвержена численным ошибкам. Существенным преимуществом является простота реализации.

Использование отражений Хаусхолдера

Отражение домохозяина для QR-разложения: цель состоит в том, чтобы найти линейное преобразование, которое превращает вектор в вектор той же длины, который коллинеарен . Мы могли бы использовать ортогональную проекцию (Грама-Шмидта), но это будет численно нестабильно, если векторы и близки к ортогональным. Вместо этого отражение Хаусхолдера отражается через пунктирную линию (выбранную для разделения угла между и ). Максимальный угол при этом преобразовании составляет 45 градусов.

Отражение Хаусхолдера ( или преобразование Хаусхолдера ) — это преобразование, которое принимает вектор и отражает его относительно некоторой плоскости или гиперплоскости . Мы можем использовать эту операцию для вычисления QR- факторизации матрицы m - n с mn .

Q можно использовать для отражения вектора таким образом, что все координаты, кроме одной, исчезают.

Пусть – произвольный вещественный m -мерный вектор-столбец такой, что для скаляра α . Если алгоритм реализован с использованием арифметики с плавающей запятой , то α должен получить противоположный знак в качестве k -й координаты , где должна быть координата поворота, после которой все элементы равны 0 в окончательной верхней треугольной форме матрицы A , чтобы избежать потери значимости . В сложном случае положим [2]

и замените транспозицию сопряженной транспозицией в конструкции Q ниже.

Тогда где вектор [1 0 ⋯ 0] T , ||·|| является евклидовой нормой и представляет собой единичную матрицу размера m × m , положим

Или, если сложно

представляет собой матрицу Хаусхолдера размером m на m , которая одновременно симметрична и ортогональна (эрмитова и унитарна в комплексном случае), и

Это можно использовать для постепенного преобразования матрицы A размером m на n в верхнетреугольную форму. Сначала мы умножаем A на матрицу Хаусхолдера Q 1 , которую получаем, когда выбираем первый столбец матрицы для x . В результате получается матрица Q 1 A с нулями в левом столбце (кроме первой строки).

Это можно повторить для A ′ (полученного из Q 1 A путем удаления первой строки и первого столбца), в результате чего получается матрица Хаусхолдера Q2 . Обратите внимание, что Q2 меньше, чем Q 1 . Поскольку мы хотим, чтобы он действительно работал с Q 1 A вместо A ′, нам нужно расширить его в верхний левый угол, заполнив 1, или вообще:

После итераций этого процесса ,

– верхнетреугольная матрица. Итак, с

представляет собой QR-разложение .

Этот метод имеет большую численную стабильность , чем метод Грама – Шмидта, описанный выше.

В следующей таблице показано количество операций на k -м шаге QR-разложения с помощью преобразования Хаусхолдера, предполагая квадратную матрицу размера n .

Суммируя эти числа за n - 1 шагов (для квадратной матрицы размера n ), сложность алгоритма (с точки зрения умножения с плавающей запятой) определяется выражением

Пример

Рассчитаем разложение

Во-первых, нам нужно найти отражение, которое преобразует первый столбец матрицы A , вектор , в .

Сейчас,

и

Здесь,

и

Поэтому

и , а затем

Теперь наблюдайте:

итак у нас уже есть почти треугольная матрица. Нам нужно только обнулить запись (3, 2).

Возьмите минор (1, 1) , а затем примените этот процесс снова к

Тем же методом, что и выше, получаем матрицу преобразования Хаусхолдера

после выполнения прямой суммы с 1, чтобы убедиться, что следующий шаг процесса работает правильно.

Теперь мы находим

Или, до четырех десятичных цифр,

Матрица Q ортогональна, а R является верхнетреугольной, поэтому A = QR — требуемое разложение QR.

Преимущества и недостатки

Использование преобразований Хаусхолдера по своей сути является наиболее простым из численно устойчивых алгоритмов QR-разложения из-за использования отражений в качестве механизма создания нулей в R- матрице. Однако алгоритм отражения Хаусхолдера требует большой пропускной способности и не поддается распараллеливанию, поскольку каждое отражение, создающее новый нулевой элемент, изменяет всю матрицу Q и R.

Использование вращения Гивенса

QR-разложения также можно вычислить с помощью серии вращений Гивенса . Каждое вращение обнуляет элемент субдиагонали матрицы, образуя матрицу R. Объединение всех вращений Гивенса образует ортогональную матрицу Q.

На практике вращения Гивенса на самом деле не выполняются путем построения всей матрицы и ее умножения. Вместо этого используется процедура вращения Гивенса, которая выполняет эквивалент умножения разреженной матрицы Гивенса, без дополнительной работы по обработке разреженных элементов. Процедура вращения Гивенса полезна в ситуациях, когда необходимо обнулить лишь относительно небольшое количество недиагональных элементов, и ее легче распараллелить, чем преобразования Хаусхолдера .

Пример

Рассчитаем разложение

Во-первых, нам нужно сформировать матрицу вращения, которая обнулит самый нижний левый элемент . Мы формируем эту матрицу, используя метод вращения Гивенса, и вызываем матрицу . Сначала мы повернём вектор так , чтобы он указывал вдоль оси X. Этот вектор имеет угол . Мы создаем ортогональную матрицу вращения Гивенса :

И результат теперь имеет ноль в элементе.

Мы можем аналогичным образом сформировать матрицы Гивенса и , которые обнулят субдиагональные элементы и , образуя треугольную матрицу . Ортогональная матрица формируется из произведения всех матриц Гивенса . Таким образом, имеем , а QR- разложение равно .

Преимущества и недостатки

Разложение QR с помощью вращения Гивенса является наиболее сложным для реализации, поскольку порядок строк, необходимый для полного использования алгоритма, определить непросто. Однако у него есть значительное преимущество в том, что каждый новый нулевой элемент влияет только на строку с обнуляемым элементом ( i ) и строку выше ( j ). Это делает алгоритм вращения Гивенса более эффективным и распараллеливаемым, чем метод отражения Хаусхолдера.

Связь с определителем или произведением собственных значений

Мы можем использовать QR-разложение, чтобы найти определитель квадратной матрицы. Предположим, что матрица разложена как . Тогда у нас есть

можно выбрать так, что . Таким образом,

где - элементы на диагонали . Кроме того, поскольку определитель равен произведению собственных значений, мы имеем

где – собственные значения .

Мы можем распространить вышеуказанные свойства на неквадратную комплексную матрицу, введя определение QR-разложения для неквадратных комплексных матриц и заменив собственные значения сингулярными значениями.

Начните с QR-разложения для неквадратной матрицы A :

где обозначает нулевую матрицу и является унитарной матрицей.

Из свойств сингулярного разложения (СВД) и определителя матрицы имеем

где – сингулярные значения .

Обратите внимание, что сингулярные значения и идентичны, хотя их комплексные собственные значения могут быть разными. Однако если А квадратное, то

Отсюда следует, что QR-разложение можно использовать для эффективного вычисления произведения собственных или сингулярных значений матрицы.

Колонна поворотная

Повернутый QR отличается от обычного QR Грама-Шмидта тем, что он берет самый большой оставшийся столбец в начале каждого нового шага — поворот столбца — [3] и, таким образом, вводит матрицу перестановок P :

Поворот столбцов полезен, когда A имеет (почти) недостаточный ранг или подозревается в этом. Это также может улучшить числовую точность. P обычно выбирают так, чтобы диагональные элементы R были невозрастающими: . Это можно использовать для нахождения (числового) ранга A при меньших вычислительных затратах, чем разложение по сингулярным значениям , что составляет основу так называемых QR-алгоритмов выявления ранга .

Использование для решения линейных обратных задач

По сравнению с прямым обращением матрицы, обратные решения с использованием QR-разложения более стабильны численно, о чем свидетельствуют их уменьшенные числа обусловленности . [4]

Чтобы решить недоопределенную ( ) линейную задачу , где матрица имеет размеры и ранг , сначала найдите QR-факторизацию транспонирования : , где Q - ортогональная матрица (т. е. ), а R имеет специальную форму: . Вот квадратная правотреугольная матрица, нулевая матрица имеет размерность . После некоторой алгебры можно показать, что решение обратной задачи можно выразить следующим образом: где можно либо найти методом исключения Гаусса , либо вычислить непосредственно путем прямой замены . Последний метод отличается большей численной точностью и меньшим объемом вычислений.

Чтобы найти решение переопределенной ( ) задачи , которое минимизирует норму , сначала найдите QR-факторизацию : . Тогда решение можно выразить как , где – матрица, содержащая первые столбцы полного ортонормированного базиса , и где – как и раньше. Эквивалентно недоопределенному случаю, обратная замена может использоваться для быстрого и точного нахождения этого значения без явного инвертирования . ( и часто предоставляются числовыми библиотеками как «экономическое» QR-разложение.)

Обобщения

Разложение Ивасавы обобщает QR-разложение на полупростые группы Ли.

Смотрите также

Рекомендации

  1. ^ abc Трефетен, Ллойд Н .; Бау, Дэвид III (1997). Численная линейная алгебра . Филадельфия, Пенсильвания: Общество промышленной и прикладной математики . ISBN 978-0-898713-61-9.
  2. ^ Стер, Йозеф; Булирш, Роланд (2002), Введение в численный анализ (3-е изд.), Springer, стр. 225, ISBN 0-387-95452-Х
  3. ^ Стрэнг, Гилберт (2019). Линейная алгебра и обучение на данных (1-е изд.). Уэлсли: Уэлсли Кембридж Пресс. п. 143. ИСБН 978-0-692-19638-0.
  4. ^ Паркер, Роберт Л. (1994). Геофизическая обратная теория. Принстон, Нью-Джерси: Издательство Принстонского университета. Раздел 1.13. ISBN 978-0-691-20683-7. ОСЛК  1134769155.

дальнейшее чтение

Внешние ссылки