Метод Рэлея–Ритца — прямой численный метод аппроксимации собственных значений , возникший в контексте решения физических граничных задач и названный в честь лорда Рэлея и Вальтера Ритца .
В этом методе бесконечномерный линейный оператор аппроксимируется конечномерным сжатием , к которому можно применить алгоритм собственных значений .
Он используется во всех приложениях, которые включают аппроксимацию собственных значений и собственных векторов , часто под разными названиями. В квантовой механике , где система частиц описывается с помощью гамильтониана , метод Ритца использует пробные волновые функции для аппроксимации собственной функции основного состояния с наименьшей энергией. В контексте метода конечных элементов математически тот же алгоритм обычно называется методом Ритца-Галеркина . Метод Рэлея-Ритца или терминология метода Ритца типичны в машиностроении и проектировании конструкций для аппроксимации собственных мод и резонансных частот конструкции.
Название метода и история его происхождения обсуждались историками. [1] [2] Он был назван методом Ритца в честь Вальтера Ритца , поскольку численная процедура была опубликована Вальтером Ритцем в 1908-1909 годах. Согласно AW Leissa, [1] лорд Рэлей написал статью, поздравляющую Ритца с его работой в 1911 году, но заявляющую, что он сам использовал метод Ритца во многих местах своей книги и в другой публикации. Это утверждение, хотя позже и оспариваемое, и тот факт, что метод в тривиальном случае одного вектора приводит к частному Рэлея, делают обоснованным название метода Рэлея–Ритца . Согласно С. Иланко [2], цитирующему Ричарда Куранта , и лорд Рэлей , и Вальтер Ритц независимо друг от друга задумали идею использования эквивалентности между граничными задачами уравнений с частными производными , с одной стороны, и задачами вариационного исчисления, с другой стороны, для численного расчета решений, путем замены вариационных задач более простыми аппроксимирующими экстремальными задачами, в которых необходимо определить конечное число параметров. По иронии судьбы, современное обоснование алгоритма отказывается от вариационного исчисления в пользу более простого и более общего подхода ортогональной проекции, как в методе Галеркина, названном в честь Бориса Галеркина , что также приводит к названию метода Ритца-Галеркина . [ необходима цитата ]
Пусть будет линейным оператором в гильбертовом пространстве , со скалярным произведением . Теперь рассмотрим конечный набор функций . В зависимости от приложения эти функции могут быть:
Можно было бы использовать ортонормированный базис, сгенерированный из собственных функций оператора, что даст диагональные аппроксимирующие матрицы, но в этом случае нам уже пришлось бы вычислять спектр.
Теперь мы приближаемся к , которая определяется как матрица с элементами [3]
и решить задачу собственных значений . Можно показать, что матрица является сжатием до . [3]
Для дифференциальных операторов (таких как операторы Штурма-Лиувилля ) скалярное произведение можно заменить слабой формулировкой . [4] [6]
Если для нахождения матрицы использовалось подмножество ортонормированного базиса, то собственные векторы будут линейными комбинациями функций ортонормированного базиса, и в результате они будут приближениями собственных векторов . [7]
Метод Рэлея–Ритца может производить значения, которые не сходятся к фактическим значениям в спектре оператора, когда усечение становится большим. Эти значения известны как спектральное загрязнение. [3] [5] [8] В некоторых случаях (например, для уравнения Шредингера ) не существует аппроксимации, которая одновременно включает все собственные значения уравнения и не содержит загрязнения. [9]
Спектр сжатия (и, следовательно, загрязнения) ограничен числовым диапазоном оператора; во многих случаях он ограничен подмножеством числового диапазона, известным как существенный числовой диапазон. [10] [11]
В числовой линейной алгебре метод Рэлея–Ритца обычно [12] применяется для аппроксимации задачи на собственные значения для матрицы размера с использованием спроецированной матрицы меньшего размера , сгенерированной из заданной матрицы с ортонормированными столбцами. Матричная версия алгоритма является наиболее простой:
Если подпространство с ортонормированным базисом, заданным столбцами матрицы, содержит векторы, близкие к собственным векторам матрицы , то метод Рэлея–Ритца, описанный выше, находит векторы Ритца, которые хорошо аппроксимируют эти собственные векторы. Легко вычисляемая величина определяет точность такого приближения для каждой пары Ритца.
В простейшем случае матрица превращается в единичный вектор-столбец , матрица является скаляром, равным отношению Рэлея , единственным решением задачи собственных значений является и , а единственным вектором Ритца является он сам. Таким образом, метод Рэлея–Ритца превращается в вычисление отношения Рэлея, если .
Другая полезная связь с отношением Рэлея заключается в том, что для каждой пары Ритца , что позволяет вывести некоторые свойства значений Ритца из соответствующей теории для отношения Рэлея . Например, если — эрмитова матрица , ее отношение Рэлея (и, следовательно, каждое ее значение Ритца) является действительным и принимает значения в пределах замкнутого интервала наименьшего и наибольшего собственных значений .
Матрица имеет собственные значения и соответствующие собственные векторы Возьмем тогда с собственными значениями и соответствующими собственными векторами так, чтобы значения Ритца были и векторы Ритца были Мы видим, что каждый из векторов Ритца является ровно одним из собственных векторов для заданного , а также значения Ритца дают ровно два из трех собственных значений . Математическое объяснение точного приближения основано на том факте, что пространство столбцов матрицы оказывается точно таким же, как подпространство, охватываемое двумя собственными векторами и в этом примере.
Усеченное сингулярное разложение (SVD) в числовой линейной алгебре также может использовать метод Рэлея–Ритца для нахождения приближений к левым и правым сингулярным векторам матрицы размера в заданных подпространствах путем превращения сингулярной задачи в задачу на собственные значения.
Определение сингулярного значения и соответствующих левого и правого сингулярных векторов: и . Найдя один набор (слева направо) приближенных сингулярных векторов и сингулярных значений, наивно применив метод Рэлея–Ритца к эрмитовой нормальной матрице или , в зависимости от того, какой из них меньше, можно определить другой набор левых или правых сингулярных векторов, просто разделив на сингулярные значения, т. е. и . Однако деление нестабильно или не удается для малых или нулевых сингулярных значений.
Альтернативный подход, например, определение нормальной матрицы как размера , использует тот факт, что для заданной матрицы с ортонормированными столбцами задача на собственные значения метода Рэлея–Ритца для матрицы может быть интерпретирована как задача на сингулярные значения для матрицы . Такая интерпретация позволяет просто одновременно вычислять как левые, так и правые приближенные сингулярные векторы следующим образом.
Алгоритм можно использовать в качестве этапа постобработки, где матрица является выходом решателя собственных значений, например, такого как LOBPCG , аппроксимирующего численно выбранные собственные векторы нормальной матрицы .
Матрица имеет свои нормальные матричные сингулярные значения и соответствующее тонкое SVD , где столбцы первого множителя из полного набора левых сингулярных векторов матрицы , диагональные элементы среднего члена являются сингулярными значениями, а столбцы последнего транспонированного множителя (хотя транспонирование его не меняет) являются соответствующими правыми сингулярными векторами.
Возьмем столбцовое пространство, охватывающее два точных правых сингулярных векторов, соответствующих сингулярным значениям 1 и 2.
Следуя шагу 1 алгоритма, мы вычисляем и на шаге 2 его тонкое SVD с помощью Таким образом, мы уже получаем сингулярные значения 2 и 1 из и из соответствующих двух левых сингулярных векторов как и , которые охватывают пространство столбцов матрицы , объясняя, почему приближения являются точными для заданного .
Наконец, шаг 3 вычисляет матрицу, восстанавливающую из ее строк два правых сингулярных вектора как и . Мы проверяем первый вектор: и Таким образом, для данной матрицы с ее столбцовым пространством, которое охватывается двумя точными правыми сингулярными векторами, мы определяем эти правые сингулярные векторы, а также соответствующие левые сингулярные векторы и сингулярные значения, все точно. Для произвольной матрицы мы получаем приближенные сингулярные триплеты, которые являются оптимальными заданными в смысле оптимальности метода Рэлея–Ритца.
В квантовой физике, где спектр гамильтониана представляет собой набор дискретных уровней энергии, разрешенных квантово-механической системой, метод Рэлея–Ритца используется для аппроксимации энергетических состояний и волновых функций сложной атомной или ядерной системы. [7] Фактически, для любой системы, более сложной, чем один атом водорода, не существует известного точного решения для спектра гамильтониана. [6]
В этом случае пробная волновая функция , , тестируется на системе. Эта пробная функция выбирается для соответствия граничным условиям (и любым другим физическим ограничениям). Точная функция неизвестна; пробная функция содержит один или несколько регулируемых параметров, которые изменяются для поиска конфигурации с наименьшей энергией.
Можно показать, что энергия основного состояния удовлетворяет неравенству:
То есть энергия основного состояния меньше этого значения. Пробная волновая функция всегда будет давать ожидаемое значение, большее или равное энергии основного состояния.
Если известно, что пробная волновая функция ортогональна основному состоянию, то она будет определять границу для энергии некоторого возбужденного состояния.
Функция анзаца Ритца представляет собой линейную комбинацию N известных базисных функций , параметризованную неизвестными коэффициентами:
При известном гамильтониане мы можем записать его ожидаемое значение как
Базисные функции обычно не ортогональны, так что матрица перекрытия S имеет ненулевые недиагональные элементы. Либо , либо (сопряжение первого) можно использовать для минимизации ожидаемого значения. Например, сделав частные производные больше нуля, получим следующее равенство для каждого k = 1, 2, ..., N : что приводит к набору N секулярных уравнений :
В приведенных выше уравнениях энергия и коэффициенты неизвестны. Что касается c , это однородный набор линейных уравнений, который имеет решение, когда определитель коэффициентов при этих неизвестных равен нулю: что, в свою очередь, верно только для N значений . Кроме того, поскольку гамильтониан является эрмитовым оператором , матрица H также является эрмитовой , а значения будут действительными. Наименьшее значение среди (i=1,2,..,N), , будет наилучшим приближением к основному состоянию для используемых базисных функций. Остальные N-1 энергий являются оценками энергий возбужденного состояния. Приближение для волновой функции состояния i можно получить, найдя коэффициенты из соответствующего секулярного уравнения.
Метод Рэлея–Ритца часто используется в машиностроении для нахождения приблизительных реальных резонансных частот систем с несколькими степенями свободы , таких как системы пружинных масс или маховики на валу с переменным поперечным сечением . Это расширение метода Рэлея. Его также можно использовать для нахождения нагрузок на изгиб и поведения после изгиба для колонн.
Рассмотрим случай, когда мы хотим найти резонансную частоту колебаний системы. Сначала запишем колебания в виде с неизвестной формой моды . Затем найдем полную энергию системы, состоящую из кинетической энергии и потенциальной энергии. Кинетическая энергия включает квадрат производной по времени и, таким образом, приобретает множитель . Таким образом, мы можем вычислить полную энергию системы и выразить ее в следующем виде:
По закону сохранения энергии средняя кинетическая энергия должна быть равна средней потенциальной энергии. Таким образом, что также известно как отношение Рэлея . Таким образом, если бы мы знали форму моды , мы могли бы вычислить и , и в свою очередь получить собственную частоту. Однако мы пока не знаем форму моды. Чтобы найти ее, мы можем аппроксимировать как комбинацию нескольких аппроксимирующих функций, где — константы, которые необходимо определить. В общем случае, если мы выберем случайный набор , он будет описывать суперпозицию фактических собственных мод системы. Однако если мы попытаемся сделать так, чтобы собственная частота была минимизирована, то мода, описываемая этим набором, будет близка к минимально возможной фактической собственной моде системы. Таким образом, это находит минимальную собственную частоту. Если мы найдем собственные моды, ортогональные этой приближенной минимальной собственной моде, мы также можем приблизительно найти несколько следующих собственных частот.
В общем случае мы можем выразить и как совокупность членов, квадратичных относительно коэффициентов : где и — матрица жесткости и матрица масс дискретной системы соответственно.
Минимизация становится:
Решая эту проблему,
Для нетривиального решения c нам необходимо, чтобы определитель матричного коэффициента c был равен нулю.
Это дает решение для первых N собственных частот и собственных мод системы, где N — число аппроксимирующих функций.
В следующем обсуждении рассматривается простейший случай, когда система имеет две сосредоточенные пружины и две сосредоточенные массы, и предполагается только две формы колебаний. Следовательно, M = [ m 1 , m 2 ] и K = [ k 1 , k 2 ] .
Для системы предполагается форма моды с двумя членами, один из которых взвешен коэффициентом B , например, Y = [1, 1] + B [1, −1]. Простая теория гармонического движения гласит, что скорость в момент, когда отклонение равно нулю, равна угловой частоте, умноженной на отклонение (y) в момент максимального отклонения. В этом примере кинетическая энергия (KE) для каждой массы равна и т. д., а потенциальная энергия (PE) для каждой пружины равна и т. д.
Мы также знаем, что без затухания максимальный KE равен максимальному PE. Таким образом,
Общая амплитуда формы моды всегда компенсируется с каждой стороны. То есть, фактический размер предполагаемого отклонения не имеет значения, важна только форма моды .
Затем математические манипуляции дают выражение для , в терминах B, которое можно дифференцировать по B, чтобы найти минимум, т. е. когда . Это дает значение B, для которого является самым низким. Это решение верхней границы для , если предполагается, что это будет предсказанная основная частота системы, поскольку предполагается форма моды , но мы нашли самое низкое значение этой верхней границы, учитывая наши предположения, поскольку B используется для поиска оптимального «микса» двух предполагаемых функций формы моды.
В этом методе есть много трюков, самый важный из которых — попытаться выбрать реалистичные предполагаемые формы мод. Например, в случае проблем с отклонением балки разумно использовать деформированную форму, которая аналитически похожа на ожидаемое решение. Квартика может подойти для большинства простых задач просто связанных балок, даже если порядок деформированного решения может быть ниже. Пружины и массы не обязательно должны быть дискретными, они могут быть непрерывными (или смесью), и этот метод можно легко использовать в электронной таблице для нахождения собственных частот довольно сложных распределенных систем, если вы можете легко описать распределенные члены KE и PE или же разбить непрерывные элементы на дискретные части.
Этот метод можно использовать итеративно, добавляя дополнительные формы колебаний к предыдущему лучшему решению, или можно построить длинное выражение со многими B и многими формами колебаний, а затем частично их дифференцировать .
Оператор Купмана позволяет закодировать конечномерную нелинейную систему как бесконечномерную линейную систему . В общем случае обе эти проблемы трудно решить, но для последней мы можем использовать метод Ритца-Галеркина для приближенного решения. [13]
На языке метода конечных элементов матрица — это именно матрица жесткости гамильтониана в кусочно-линейном элементном пространстве, а матрица — это матрица масс . На языке линейной алгебры значение — это собственное значение дискретизированного гамильтониана, а вектор — это дискретизированный собственный вектор.