stringtranslate.com

Метод Рэлея–Ритца

Метод Рэлея–Ритца — прямой численный метод аппроксимации собственных значений , возникший в контексте решения физических граничных задач и названный в честь лорда Рэлея и Вальтера Ритца .

В этом методе бесконечномерный линейный оператор аппроксимируется конечномерным сжатием , к которому можно применить алгоритм собственных значений .

Он используется во всех приложениях, которые включают аппроксимацию собственных значений и собственных векторов , часто под разными названиями. В квантовой механике , где система частиц описывается с помощью гамильтониана , метод Ритца использует пробные волновые функции для аппроксимации собственной функции основного состояния с наименьшей энергией. В контексте метода конечных элементов математически тот же алгоритм обычно называется методом Ритца-Галеркина . Метод Рэлея-Ритца или терминология метода Ритца типичны в машиностроении и проектировании конструкций для аппроксимации собственных мод и резонансных частот конструкции.

Наименование и атрибуция

Название метода и история его происхождения обсуждались историками. [1] [2] Он был назван методом Ритца в честь Вальтера Ритца , поскольку численная процедура была опубликована Вальтером Ритцем в 1908-1909 годах. Согласно AW Leissa, [1] лорд Рэлей написал статью, поздравляющую Ритца с его работой в 1911 году, но заявляющую, что он сам использовал метод Ритца во многих местах своей книги и в другой публикации. Это утверждение, хотя позже и оспариваемое, и тот факт, что метод в тривиальном случае одного вектора приводит к частному Рэлея, делают обоснованным название метода Рэлея–Ритца . Согласно С. Иланко [2], цитирующему Ричарда Куранта , и лорд Рэлей , и Вальтер Ритц независимо друг от друга задумали идею использования эквивалентности между граничными задачами уравнений с частными производными , с одной стороны, и задачами вариационного исчисления, с другой стороны, для численного расчета решений, путем замены вариационных задач более простыми аппроксимирующими экстремальными задачами, в которых необходимо определить конечное число параметров. По иронии судьбы, современное обоснование алгоритма отказывается от вариационного исчисления в пользу более простого и более общего подхода ортогональной проекции, как в методе Галеркина, названном в честь Бориса Галеркина , что также приводит к названию метода Ритца-Галеркина . [ необходима цитата ]

Метод

Пусть будет линейным оператором в гильбертовом пространстве , со скалярным произведением . Теперь рассмотрим конечный набор функций . В зависимости от приложения эти функции могут быть:

Можно было бы использовать ортонормированный базис, сгенерированный из собственных функций оператора, что даст диагональные аппроксимирующие матрицы, но в этом случае нам уже пришлось бы вычислять спектр.

Теперь мы аппроксимируем с помощью , которая определяется как матрица с элементами [3]

и решить задачу собственных значений . Можно показать, что матрица является сжатием до . [3]

Для дифференциальных операторов (таких как операторы Штурма-Лиувилля ) скалярное произведение можно заменить слабой формулировкой . [4] [6]

Если для нахождения матрицы использовалось подмножество ортонормированного базиса, то собственные векторы будут линейными комбинациями функций ортонормированного базиса, и в результате они будут приближениями собственных векторов . [7]

Характеристики

Спектральное загрязнение

Метод Рэлея–Ритца может производить значения, которые не сходятся к фактическим значениям в спектре оператора, когда усечение становится большим. Эти значения известны как спектральное загрязнение. [3] [5] [8] В некоторых случаях (например, для уравнения Шредингера ) не существует аппроксимации, которая одновременно включает все собственные значения уравнения и не содержит загрязнения. [9]

Спектр сжатия (и, следовательно, загрязнения) ограничен числовым диапазоном оператора; во многих случаях он ограничен подмножеством числового диапазона, известным как существенный числовой диапазон. [10] [11]

Для задач на собственные значения матриц

В числовой линейной алгебре метод Рэлея–Ритца обычно [12] применяется для аппроксимации задачи на собственные значения для матрицы размера с использованием спроецированной матрицы меньшего размера , сгенерированной из заданной матрицы с ортонормированными столбцами. Матричная версия алгоритма является наиболее простой:

  1. Вычислить матрицу , где обозначает комплексно-сопряженную транспонированную матрицу
  2. Решить задачу на собственные значения
  3. Вычислить векторы Ритца и значение Ритца
  4. Выходные приближения , называемые парами Ритца, к собственным значениям и собственным векторам исходной матрицы .

Если подпространство с ортонормированным базисом, заданным столбцами матрицы, содержит векторы, близкие к собственным векторам матрицы , то метод Рэлея–Ритца, описанный выше, находит векторы Ритца, которые хорошо аппроксимируют эти собственные векторы. Легко вычисляемая величина определяет точность такого приближения для каждой пары Ритца.

В простейшем случае матрица превращается в единичный вектор-столбец , матрица является скаляром, равным отношению Рэлея , единственным решением задачи собственных значений является и , а единственным вектором Ритца является он сам. Таким образом, метод Рэлея–Ритца превращается в вычисление отношения Рэлея, если .

Другая полезная связь с отношением Рэлея заключается в том, что для каждой пары Ритца , что позволяет вывести некоторые свойства значений Ритца из соответствующей теории для отношения Рэлея . Например, если — эрмитова матрица , ее отношение Рэлея (и, следовательно, каждое ее значение Ритца) является действительным и принимает значения в пределах замкнутого интервала наименьшего и наибольшего собственных значений .

Пример

Матрица имеет собственные значения и соответствующие собственные векторы Возьмем тогда с собственными значениями и соответствующими собственными векторами так, чтобы значения Ритца были и векторы Ритца были Мы видим, что каждый из векторов Ритца является ровно одним из собственных векторов для заданного , а также значения Ритца дают ровно два из трех собственных значений . Математическое объяснение точного приближения основано на том факте, что пространство столбцов матрицы оказывается точно таким же, как подпространство, охватываемое двумя собственными векторами и в этом примере.

Для матричных сингулярных задач

Усеченное сингулярное разложение (SVD) в числовой линейной алгебре также может использовать метод Рэлея–Ритца для нахождения приближений к левым и правым сингулярным векторам матрицы размера в заданных подпространствах путем превращения сингулярной задачи в задачу на собственные значения.

Используя нормальную матрицу

Определение сингулярного значения и соответствующих левого и правого сингулярных векторов: и . Найдя один набор (слева направо) приближенных сингулярных векторов и сингулярных значений, наивно применив метод Рэлея–Ритца к эрмитовой нормальной матрице или , в зависимости от того, какой из них меньше, можно определить другой набор левых или правых сингулярных векторов, просто разделив на сингулярные значения, т. е. и . Однако деление нестабильно или не удается для малых или нулевых сингулярных значений.

Альтернативный подход, например, определение нормальной матрицы как размера , использует тот факт, что для заданной матрицы с ортонормированными столбцами задача на собственные значения метода Рэлея–Ритца для матрицы может быть интерпретирована как задача на сингулярные значения для матрицы . Такая интерпретация позволяет просто одновременно вычислять как левые, так и правые приближенные сингулярные векторы следующим образом.

  1. Вычислить матрицу .
  2. Вычислите тонкий, или экономичный, SVD с матрицей , диагональной матрицей и матрицей .
  3. Вычислить матрицы левых и правых сингулярных векторов Ритца.
  4. Выходные приближения , называемые сингулярными триплетами Ритца, к выбранным сингулярным значениям и соответствующим левым и правым сингулярным векторам исходной матрицы, представляющим собой приближенное усеченное сингулярное разложение (SVD) с левыми сингулярными векторами, ограниченными пространством столбцов матрицы .

Алгоритм можно использовать в качестве этапа постобработки, где матрица является выходом решателя собственных значений, например, такого как LOBPCG , аппроксимирующего численно выбранные собственные векторы нормальной матрицы .

Пример

Матрица имеет свои нормальные матричные сингулярные значения и соответствующее тонкое SVD , где столбцы первого множителя из полного набора левых сингулярных векторов матрицы , диагональные элементы среднего члена являются сингулярными значениями, а столбцы последнего транспонированного множителя (хотя транспонирование его не меняет) являются соответствующими правыми сингулярными векторами.

Возьмем столбцовое пространство, охватывающее два точных правых сингулярных векторов, соответствующих сингулярным значениям 1 и 2.

Следуя шагу 1 алгоритма, мы вычисляем и на шаге 2 его тонкое SVD с помощью Таким образом, мы уже получаем сингулярные значения 2 и 1 из и из соответствующих двух левых сингулярных векторов как и , которые охватывают пространство столбцов матрицы , объясняя, почему приближения являются точными для заданного .

Наконец, шаг 3 вычисляет матрицу, восстанавливающую из ее строк два правых сингулярных вектора как и . Мы проверяем первый вектор: и Таким образом, для данной матрицы с ее столбцовым пространством, которое охватывается двумя точными правыми сингулярными векторами, мы определяем эти правые сингулярные векторы, а также соответствующие левые сингулярные векторы и сингулярные значения, все точно. Для произвольной матрицы мы получаем приближенные сингулярные триплеты, которые являются оптимальными заданными в смысле оптимальности метода Рэлея–Ритца.

Приложения и примеры

В квантовой физике

В квантовой физике, где спектр гамильтониана представляет собой набор дискретных уровней энергии, разрешенных квантово-механической системой, метод Рэлея–Ритца используется для аппроксимации энергетических состояний и волновых функций сложной атомной или ядерной системы. [7] Фактически, для любой системы, более сложной, чем один атом водорода, не существует известного точного решения для спектра гамильтониана. [6]

В этом случае пробная волновая функция , , тестируется на системе. Эта пробная функция выбирается для соответствия граничным условиям (и любым другим физическим ограничениям). Точная функция неизвестна; пробная функция содержит один или несколько регулируемых параметров, которые изменяются для поиска конфигурации с наименьшей энергией.

Можно показать, что энергия основного состояния удовлетворяет неравенству:

То есть энергия основного состояния меньше этого значения. Пробная волновая функция всегда будет давать ожидаемое значение, большее или равное энергии основного состояния.

Если известно, что пробная волновая функция ортогональна основному состоянию, то она будет определять границу для энергии некоторого возбужденного состояния.

Функция анзаца Ритца представляет собой линейную комбинацию N известных базисных функций , параметризованную неизвестными коэффициентами:

При известном гамильтониане мы можем записать его ожидаемое значение как

Базисные функции обычно не ортогональны, так что матрица перекрытия S имеет ненулевые недиагональные элементы. Либо , либо (сопряжение первого) можно использовать для минимизации ожидаемого значения. Например, сделав частные производные больше нуля, получим следующее равенство для каждого k = 1, 2, ..., N : что приводит к набору N секулярных уравнений :

В приведенных выше уравнениях энергия и коэффициенты неизвестны. Что касается c , это однородный набор линейных уравнений, который имеет решение, когда определитель коэффициентов при этих неизвестных равен нулю: что, в свою очередь, верно только для N значений . Кроме того, поскольку гамильтониан является эрмитовым оператором , матрица H также является эрмитовой , а значения будут действительными. Наименьшее значение среди (i=1,2,..,N), , будет наилучшим приближением к основному состоянию для используемых базисных функций. Остальные N-1 энергий являются оценками энергий возбужденного состояния. Приближение для волновой функции состояния i можно получить, найдя коэффициенты из соответствующего секулярного уравнения.

В машиностроении

Метод Рэлея–Ритца часто используется в машиностроении для нахождения приблизительных реальных резонансных частот систем с несколькими степенями свободы , таких как системы пружинных масс или маховики на валу с переменным поперечным сечением . Это расширение метода Рэлея. Его также можно использовать для нахождения нагрузок на изгиб и поведения после изгиба для колонн.

Рассмотрим случай, когда мы хотим найти резонансную частоту колебаний системы. Сначала запишем колебания в виде с неизвестной формой моды . Затем найдем полную энергию системы, состоящую из кинетической энергии и потенциальной энергии. Кинетическая энергия включает квадрат производной по времени и, таким образом, приобретает множитель . Таким образом, мы можем вычислить полную энергию системы и выразить ее в следующем виде:

По закону сохранения энергии средняя кинетическая энергия должна быть равна средней потенциальной энергии. Таким образом, что также известно как отношение Рэлея . Таким образом, если бы мы знали форму моды , мы могли бы вычислить и , и в свою очередь получить собственную частоту. Однако мы пока не знаем форму моды. Чтобы найти ее, мы можем аппроксимировать как комбинацию нескольких аппроксимирующих функций, где — константы, которые необходимо определить. В общем случае, если мы выберем случайный набор , он будет описывать суперпозицию фактических собственных мод системы. Однако если мы попытаемся сделать так, чтобы собственная частота была минимизирована, то мода, описываемая этим набором, будет близка к наименьшей возможной фактической собственной моде системы. Таким образом, это находит наименьшую собственную частоту. Если мы найдем собственные моды, ортогональные этой аппроксимированной наименьшей собственной моде, мы также можем приблизительно найти несколько следующих собственных частот.

В общем случае мы можем выразить и как совокупность членов, квадратичных относительно коэффициентов : где и — матрица жесткости и матрица масс дискретной системы соответственно.

Минимизация становится:

Решая эту проблему,

Для нетривиального решения c нам необходимо, чтобы определитель матричного коэффициента c был равен нулю.

Это дает решение для первых N собственных частот и собственных мод системы, где N — число аппроксимирующих функций.

Простой случай двойной пружинно-массовой системы

В следующем обсуждении рассматривается простейший случай, когда система имеет две сосредоточенные пружины и две сосредоточенные массы, и предполагается только две формы колебаний. Следовательно, M = [ m 1 , m 2 ] и K = [ k 1 , k 2 ] .

Для системы предполагается форма моды с двумя членами, один из которых взвешен коэффициентом  B , например, Y = [1, 1] +  B [1, −1]. Простая теория гармонического движения гласит, что скорость в момент, когда отклонение равно нулю, равна угловой частоте, умноженной на отклонение (y) в момент максимального отклонения. В этом примере кинетическая энергия (KE) для каждой массы равна и т. д., а потенциальная энергия (PE) для каждой пружины равна и т. д.

Мы также знаем, что без затухания максимальный KE равен максимальному PE. Таким образом,

Общая амплитуда формы моды всегда компенсируется с каждой стороны. То есть, фактический размер предполагаемого отклонения не имеет значения, важна только форма моды .

Затем математические манипуляции дают выражение для , в терминах B, которое можно дифференцировать по B, чтобы найти минимум, т. е. когда . Это дает значение B, для которого является самым низким. Это решение верхней границы для , если предполагается, что это будет предсказанная основная частота системы, поскольку предполагается форма моды , но мы нашли самое низкое значение этой верхней границы, учитывая наши предположения, поскольку B используется для поиска оптимального «микса» двух предполагаемых функций формы моды.

В этом методе есть много трюков, самый важный из которых — попытаться выбрать реалистичные предполагаемые формы мод. Например, в случае проблем с отклонением балки разумно использовать деформированную форму, которая аналитически похожа на ожидаемое решение. Квартика может подойти для большинства простых задач просто связанных балок, даже если порядок деформированного решения может быть ниже. Пружины и массы не обязательно должны быть дискретными, они могут быть непрерывными (или смесью), и этот метод можно легко использовать в электронной таблице для нахождения собственных частот довольно сложных распределенных систем, если вы можете легко описать распределенные члены KE и PE или же разбить непрерывные элементы на дискретные части.

Этот метод можно использовать итеративно, добавляя дополнительные формы колебаний к предыдущему лучшему решению, или можно построить длинное выражение со многими B и многими формами колебаний, а затем частично их дифференцировать .

В динамических системах

Оператор Купмана позволяет закодировать конечномерную нелинейную систему как бесконечномерную линейную систему . В общем случае обе эти проблемы трудно решить, но для последней мы можем использовать метод Ритца-Галеркина для приближенного решения. [13]

Связь с методом конечных элементов

На языке метода конечных элементов матрица — это именно матрица жесткости гамильтониана в кусочно-линейном элементном пространстве, а матрица — это матрица масс . На языке линейной алгебры значение — это собственное значение дискретизированного гамильтониана, а вектор — это дискретизированный собственный вектор.

Смотрите также

Примечания и ссылки

  1. ^ ab Leissa, AW (2005). "Исторические основы методов Рэлея и Ритца" . Журнал звука и вибрации . 287 (4–5): 961–978. Bibcode :2005JSV...287..961L. doi :10.1016/j.jsv.2004.12.021.
  2. ^ ab Ilanko, Sinniah (2009). «Комментарии к историческим основам методов Рэлея и Ритца». Journal of Sound and Vibration . 319 (1–2): 731–733. Bibcode : 2009JSV...319..731I. doi : 10.1016/j.jsv.2008.06.001.
  3. ^ abcd Дэвис, ЭБ ; Плам, М. (2003). «Спектральное загрязнение». Журнал численного анализа IMA .
  4. ^ ab Süli, Endre ; Mayers, David (2003). Введение в численный анализ . Cambridge University Press . ISBN 0521007941.
  5. ^ ab Левитин, Майкл; Шаргородский, Евгений (2004). «Спектральное загрязнение и относительные спектры второго порядка для самосопряженных операторов». Журнал IMA по численному анализу .
  6. ^ ab Pryce, John D. (1994). Численное решение задач Штурма-Лиувилля . Oxford University Press. ISBN 0198534159.
  7. ^ ab Арфкен, Джордж Б .; Вебер, Ганс Дж. (2005). Математические методы для физиков (6-е изд.). Academic Press.
  8. ^ Колбрук, Мэтью. «Расшифровка бесконечности: можем ли мы вычислить спектры?». Математика сегодня . Институт математики и ее приложений.
  9. ^ Колбрук, Мэтью; Роман, Богдан; Хансен, Андерс (2019). «Как вычислять спектры с контролем ошибок». Physical Review Letters .
  10. ^ Покшива, Анджей (1979). «Метод ортогональных проекций и аппроксимация спектра ограниченного оператора». Studia Mathematica .
  11. ^ Бёгли, Сабина; Марлетта, Марко; Треттер, Кристиана (2020). «Существенный числовой диапазон для неограниченных линейных операторов». Журнал функционального анализа .
  12. ^ Трефетен, Ллойд Н.; Бау, III, Дэвид (1997). Численная линейная алгебра. SIAM. стр. 254. ISBN 978-0-89871-957-4.
  13. ^ Сервадио, Симоне; Арнас, Дэвид; Линарес, Ричард. «Учебник по оператору Купмана с ортогональными многочленами». arXiv.

Внешние ссылки