stringtranslate.com

Метод наискорейшего спуска

В математике метод наискорейшего спуска или метод седловой точки является расширением метода Лапласа для аппроксимации интеграла, где деформируется контурный интеграл в комплексной плоскости, чтобы пройти около стационарной точки ( седловой точки ), примерно в направлении наискорейшего спуска или стационарной фазы. Аппроксимация седловой точки используется с интегралами в комплексной плоскости, тогда как метод Лапласа используется с действительными интегралами.

Оцениваемый интеграл часто имеет вид

где C — контур, а λ велико. Одна из версий метода наискорейшего спуска деформирует контур интегрирования C в новый путь интегрирования C′ так, что выполняются следующие условия:

  1. C′ проходит через один или несколько нулей производной g ′( z ),
  2. мнимая часть g ( z ) постоянна на C′ .

Метод наискорейшего спуска был впервые опубликован Дебаем (1909), который использовал его для оценки функций Бесселя и указал, что он встречался в неопубликованной заметке Римана (1863) о гипергеометрических функциях . Контур наискорейшего спуска обладает свойством минимакса, см. Федорюк (2001). Зигель (1932) описал некоторые другие неопубликованные заметки Римана, где он использовал этот метод для вывода формулы Римана–Зигеля .

Основная идея

Метод наискорейшего спуска — это метод приближения комплексного интеграла вида для больших , где и — аналитические функции от . Поскольку подынтегральное выражение аналитическое, контур можно деформировать в новый контур без изменения интеграла. В частности, ищут новый контур, на котором мнимая часть, обозначенная , является постоянной ( обозначает действительную часть). Тогда и оставшийся интеграл можно приблизить другими методами, такими как метод Лапласа . [1]

Этимология

Метод называется методом наискорейшего спуска , поскольку для аналитических функций контуры постоянной фазы эквивалентны контурам наискорейшего спуска.

Если является аналитической функцией от , то она удовлетворяет уравнениям Коши–Римана Тогда контуры постоянной фазы являются также контурами наискорейшего спуска.

Простая оценка

Пусть f , S  : C nC и CC n . Если

где обозначает действительную часть, и существует положительное действительное число λ 0 такое, что

то справедлива следующая оценка: [2]

Доказательство простой оценки:

Случай единственной невырожденной седловой точки

Основные понятия и обозначения

Пусть x — комплексный n -мерный вектор, и

обозначают матрицу Гессе для функции S ( x ) . Если

является векторной функцией, то ее матрица Якоби определяется как

Невырожденная седловая точка , z 0C n , голоморфной функции S ( z ) является критической точкой функции (т. е. S ( z 0 ) = 0 ), где матрица Гессе функции имеет неисчезающий определитель (т. е. ).

Основным инструментом построения асимптотики интегралов в случае невырожденной седловой точки является следующее:

Комплексная лемма Морса

Лемма Морса для вещественнозначных функций обобщается следующим образом [3] для голоморфных функций : вблизи невырожденной седловой точки z 0 голоморфной функции S ( z ) существуют координаты, в терминах которых S ( z ) − S ( z 0 ) является точно квадратичной. Чтобы сделать это точным, пусть S будет голоморфной функцией с областью определения WC n , и пусть z 0 в W будет невырожденной седловой точкой S , то есть S ( z 0 ) = 0 и . Тогда существуют окрестности UW точки z 0 и VC n точки w = 0 , и биективная голоморфная функция φ  : VU с φ (0) = z 0 , такие, что

Здесь μ jсобственные значения матрицы .

Иллюстрация комплексной леммы Морса
Доказательство комплексной леммы Морса

Следующее доказательство является простым обобщением доказательства настоящей леммы Морса , которое можно найти в [4] . Начнем с демонстрации

Вспомогательное утверждение. Пусть f   : C nC голоморфна в окрестности начала координат и f  (0) = 0. Тогда в некоторой окрестности существуют функции g i  : C nC такие, что каждая g i голоморфна и

Из идентичности

мы приходим к выводу, что

и

Без потери общности перенесем начало координат в z 0 так, что z 0 = 0 и S (0) = 0. Используя вспомогательное утверждение, имеем

Так как начало координат является седловой точкой,

мы также можем применить вспомогательное утверждение к функциям g i ( z ) и получить

Напомним, что произвольная матрица A может быть представлена ​​в виде суммы симметричной A ( s ) и антисимметричной A ( a ) матриц,

Свертка любой симметричной матрицы B с произвольной матрицей A имеет вид

т.е. антисимметричный компонент A не вносит вклад, потому что

Таким образом, h ij ( z ) в уравнении (1) можно считать симметричным относительно перестановки индексов i и j . Отметим, что

следовательно, det( h ij (0)) ≠ 0, поскольку начало координат является невырожденной седловой точкой.

Покажем по индукции , что существуют локальные координаты u = ( u 1 , ... u n ), z = ψ ( u ), 0 = ψ (0) , такие, что

Сначала предположим, что существуют локальные координаты y = ( y 1 , ... y n ), z = φ ( y ), 0 = φ (0) , такие, что

где H ij симметричен из-за уравнения (2). Линейной заменой переменных ( y r , ... y n ) можно гарантировать, что H rr (0) ≠ 0 . Из цепного правила имеем

Поэтому:

откуда,

Матрицу ( H ij (0)) можно переформулировать в жордановой нормальной форме : ( H ij (0)) = LJL −1 , где L дает желаемое невырожденное линейное преобразование, а диагональ J содержит ненулевые собственные значения ( H ij (0) ) . Если H ij (0) ≠ 0 , то из-за непрерывности H ij ( y ) она также должна быть ненулевой в некоторой окрестности начала координат. Введя , запишем

Мотивируя последним выражением, введем новые координаты z = η ( x ), 0 = η (0),

Замена переменных yx локально обратима, поскольку соответствующий якобиан отличен от нуля,

Поэтому,

Сравнивая уравнения (4) и (5), приходим к выводу, что уравнение (3) проверено. Обозначив собственные значения через μ j , уравнение (3) можно переписать в виде

Поэтому,

Из уравнения (6) следует, что . Жорданова нормальная форма имеет вид , где J z — верхняя диагональная матрица, содержащая собственные значения , и det P ≠ 0 ; следовательно, . Из уравнения (7) получаем

Если , то перестановка двух переменных гарантирует, что .

Асимптотическое разложение в случае одной невырожденной седловой точки

Предполагать

  1. f  ( z ) и S ( z ) голоморфные функции в открытом , ограниченном и односвязном множестве Ωx ⊂ Cn таком , что Ix = ΩxRn связно;
  2. имеет единственный максимум: ровно для одной точки x 0I x ;
  3. x 0 — невырожденная седловая точка (т.е.S ( x 0 ) = 0 и).

Тогда имеет место следующая асимптотика

где μ j — собственные значения гессиана , определяемые аргументами

Это утверждение является частным случаем более общих результатов, представленных в работе Федорюка (1987). [5]

Вывод уравнения (8)
Иллюстрация к выводу уравнения (8)

Сначала мы деформируем контур I x в новый контур, проходящий через седловую точку x 0 и разделяющий границу с I x . Эта деформация не меняет значения интеграла I ( λ ) . Мы применяем комплексную лемму Морса для замены переменных интегрирования. Согласно лемме, функция φ ( w ) отображает окрестность x 0U ⊂ Ω x на окрестность Ω w , содержащую начало координат. Интеграл I ( λ ) можно разбить на два: I ( λ ) = I 0 ( λ ) + I 1 ( λ ) , где I 0 ( λ ) — интеграл по , а I 1 ( λ ) — по (т. е. оставшейся части контура I′ x ). Поскольку последняя область не содержит седловой точки x 0 , значение I 1 ( λ ) экспоненциально меньше I 0 ( λ ) при λ → ∞ ; [6] таким образом, I 1 ( λ ) игнорируется. Вводя контур I w такой, что , имеем

Вспоминая, что x 0 = φ (0) , а также , мы разлагаем предэкспоненциальную функцию в ряд Тейлора и сохраняем только ведущий член нулевого порядка

Здесь мы заменили область интегрирования I w на R n , поскольку обе содержат начало координат, которое является седловой точкой, поэтому они равны с точностью до экспоненциально малого члена. [7] Интегралы в правой части уравнения (11) можно выразить как

Из этого представления следует, что условие (9) должно быть выполнено для того, чтобы правая и левая части уравнения (12) совпадали. Согласно предположению 2, является отрицательно определенной квадратичной формой (а именно, ), подразумевающей существование интеграла , который легко вычисляется

Уравнение (8) можно также записать как

где филиал

выбирается следующим образом

Рассмотрим важные особые случаи:

Случай нескольких невырожденных седловых точек

Если функция S ( x ) имеет несколько изолированных невырожденных седловых точек, т.е.

где

является открытым покрытием Ω x , то вычисление интегральной асимптотики сводится к случаю одной седловой точки с использованием разбиения единицы . Разбиение единицы позволяет построить набор непрерывных функций ρ k ( x ) : Ω x → [0, 1], 1 ≤ kK , таких, что

Откуда,

Поэтому при λ → ∞ имеем:

где уравнение (13) использовалось на последнем этапе, а предэкспоненциальная функция f  ( x ) по крайней мере должна быть непрерывной.

Другие случаи

Когда S ( z 0 ) = 0 и , точка z 0C n называется вырожденной седловой точкой функции S ( z ) .

Вычисление асимптотики

когда λ → ∞,   f  ( x ) непрерывна, а S ( z ) имеет вырожденную седловую точку, является очень богатой проблемой, решение которой в значительной степени опирается на теорию катастроф . Здесь теория катастроф заменяет лемму Морса, действительную только в невырожденном случае, чтобы преобразовать функцию S ( z ) в одно из множества канонических представлений. Для получения дополнительных подробностей см., например, Poston & Stewart (1978) и Fedoryuk (1987).

Интегралы с вырожденными седловыми точками естественным образом появляются во многих приложениях, включая оптические каустики и многомерное приближение ВКБ в квантовой механике.

Другие случаи, такие как, например, f  ( x ) и/или S ( x ) являются разрывными или когда экстремум S ( x ) лежит на границе области интегрирования, требуют особого внимания (см., например, Fedoryuk (1987) и Wong (1989)).

Расширения и обобщения

Расширением метода наискорейшего спуска является так называемый нелинейный метод стационарной фазы/наискорейшего спуска . Здесь вместо интегралов необходимо асимптотически оценивать решения задач факторизации Римана–Гильберта .

При наличии контура C в комплексной сфере , функции f, определенной на этом контуре, и особой точки, скажем, бесконечности, ищется функция M, голоморфная вне контура C , с заданным скачком через C и с заданной нормировкой на бесконечности. Если f и, следовательно, M являются матрицами, а не скалярами, то это проблема, которая в общем случае не допускает явного решения.

Асимптотическая оценка тогда возможна по линии линейного метода стационарной фазы/скорейшего спуска. Идея состоит в том, чтобы асимптотически свести решение данной задачи Римана–Гильберта к решению более простой, явно решаемой задачи Римана–Гильберта. Теорема Коши используется для обоснования деформаций контура скачка.

Нелинейная стационарная фаза была введена Дейфтом и Чжоу в 1993 году на основе более ранней работы российского математика Александра Итса. (Собственно говоря) нелинейный метод наискорейшего спуска был введен Камвиссисом, К. Маклафлином и П. Миллером в 2003 году на основе более ранней работы Лакса, Левермора, Дейфта, Венакидеса и Чжоу. Как и в линейном случае, контуры наискорейшего спуска решают задачу минимума-максимума. В нелинейном случае они оказываются «S-кривыми» (определенными в другом контексте еще в 80-х годах Шталем, Гончаром и Рахмановым).

Нелинейный метод стационарной фазы/наискорейшего спуска применяется в теории солитонных уравнений и интегрируемых моделей , случайных матриц и комбинаторике .

Другим расширением является метод Честера–Фридмана–Урселла для объединения седловых точек и равномерных асимптотических расширений.

Смотрите также

Примечания

  1. ^ Бендер, Карл М.; Орсзаг, Стивен А. (1999). Продвинутые математические методы для ученых и инженеров I. Нью-Йорк, Нью-Йорк: Springer New York. doi :10.1007/978-1-4757-3069-2. ISBN 978-1-4419-3187-0.
  2. Модифицированная версия леммы 2.1.1 на стр. 56 в Федорюке (1987).
  3. Лемма 3.3.2 на стр. 113 в Fedoryuk (1987)
  4. Постон и Стюарт (1978), стр. 54; см. также комментарий на стр. 479 в Wong (1989).
  5. Федорюк (1987), страницы 417-420.
  6. ^ Этот вывод следует из сравнения окончательной асимптотики для I 0 ( λ ) , заданной уравнением (8), и простой оценки для отброшенного интеграла I 1 ( λ ) .
  7. ^ Это подтверждается сравнением интегральной асимптотики по R n [см. уравнение (8)] с простой оценкой для измененной части.
  8. ^ См. уравнение (4.4.9) на стр. 125 в Fedoryuk (1987)
  9. ^ Строго говоря, этот случай не может быть выведен из уравнения (8), поскольку второе предположение, использованное при выводе, нарушено. Чтобы включить обсуждаемый случай чисто мнимой фазовой функции, условие (9) следует заменить на
  10. ^ См. уравнение (2.2.6') на стр. 186 в Fedoryuk (1987)

Ссылки