stringtranslate.com

Вариационное исчисление

Вариационное исчисление ( или вариационное исчисление ) — это область математического анализа , в которой используются вариации, представляющие собой небольшие изменения функций и функционалов , для нахождения максимумов и минимумов функционалов: отображения набора функций на действительные числа . [а] Функционалы часто выражаются в виде определенных интегралов , включающих функции и их производные . Функции, которые максимизируют или минимизируют функционалы, можно найти с помощью уравнения Эйлера – Лагранжа вариационного исчисления.

Простой пример такой задачи — найти кривую кратчайшей длины, соединяющую две точки. Если ограничений нет, решением является прямая линия между точками. Однако если кривая вынуждена лежать на поверхности в пространстве, то решение менее очевидно и, возможно, может существовать множество решений. Такие решения известны как геодезические . Схожая проблема возникает в соответствии с принципом Ферма : свет следует по пути наименьшей оптической длины, соединяющему две точки, который зависит от материала среды. Одним из соответствующих понятий в механике является принцип наименьшего/стационарного действия .

Многие важные задачи связаны с функциями нескольких переменных. Решения краевых задач для уравнения Лапласа удовлетворяют принципу Дирихле . Задача Плато требует нахождения поверхности минимальной площади, охватывающей заданный контур в пространстве: решение часто можно найти, окунув рамку в мыльную воду. Хотя такие эксперименты сравнительно легко провести, их математическая формулировка далеко не проста: локально минимизирующих поверхностей может быть несколько, и они могут иметь нетривиальную топологию .

История

Можно сказать, что вариационное исчисление началось с проблемы Ньютона о минимальном сопротивлении в 1687 году, за которой последовала проблема брахистохронной кривой, поднятая Иоганном Бернулли (1696). [2] Это сразу же привлекло внимание Якоба Бернулли и маркиза Лопиталя , но Леонард Эйлер впервые разработал эту тему, начиная с 1733 года. Лагранж находился под влиянием работ Эйлера и внес значительный вклад в теорию. После того, как Эйлер увидел работу 19-летнего Лагранжа в 1755 году, Эйлер отказался от своего частично геометрического подхода в пользу чисто аналитического подхода Лагранжа и переименовал этот предмет в вариационное исчисление в своей лекции 1756 года Elementa Calculi Variationum . [3] [4] [б]

Лежандр (1786) предложил не совсем удовлетворительный метод различения максимумов и минимумов. Исаак Ньютон и Готфрид Лейбниц также рано уделили этому вопросу внимание. [5] Винченцо Бруначчи (1810 г.), Карл Фридрих Гаусс (1829 г.), Симеон Пуассон (1831 г.), Михаил Остроградский (1834 г.) и Карл Якоби (1837 г.) внесли свой вклад в эту дискриминацию . Важной общей работой является работа Сарруса (1842 г.), которая была сокращена и улучшена Коши (1844 г.). Другие ценные трактаты и мемуары были написаны Штраухом (1849 г.), Джеллеттом (1850 г.), Отто Гессе (1857 г.), Альфредом Клебшем (1858 г.) и Льюисом Баффетом Карлом (1885 г.), но, возможно, самая важная работа века состоит в том, что из Вейерштрасса . Его знаменитый курс теории является эпохальным, и можно утверждать, что он был первым, кто положил его на прочный и неоспоримый фундамент. 20 -я и 23-я задачи Гильберта , опубликованные в 1900 году, стимулировали дальнейшее развитие. [5]

В 20 веке Дэвид Гильберт , Оскар Больза , Гилберт Эймс Блисс , Эмми Нётер , Леонида Тонелли , Анри Лебег и Жак Адамар среди других внесли значительный вклад. [5] Марстон Морс применил вариационное исчисление в том, что сейчас называется теорией Морса . [6] Лев Понтрягин , Ральф Рокафеллар и Ф.Х. Кларк разработали новые математические инструменты для вариационного исчисления в теории оптимального управления . [6] Динамическое программирование Ричарда Беллмана является альтернативой вариационному исчислению. [7] [8] [9] [в]

Экстрема

Вариационное исчисление занимается максимумами и минимумами (в совокупности называемыми экстремумами ) функционалов. Функционал отображает функции в скаляры , поэтому функционалы описываются как «функции функций». Функционалы имеют экстремумы относительно элементов данного функционального пространства , определенного в данной области . Говорят, что функционал имеет экстремум на функции, если он имеет один и тот же знак для всех в сколь угодно малой окрестности точки [d] . Функция называется экстремальной функцией или экстремальной. [д] Экстремум называется локальным максимумом, если всюду в сколь угодно малой окрестности и локальным минимумом, если таковой имеется. Для функционального пространства непрерывных функций экстремумы соответствующих функционалов называются сильными экстремумами или слабыми экстремумами , в зависимости от того, являются ли первые производные непрерывных функций соответственно непрерывными или нет. [11]

Как сильные, так и слабые экстремумы функционалов относятся к пространству непрерывных функций, но к сильным экстремумам предъявляется дополнительное требование, чтобы первые производные функций в пространстве были непрерывными. Таким образом, сильный экстремум является одновременно и слабым экстремумом, но обратное может не иметь места. Найти сильные экстремумы сложнее, чем найти слабые экстремумы. [12] Примером необходимого условия , которое используется для нахождения слабых экстремумов, является уравнение Эйлера–Лагранжа . [13] [ф]

Уравнение Эйлера–Лагранжа

Нахождение экстремумов функционалов аналогично нахождению максимумов и минимумов функций. Максимумы и минимумы функции можно найти, найдя точки, в которых ее производная обращается в нуль (т. е. равна нулю). Экстремумы функционалов можно получить, найдя функции, у которых функциональная производная равна нулю. Это приводит к решению связанного уравнения Эйлера-Лагранжа . [г]

Рассмотрим функционал

Если функционал достигает локального минимума в точке и является произвольной функцией, имеющей хотя бы одну производную и обращающейся в нуль в конечных точках , а затем для любого числа , близкого к 0,

Этот член называется вариацией функции и обозначается [1] [h]

Подставляя в функционал, результат является функцией

[i]

Взяв полную производную от где и рассматриваются как функции, а не доходности

Поэтому,

интегрирование по частям

Согласно основной лемме вариационного исчисления , часть подынтегрального выражения в скобках равна нулю, т.е.

уравнением Эйлера–Лагранжафункциональной производной

В общем, это дает обыкновенное дифференциальное уравнение второго порядка , которое можно решить, чтобы получить экстремальную функцию. Уравнение Эйлера – Лагранжа является необходимым , но недостаточным условием экстремума. Достаточное условие минимума приведено в разделах «Вариации» и «Вариации». достаточное условие минимума.

Пример

Чтобы проиллюстрировать этот процесс, рассмотрим задачу поиска экстремальной функции , которая представляет собой кратчайшую кривую, соединяющую две точки . Длина дуги кривой определяется выражением

yx,

Уравнение Эйлера–Лагранжа теперь будет использоваться для нахождения экстремальной функции, минимизирующей функционал

Поскольку он не появляется явно в первом члене уравнения Эйлера – Лагранжа, исчезает для всех и, следовательно,

Таким образом

[Дж]

Личность Бельтрами

В задачах по физике может случиться так, что значение подынтегральной функции является функцией и, но не появляется отдельно. В этом случае уравнение Эйлера–Лагранжа можно упростить до тождества Бельтрами [16]

преобразование Лежандра

Интуиция, лежащая в основе этого результата, заключается в том, что если переменная на самом деле является временем, то из этого утверждения следует, что лагранжиан не зависит от времени. По теореме Нётер существует соответствующая сохраняющаяся величина. В данном случае этой величиной является гамильтониан — преобразование Лежандра лагранжиана, который (часто) совпадает с энергией системы. Это (минус) константа в личности Бельтрами.

Уравнение Эйлера–Пуассона

Если зависит от высших производных, то есть, если

Пуассона[17]

Теорема Дюбуа-Реймона

До сих пор в обсуждении предполагалось, что экстремальные функции имеют две непрерывные производные, хотя для существования интеграла требуются только первые производные пробных функций. Условие исчезновения первой вариации в экстремали можно рассматривать как слабую форму уравнения Эйлера–Лагранжа. Теорема Дюбуа-Реймона утверждает, что из этой слабой формы следует сильная форма. If имеет непрерывные первую и вторую производные по всем своим аргументам, и если

Феномен Лаврентьева

Гильберт был первым, кто дал хорошие условия для того, чтобы уравнения Эйлера – Лагранжа давали стационарное решение. В пределах выпуклой области и положительного трижды дифференцируемого лагранжиана решения состоят из счетного набора сечений, которые либо идут вдоль границы, либо удовлетворяют уравнениям Эйлера – Лагранжа внутри.

Однако Лаврентьев в 1926 году показал, что существуют обстоятельства, при которых оптимального решения не существует, но к нему можно приблизиться сколь угодно близко, увеличивая число секций. Феномен Лаврентьева определяет разницу в нижней части задачи минимизации для разных классов допустимых функций. Например, следующая задача, поставленная Маниа в 1934 году: [18]

Понятно, что минимизирует функционал, но мы обнаруживаем, что любая функция дает значение, ограниченное нижней границей.

Примеры (в одномерном измерении) традиционно проявляются поперек и, но Болл и Мизель [19] получили первый функционал, который отобразил феномен Лаврентьева поперек и для. Есть несколько результатов, которые дают критерии, при которых это явление не происходит - например, «стандартный рост». ', лагранжиан, не зависящий от второй переменной, или аппроксимирующая последовательность, удовлетворяющая условию Чезари (D), но результаты часто частны и применимы к небольшому классу функционалов.

С феноменом Лаврентьева связано свойство отталкивания: любой функционал, отображающий феномен Лаврентьева, будет проявлять свойство слабого отталкивания. [20]

Функции нескольких переменных

Например, если обозначает смещение мембраны над доменом в плоскости, то ее потенциальная энергия пропорциональна площади ее поверхности:

Проблема Платоминимальными поверхностями

Принцип Дирихле

Часто бывает достаточно рассматривать только небольшие смещения мембраны, разница в энергии которых от отсутствия смещения аппроксимируется выражением

Трудность этого рассуждения состоит в предположении, что минимизирующая функция u должна иметь две производные. Риман утверждал, что существование плавной минимизирующей функции обеспечивается связью с физической проблемой: мембраны действительно принимают конфигурации с минимальной потенциальной энергией. Риман назвал эту идею принципом Дирихле в честь своего учителя Петера Густава Лежена Дирихле . Однако Вейерштрасс привел пример вариационной задачи без решения: минимизировать

[k].эллиптических уравнений в частных производных

Обобщение на другие краевые задачи

Более общее выражение для потенциальной энергии мембраны:

без ограничения ее граничных значений,
естественными граничными условиями

Предыдущие рассуждения недействительны, если тождественно обращается в нуль . В таком случае мы могли бы допустить пробную функцию, где – константа. Для такой пробной функции

Проблемы собственных значений

Как одномерные, так и многомерные задачи на собственные значения можно сформулировать как вариационные задачи.


Проблемы Штурма – Лиувилля

Проблема собственных значений Штурма – Лиувилля включает общую квадратичную форму

методу Рэлея-Ритца

Следующее наименьшее собственное значение и собственная функция могут быть получены путем минимизации при дополнительном ограничении

Вариационная задача применима и к более общим граничным условиям. Вместо того, чтобы требовать исчезновения в конечных точках, мы можем не налагать никаких условий в конечных точках и установить

естественными граничными условиями

Проблемы собственных значений в нескольких измерениях

Задачи на собственные значения в более высоких размерностях определяются аналогично одномерному случаю. Например, для области с трехмерной границей мы можем определить

Приложения

Оптика

Принцип Ферма гласит, что свет проходит путь, который (локально) минимизирует оптическую длину между его конечными точками. Если в качестве параметра вдоль пути и вдоль пути выбрана координата, то оптическая длина определяется выражением

первая вариация

После интегрирования по частям первого слагаемого в скобках получим уравнение Эйлера–Лагранжа

Световые лучи можно определить путем интегрирования этого уравнения. Этот формализм используется в контексте лагранжевой оптики и гамильтоновой оптики .

Закон Снелла

Показатель преломления меняется, когда свет попадает в линзу или выходит из нее. Позволять

Умножающий множитель представляет собой синус угла падающего луча с осью, а умножающий множитель представляет собой синус угла преломленного луча с осью. Закон Снелла для преломления требует, чтобы эти члены были равны. Как показывает этот расчет, закон Снелла эквивалентен обращению в нуль первой вариации длины оптического пути.

Принцип Ферма в трех измерениях

Целесообразно использовать векторную запись: пусть – параметр, пусть – параметрическое представление кривой , пусть – ее касательный вектор. Оптическая длина кривой определяется выражением

Заметим, что этот интеграл инвариантен относительно изменения параметрического представления. Уравнения Эйлера–Лагранжа для минимизирующей кривой имеют симметричный вид

Из определения следует, что удовлетворяет

Поэтому интеграл можно записать и в виде

Эта форма предполагает, что если мы можем найти функцию , градиент которой задан тогда, интеграл определяется разностью в конечных точках интервала интегрирования. Таким образом, задачу изучения кривых, делающих интеграл стационарным, можно связать с изучением поверхностей уровня. Чтобы найти такую ​​функцию, обратимся к волновому уравнению, управляющему распространением света. Этот формализм используется в контексте лагранжевой оптики и гамильтоновой оптики .

Связь с волновым уравнением

Волновое уравнение для неоднородной среды имеет вид

Мы можем искать решения в виде

В этом случае удовлетворяет

уравнений в частных производных первого порядка
световых лучей

Эти уравнения решения уравнения в частных производных первого порядка идентичны уравнениям Эйлера – Лагранжа, если провести отождествление

Делаем вывод, что функция представляет собой значение минимизирующего интеграла как функцию верхней конечной точки. То есть при построении семейства минимизирующих кривых значения оптической длины удовлетворяют характеристическому уравнению, соответствующему волновому уравнению. Следовательно, решение ассоциированного уравнения в частных производных первого порядка эквивалентно нахождению семейств решений вариационной задачи. Это существенное содержание теории Гамильтона – Якоби , которое применимо к более общим вариационным задачам.

Механика

В классической механике действие определяется как интеграл по времени от лагранжиана. Лагранжиан — это разность энергий,

кинетическая энергияпотенциальная энергияПринцип Гамильтона

Сопряженные импульсы определяются формулой

Гамильтонова механика
уравнения Гамильтона – Якоби

Дальнейшие применения

Дальнейшие применения вариационного исчисления включают следующее:

Вариации и достаточное условие минимума

Вариационное исчисление занимается вариациями функционалов, которые представляют собой небольшие изменения значения функционала из-за небольших изменений функции, которая является его аргументом. Первая вариация [l] определяется как линейная часть изменения функционала, а вторая вариация [m] определяется как квадратичная часть. [22]

Например, если это функционал с функцией в качестве аргумента, и есть небольшое изменение его аргумента от до где функция находится в том же функциональном пространстве, что и тогда соответствующее изменение функционала равно [n]

Функционал называется дифференцируемым , если

[o][p][26]

Функционал называется дважды дифференцируемым, если

[q][28]

Второй вариант называется сильно положительным, если

[29]

Используя приведенные выше определения, особенно определения первой вариации, второй вариации и строго положительного, можно сформулировать следующее достаточное условие минимума функционала.

Достаточное условие минимума:

Функционал имеет минимум при, если его первая вариация при и вторая вариация сильно положительны при [30] [r] [s]

Смотрите также

Примечания

  1. ^ В то время как элементарное исчисление касается бесконечно малых изменений значений функций без изменений самой функции, вариационное исчисление связано с бесконечно малыми изменениями самой функции, которые называются вариациями. [1]
  2. ^ «Эйлер ждал, пока Лагранж опубликует эту тему в 1762 году... прежде чем передать свою лекцию... напечатать, чтобы не лишить Лагранжа его славы. Действительно, только метод Лагранжа Эйлер назвал Вариационным исчислением ." [3]
  3. ^ См. Гарольд Дж. Кушнер (2004) : относительно динамического программирования: «Вариационное исчисление имело родственные идеи (например, работа Каратеодори, уравнение Гамильтона-Якоби). Это привело к конфликтам с сообществом вариационного исчисления».
  4. ^ Окрестность - это часть данного функционального пространства, где находятся все области определения функций, с положительным числом, указывающим размер окрестности. [10]
  5. ^ Обратите внимание на разницу между терминами «экстремаль» и «экстремум». Экстремаль – это функция, которая делает функционал экстремумом.
  6. ^ Достаточное условие см. в разделе «Вариации и достаточное условие минимума».
  7. ^ Следующий вывод уравнения Эйлера-Лагранжа соответствует выводу Куранта и Гильберта (1953) на стр. 184–185. [14]
  8. ^ Обратите внимание, что и оцениваются с теми же значениями, которые в более общем случае недействительны в вариационном исчислении с неголономными ограничениями.
  9. ^ Произведение называется первой вариацией функционала и обозначается. В некоторых источниках первая вариация определяется по-другому, исключая множитель.
  10. ^ Как историческая справка, это аксиома Архимеда . См., например, Келланд (1843). [15]
  11. Возникшие разногласия по поводу обоснованности принципа Дирихле объясняет Тернбулл. [21]
  12. ^ Первую вариацию также называют вариацией, дифференциалом или первым дифференциалом.
  13. ^ Второй вариант также называют вторым дифференциалом.
  14. ^ Обратите внимание, что и приведенные ниже варианты зависят от обоих , а аргумент опущен для упрощения обозначений. Например, можно было бы написать [23]
  15. ^ Функционал называется линейным , если   и   где являются функциями и является действительным числом. [24]
  16. ^ Для функции , которая определена для где и являются действительными числами, нормой является ее максимальное абсолютное значение, т.е. [25]
  17. ^ Функционал называется квадратичным , если он является билинейным функционалом с двумя равными аргументами. Билинейный функционал — это функционал, который зависит от двух функций-аргументов и является линейным, когда каждая функция-аргумент, в свою очередь, фиксирована, а другая функция-аргумент является переменной. [27]
  18. ^ Другие достаточные условия см. в Гельфанд и Фомин 2000,
    • Глава  5: «Второй вариант. Достаточные условия слабого экстремума» - Достаточные условия слабого минимума дает теорема на с.  116.
    • Глава  6: «Поля. Достаточные условия сильного экстремума» – Достаточные условия сильного минимума дает теорема на с.  148.
  19. ^ Можно отметить сходство с достаточным условием минимума функции, где первая производная равна нулю, а вторая производная положительна.

Рекомендации

  1. ^ ab Курант и Гильберт 1953, с. 184
  2. ^ Гельфанд, ИМ ; Фомин, С.В. (2000). Сильверман, Ричард А. (ред.). Вариационное исчисление (Полное издание). Минеола, Нью-Йорк: Dover Publications. п. 3. ISBN 978-0486414485.
  3. ^ аб Тиле, Рюдигер (2007). «Эйлер и вариационное исчисление». В Брэдли, Роберт Э.; Сандифер, К. Эдвард (ред.). Леонард Эйлер: жизнь, работа и наследие . Эльзевир. п. 249. ИСБН 9780080471297.
  4. ^ Голдстайн, Герман Х. (2012). История вариационного исчисления с 17 по 19 века. Springer Science & Business Media. п. 110. ИСБН 9781461381068.
  5. ^ abc ван Брант, Брюс (2004). Вариационное исчисление . Спрингер. ISBN 978-0-387-40247-5.
  6. ^ Аб Фергюсон, Джеймс (2004). «Краткий обзор истории вариационного исчисления и его приложений». arXiv : math/0402357 .
  7. ^ Дмитрий Берцекас . Динамическое программирование и оптимальное управление. Афина Сайентифик, 2005.
  8. ^ Беллман, Ричард Э. (1954). «Динамическое программирование и новый формализм в вариационном исчислении». Учеб. Натл. акад. Наука . 40 (4): 231–235. Бибкод : 1954PNAS...40..231B. дои : 10.1073/pnas.40.4.231 . ПМК 527981 . ПМИД  16589462. 
  9. ^ "Премия Ричарда Э. Беллмана за контроль наследия" . Американский совет по автоматическому управлению . 2004. Архивировано из оригинала 1 октября 2018 г. Проверено 28 июля 2013 г.
  10. ^ Курант, Р ; Гильберт, Д. (1953). Методы математической физики . Том. Я (Первое английское изд.). Нью-Йорк: Interscience Publishers, Inc., с. 169. ИСБН 978-0471504474.
  11. ^ Гельфанд и Фомин 2000, стр. 12–13.
  12. ^ Гельфанд и Фомин 2000, с. 13
  13. ^ Гельфанд и Фомин 2000, стр. 14–15.
  14. ^ Курант, Р .; Гильберт, Д. (1953). Методы математической физики . Том. Я (Первое английское изд.). Нью-Йорк: ISBN Interscience Publishers, Inc. 978-0471504474.
  15. ^ Келланд, Филип (1843). Лекции по основам доказательной математики. п. 58 – через Google Книги.
  16. ^ Вайсштейн, Эрик В. «Дифференциальное уравнение Эйлера – Лагранжа». mathworld.wolfram.com . Вольфрам. уравнение (5).
  17. ^ Кот, Марк (2014). «Глава 4: Основные обобщения». Первый курс вариационного исчисления . Американское математическое общество. ISBN 978-1-4704-1495-5.
  18. ^ Мания, Бернар (1934). «Сопра инсценарий Лаврентьева». Болленттино дель Юнион Математика Итальяна . 13 : 147–153.
  19. ^ Болл и Мизель (1985). «Одномерные вариационные задачи, минимизаторы которых не удовлетворяют уравнению Эйлера-Лагранжа». Архив рациональной механики и анализа . 90 (4): 325–388. Бибкод : 1985ArRMA..90..325B. дои : 10.1007/BF00276295. S2CID  55005550.
  20. ^ Ферриеро, Алессандро (2007). «Свойство слабого отталкивания». Journal de Mathématiques Pures et Appliquées . 88 (4): 378–388. дои : 10.1016/j.matpur.2007.06.002.
  21. ^ Тернбулл. «Биография Римана». Великобритания: Университет Сент-Эндрю.
  22. ^ Гельфанд и Фомин 2000, стр. 11–12, 99.
  23. ^ Гельфанд и Фомин 2000, с. 12, сноска 6
  24. ^ Гельфанд и Фомин 2000, с. 8
  25. ^ Гельфанд и Фомин 2000, с. 6
  26. ^ Гельфанд и Фомин 2000, стр. 11–12.
  27. ^ Гельфанд и Фомин 2000, стр. 97–98.
  28. ^ Гельфанд и Фомин 2000, с. 99
  29. ^ Гельфанд и Фомин 2000, с. 100
  30. ^ Гельфанд и Фомин 2000, с. 100, Теорема 2

дальнейшее чтение

Внешние ссылки