В теоретической физике и математической физике аналитическая механика или теоретическая механика — это набор тесно связанных формулировок классической механики . Аналитическая механика использует скалярные свойства движения, представляющие систему в целом — обычно ее кинетическую энергию и потенциальную энергию . Уравнения движения выводятся из скалярной величины с помощью некоторого базового принципа об изменении скаляра .
Аналитическая механика была разработана многими учеными и математиками в 18 веке и позже, после ньютоновской механики . Ньютоновская механика рассматривает векторные величины движения, в частности ускорения , импульсы , силы , составляющих систему; ее также можно назвать векторной механикой . [1] Скаляр — это величина, тогда как вектор представлен величиной и направлением. Результаты этих двух различных подходов эквивалентны, но подход аналитической механики имеет много преимуществ для сложных проблем.
Аналитическая механика использует ограничения системы для решения проблем. Ограничения ограничивают степени свободы, которые может иметь система, и могут использоваться для уменьшения числа координат, необходимых для решения движения. Формализм хорошо подходит для произвольного выбора координат, известных в контексте как обобщенные координаты . Кинетическая и потенциальная энергии системы выражаются с использованием этих обобщенных координат или импульсов, и уравнения движения могут быть легко установлены, таким образом, аналитическая механика позволяет решать многочисленные механические проблемы с большей эффективностью, чем полностью векторные методы. Она не всегда работает для неконсервативных сил или диссипативных сил, таких как трение , в этом случае можно вернуться к ньютоновской механике.
Две доминирующие ветви аналитической механики — это механика Лагранжа (использующая обобщенные координаты и соответствующие обобщенные скорости в конфигурационном пространстве ) и механика Гамильтона (использующая координаты и соответствующие импульсы в фазовом пространстве ). Обе формулировки эквивалентны преобразованию Лежандра относительно обобщенных координат, скоростей и импульсов; поэтому обе содержат одну и ту же информацию для описания динамики системы. Существуют и другие формулировки, такие как теория Гамильтона–Якоби , механика Раута и уравнение движения Аппеля . Все уравнения движения для частиц и полей в любом формализме могут быть выведены из широко применимого результата, называемого принципом наименьшего действия . Одним из результатов является теорема Нётер , утверждение, которое связывает законы сохранения с их связанными симметриями .
Аналитическая механика не вводит новую физику и не является более общей, чем механика Ньютона. Скорее, это набор эквивалентных формализмов, которые имеют широкое применение. Фактически, те же принципы и формализмы могут быть использованы в релятивистской механике и общей теории относительности , а с некоторыми изменениями — в квантовой механике и квантовой теории поля .
Аналитическая механика широко применяется: от фундаментальной физики до прикладной математики , особенно теории хаоса .
Методы аналитической механики применяются к дискретным частицам, каждая из которых имеет конечное число степеней свободы. Их можно модифицировать для описания непрерывных полей или жидкостей, которые имеют бесконечные степени свободы. Определения и уравнения имеют близкую аналогию с определениями и уравнениями механики.
Целью механической теории является решение механических проблем, например, возникающих в физике и технике. Начиная с физической системы, например, механизма или звездной системы, разрабатывается математическая модель в форме дифференциального уравнения. Модель может быть решена численно или аналитически, чтобы определить движение системы.
Векторный подход Ньютона к механике описывает движение с помощью векторных величин, таких как сила , скорость , ускорение . Эти величины характеризуют движение тела, идеализированного как «массовая точка» или « частица », понимаемая как отдельная точка, к которой прикреплена масса. Метод Ньютона успешно применялся к широкому кругу физических задач, включая движение частицы в гравитационном поле Земли и движение планет вокруг Солнца. В этом подходе законы Ньютона описывают движение дифференциальным уравнением, а затем задача сводится к решению этого уравнения.
Однако, когда механическая система содержит много частиц (например, сложный механизм или жидкость ), подход Ньютона применять трудно. Использование ньютоновского подхода возможно при соблюдении надлежащих мер предосторожности, а именно, изолировании каждой отдельной частицы от других и определении всех сил, действующих на нее. Такой анализ громоздок даже в относительно простых системах. Ньютон считал, что его третий закон «действие равно противодействию» позаботится обо всех осложнениях. [ необходима цитата ] Это неверно даже для такой простой системы, как вращение твердого тела . [ необходима уточнение ] В более сложных системах векторный подход не может дать адекватного описания.
Аналитический подход упрощает проблемы, рассматривая механические системы как ансамбли частиц, которые взаимодействуют друг с другом, а не рассматривая каждую частицу как изолированную единицу. В векторном подходе силы должны определяться индивидуально для каждой частицы, тогда как в аналитическом подходе достаточно знать одну единственную функцию, которая неявно содержит все силы, действующие на систему и в ней. Такое упрощение часто выполняется с использованием определенных кинематических условий, которые устанавливаются априори . Однако аналитическое рассмотрение не требует знания этих сил и принимает эти кинематические условия как должное. [ необходима цитата ]
Тем не менее, вывод уравнений движения сложной механической системы требует объединяющей основы, из которой они следуют. [ необходимо разъяснение ] Это обеспечивается различными вариационными принципами : за каждым набором уравнений стоит принцип, который выражает смысл всего набора. При наличии фундаментальной и универсальной величины, называемой действием , принцип, согласно которому это действие должно быть стационарным при малых изменениях некоторой другой механической величины, порождает требуемый набор дифференциальных уравнений. Формулировка принципа не требует какой-либо специальной системы координат , и все результаты выражаются в обобщенных координатах . Это означает, что аналитические уравнения движения не изменяются при преобразовании координат , свойство инвариантности , которого не хватает в векторных уравнениях движения. [2]
Не совсем ясно, что подразумевается под «решением» набора дифференциальных уравнений. Задача считается решенной, когда координаты частиц в момент времени t выражаются как простые функции от t и параметров, определяющих начальные положения и скорости. Однако «простая функция» не является четко определенным понятием: в настоящее время функция f ( t ) не рассматривается как формальное выражение от t ( элементарная функция ), как во времена Ньютона, а в более общем смысле как величина, определяемая t , и невозможно провести четкую границу между «простыми» и «не простыми» функциями. Если говорить просто о «функциях», то каждая механическая задача решена, как только она хорошо сформулирована в дифференциальных уравнениях, поскольку заданные начальные условия и t определяют координаты в момент времени t . Это факт, особенно в настоящее время с современными методами компьютерного моделирования , которые обеспечивают арифметические решения механических задач с любой желаемой степенью точности, причем дифференциальные уравнения заменяются разностными уравнениями .
Тем не менее, несмотря на отсутствие точных определений, очевидно, что задача двух тел имеет простое решение, тогда как задача трех тел — нет. Задача двух тел решается с помощью формул, включающих параметры; их значения можно изменять, чтобы изучить класс всех решений, то есть математическую структуру задачи. Более того, можно сделать точную мысленную или нарисованную картину движения двух тел, и она может быть такой же реальной и точной, как реальные тела, движущиеся и взаимодействующие. В задаче трех тел параметрам также можно присвоить определенные значения; однако решение при этих назначенных значениях или набор таких решений не раскрывает математическую структуру задачи. Как и во многих других задачах, математическую структуру можно выяснить, только исследуя сами дифференциальные уравнения.
Аналитическая механика стремится к большему: не к пониманию математической структуры отдельной механической проблемы, а к пониманию класса проблем, настолько широких, что они охватывают большую часть механики. Она концентрируется на системах, к которым применимы уравнения движения Лагранжа или Гамильтона, и которые включают в себя очень широкий спектр проблем. [3]
Развитие аналитической механики преследует две цели: (i) расширить круг решаемых задач путем разработки стандартных методов с широким спектром применимости и (ii) понять математическую структуру механики. Однако в долгосрочной перспективе (ii) может помочь (i) больше, чем концентрация на конкретных задачах, для которых уже разработаны методы.
В ньютоновской механике обычно используют все три декартовых координаты или другую трехмерную систему координат для обозначения положения тела во время его движения. Однако в физических системах некоторая структура или другая система обычно ограничивает движение тела от принятия определенных направлений и траекторий. Таким образом, полный набор декартовых координат часто не нужен, поскольку ограничения определяют развивающиеся отношения между координатами, которые могут быть смоделированы уравнениями, соответствующими ограничениям. В лагранжевом и гамильтоновом формализмах ограничения включены в геометрию движения, сокращая количество координат до минимума, необходимого для моделирования движения. Они известны как обобщенные координаты , обозначаемые q i ( i = 1, 2, 3...). [4] : 231
Обобщенные координаты включают ограничения на систему. Существует одна обобщенная координата q i для каждой степени свободы (для удобства обозначенная индексом i = 1, 2... N ), т. е. каждый способ, которым система может изменить свою конфигурацию ; как криволинейные длины или углы поворота. Обобщенные координаты не то же самое, что криволинейные координаты. Количество криволинейных координат равно размерности рассматриваемого позиционного пространства (обычно 3 для трехмерного пространства), в то время как количество обобщенных координат не обязательно равно этой размерности; ограничения могут уменьшить количество степеней свободы (следовательно, количество обобщенных координат, необходимых для определения конфигурации системы), следуя общему правилу: [5] [ сомнительно – обсудить ]
Для системы с N степенями свободы обобщенные координаты можно собрать в N - кортеж : а производная по времени (здесь обозначенная точкой) этого кортежа дает обобщенные скорости :
Принцип Даламбера гласит, что бесконечно малая виртуальная работа , совершаемая силой через обратимые перемещения, равна нулю, что является работой, совершаемой силой, согласующейся с идеальными ограничениями системы. Идея ограничения полезна, поскольку она ограничивает то, что может сделать система, и может предоставить шаги для решения для движения системы. Уравнение принципа Даламбера имеет вид: [6] : 265 где — обобщенные силы (здесь используется обозначение Q вместо обычного Q, чтобы предотвратить конфликт с каноническими преобразованиями ниже), а q — обобщенные координаты. Это приводит к обобщенной форме законов Ньютона на языке аналитической механики:
где T — полная кинетическая энергия системы, а обозначение является полезным сокращением (см. матричное исчисление для получения этой записи).
Если криволинейная система координат определяется стандартным вектором положения r , и если вектор положения может быть записан в терминах обобщенных координат q и времени t в виде: и это соотношение выполняется для всех времен t , то q называются голономными ограничениями . [7] Вектор r явно зависит от t в случаях, когда ограничения изменяются со временем, а не только из-за q ( t ) . Для ситуаций, не зависящих от времени, ограничения также называются склерономными , для случаев, зависящих от времени, они называются реономными . [5]
Введение обобщенных координат и фундаментальной функции Лагранжа:
где T – полная кинетическая энергия , а V – полная потенциальная энергия всей системы, то либо следуя вариационному исчислению , либо используя приведенную выше формулу – приходим к уравнениям Эйлера–Лагранжа ;
которые представляют собой набор из N обыкновенных дифференциальных уравнений второго порядка , по одному для каждого q i ( t ).
Эта формулировка определяет фактический путь, по которому движется тело, как выбор пути, на котором временной интеграл кинетической энергии наименьший, предполагая, что полная энергия фиксирована, и не накладывая никаких условий на время прохождения.
Формулировка Лагранжа использует конфигурационное пространство системы, множество всех возможных обобщенных координат:
где N -мерное действительное пространство (см. также обозначение set-builder ). Частное решение уравнений Эйлера–Лагранжа называется (конфигурационным) путем или траекторией , т.е. одним конкретным q ( t ) при соблюдении требуемых начальных условий . Общие решения образуют набор возможных конфигураций как функций времени:
Конфигурационное пространство можно определить более общо и, конечно, более глубоко, в терминах топологических многообразий и касательного расслоения .
Преобразование Лежандра лагранжиана заменяет обобщенные координаты и скорости ( q , q̇ ) на ( q , p ); обобщенные координаты и обобщенные импульсы , сопряженные с обобщенными координатами:
и вводит гамильтониан (который выражается через обобщенные координаты и импульсы):
где обозначает скалярное произведение , также приводящее к уравнениям Гамильтона :
которые теперь представляют собой набор из 2 N обыкновенных дифференциальных уравнений первого порядка, по одному для каждого q i ( t ) и p i ( t ). Другой результат преобразования Лежандра связывает временные производные лагранжиана и гамильтониана:
которое часто считают одним из уравнений движения Гамильтона в дополнение к другим. Обобщенные импульсы можно записать в терминах обобщенных сил таким же образом, как и второй закон Ньютона:
Аналогично конфигурационному пространству, множество всех импульсов представляет собой обобщенное импульсное пространство :
(«Пространство импульсов» также относится к « k -пространству»; набору всех волновых векторов (задаваемых соотношениями Де Бройля ), используемому в квантовой механике и теории волн )
Совокупность всех положений и импульсов образует фазовое пространство :
то есть декартово произведение конфигурационного пространства и обобщенного импульсного пространства.
Частное решение уравнений Гамильтона называется фазовой траекторией , частной кривой ( q ( t ), p ( t )) при условии требуемых начальных условий. Набор всех фазовых траекторий, общее решение дифференциальных уравнений, является фазовым портретом :
Все динамические переменные могут быть получены из положения q , импульса p и времени t и записаны как функция от них: A = A ( q , p , t ). Если A ( q , p , t ) и B ( q , p , t ) являются двумя скалярными динамическими переменными, скобка Пуассона определяется обобщенными координатами и импульсами:
Вычисление полной производной одного из них, скажем, A , и подстановка уравнений Гамильтона в результат приводит к временной эволюции A :
Это уравнение в A тесно связано с уравнением движения в картине квантовой механики Гейзенберга , в которой классические динамические переменные становятся квантовыми операторами (обозначенными шляпами (^)), а скобка Пуассона заменяется коммутатором операторов посредством канонического квантования Дирака :
Ниже приведены перекрывающиеся свойства функций Лагранжа и Гамильтона. [5] [8]
Действие — еще одна величина в аналитической механике, определяемая как функционал Лагранжа:
Общим способом нахождения уравнений движения из действия является принцип наименьшего действия : [10]
где время отправления t 1 и прибытия t 2 фиксировано. [1] Термин «путь» или «траектория» относится к временной эволюции системы как пути через конфигурационное пространство , другими словами, q ( t ) прослеживает путь в . Путь, для которого действие наименьшее, — это путь, пройденный системой.
Из этого принципа можно вывести все уравнения движения в классической механике. Этот подход можно распространить на поля, а не на систему частиц (см. ниже), и он лежит в основе формулировки интеграла по траектории квантовой механики , [11] [12] и используется для расчета геодезического движения в общей теории относительности . [13]
Инвариантность гамильтониана (относительно добавления частной производной по времени произвольной функции p , q и t ) позволяет преобразовать гамильтониан в одном наборе координат q и импульсов p в новый набор Q = Q ( q , p , t ) и P = P ( q , p , t ) четырьмя возможными способами:
При ограничении на P и Q преобразованная гамильтонова система имеет вид:
вышеуказанные преобразования называются каноническими преобразованиями , каждая функция G n называется производящей функцией " n -го рода" или "типа -n ". Преобразование координат и импульсов может позволить упростить решение уравнений Гамильтона для данной задачи.
Выбор Q и P совершенно произволен, но не каждый выбор приводит к каноническому преобразованию. Одним из простых критериев каноничности преобразования q → Q и p → P является равенство единице скобки Пуассона,
для всех i = 1, 2,... N. Если это не так, то преобразование не является каноническим. [5]
Установив канонически преобразованный гамильтониан K = 0, а производящую функцию типа 2 равной главной функции Гамильтона (также действию ) плюс произвольная константа C :
обобщенные импульсы становятся:
и P является константой, то уравнение Гамильтона-Якоби (HJE) можно вывести из канонического преобразования типа 2:
где H — гамильтониан, как и прежде:
Другая родственная функция — характеристическая функция Гамильтона
используется для решения уравнения Гамильтона-Якоба путем аддитивного разделения переменных для не зависящего от времени гамильтониана H.
Изучение решений уравнений Гамильтона–Якоби естественным образом приводит к изучению симплектических многообразий и симплектической топологии . [14] [15] В этой формулировке решения уравнений Гамильтона–Якоби представляют собой интегральные кривые гамильтоновых векторных полей .
Механика Рауса — это гибридная формулировка механики Лагранжа и Гамильтона, нечасто используемая, но особенно полезная для удаления циклических координат. [ требуется ссылка ] Если лагранжиан системы имеет s циклических координат q = q 1 , q 2 , ... q s с сопряженными импульсами p = p 1 , p 2 , ... p s , а остальные координаты нециклические и обозначаются ζ = ζ 1 , ζ 1 , ..., ζ N − s , их можно удалить, введя раусиан :
что приводит к набору 2 гамильтоновых уравнений для циклических координат q ,
и N − s уравнений Лагранжа в нециклических координатах ζ .
При таком построении, хотя рутиан имеет форму гамильтониана, его можно рассматривать как лагранжиан с N − s степенями свободы.
Координаты q не обязательно должны быть циклическими, разделение между теми координатами, которые входят в уравнения Гамильтона, и теми, которые входят в уравнения Лагранжа, является произвольным. Просто удобно позволить уравнениям Гамильтона удалить циклические координаты, оставив нециклические координаты уравнениям Лагранжа движения.
Уравнение движения Аппеля включает обобщенные ускорения, вторые производные по времени обобщенных координат:
а также обобщенные силы, упомянутые выше в принципе Даламбера. Уравнения имеют вид
где
есть ускорение частицы k , вторая производная по времени ее вектора положения. Каждое ускорение a k выражается через обобщенные ускорения α r , аналогично каждое r k выражается через обобщенные координаты q r .
Обобщенные координаты применяются к дискретным частицам. Для N скалярных полей φ i ( r , t ), где i = 1, 2, ... N , плотность лагранжиана является функцией этих полей и их пространственных и временных производных, а также, возможно, самих пространственных и временных координат: и уравнения Эйлера–Лагранжа имеют аналог для полей: где ∂ μ обозначает 4-градиент , и было использовано соглашение о суммировании . Для N скалярных полей эти уравнения лагранжева поля представляют собой набор из N уравнений в частных производных второго порядка в полях, которые в общем случае будут связаны и нелинейны.
Эту формулировку скалярного поля можно распространить на векторные поля , тензорные поля и спинорные поля .
Лагранжиан — это объемный интеграл плотности Лагранжа: [12] [16]
Первоначально разработанная для классических полей, приведенная выше формулировка применима ко всем физическим полям в классических, квантовых и релятивистских ситуациях: таких как ньютоновская гравитация , классический электромагнетизм , общая теория относительности и квантовая теория поля . Это вопрос определения правильной плотности Лагранжа для генерации правильного уравнения поля.
Соответствующие плотности поля "импульса", сопряженные с N скалярными полями φ i ( r , t ), таковы: [12] где в этом контексте точка над точкой обозначает частичную производную по времени, а не полную производную по времени. Плотность Гамильтона определяется по аналогии с механикой:
Уравнения движения: где вариационная производная должна использоваться вместо просто частных производных. Для N полей эти уравнения гамильтонового поля представляют собой набор из 2 N дифференциальных уравнений с частными производными первого порядка, которые в общем случае будут связаны и нелинейны.
Опять же, объемный интеграл плотности гамильтониана — это гамильтониан
Каждое преобразование может быть описано оператором (т.е. функцией, действующей на переменные положения r или импульса p , чтобы изменить их). Ниже приведены случаи, когда оператор не изменяет r или p , т.е. симметрии. [11]
где R ( n̂ , θ) — матрица вращения вокруг оси, определяемой единичным вектором n̂ и углом θ.
Теорема Нётер утверждает, что непрерывное преобразование симметрии действия соответствует закону сохранения , т. е. действие (и, следовательно, лагранжиан) не изменяется при преобразовании, параметризованном параметром s : лагранжиан описывает то же движение, независимое от s , которое может быть длиной, углом поворота или временем. Соответствующие импульсы q будут сохраняться. [5]