В математике преобразование Лежандра (или преобразование Лежандра ), впервые введенное Адриеном-Мари Лежандром в 1787 году при изучении задачи о минимальной поверхности, [1] является инволютивным преобразованием над вещественными функциями, которые выпуклы по вещественной переменной. В частности, если вещественная функция многих переменных выпукла по одной из своих независимых вещественных переменных, то преобразование Лежандра относительно этой переменной применимо к функции.
В физических задачах преобразование Лежандра используется для преобразования функций одной величины (например, положения, давления или температуры) в функции сопряженной величины (импульса, объема и энтропии соответственно). Таким образом, оно обычно используется в классической механике для вывода гамильтонова формализма из лагранжева формализма (или наоборот) и в термодинамике для вывода термодинамических потенциалов , а также при решении дифференциальных уравнений многих переменных.
Для достаточно гладких функций на вещественной прямой преобразование Лежандра функции может быть задано с точностью до аддитивной константы условием, что первые производные функций являются обратными функциями друг друга. Это может быть выражено в производной нотации Эйлера как , где — оператор дифференцирования, представляет аргумент или вход для связанной функции, — обратная функция, такая что , или, что эквивалентно, как и в нотации Лагранжа .
Пусть будет интервалом , а выпуклая функция ; тогда преобразование Лежандра функции есть функция , определяемая соотношением
, где обозначает супремум по , например, в выбирается таким образом, что максимизируется при каждом , или таково, что в качестве ограниченного значения на всем протяжении существует (например, когда является линейной функцией).
Функция называется выпуклой сопряженной функцией функции . По историческим причинам (уходящим корнями в аналитическую механику) сопряженная переменная часто обозначается , вместо . Если выпуклая функция определена на всей прямой и всюду дифференцируема , то ее
можно интерпретировать как отрицательную часть отрезка касательной к графику функции , которая имеет наклон .
Определение в n-мерном реальном пространстве
Обобщение на выпуклые функции на выпуклом множестве просто: имеет область определения
и определяется соотношением,
где обозначает скалярное произведение и .
Преобразование Лежандра является применением двойственного отношения между точками и линиями. Функциональное отношение, заданное с помощью , может быть представлено в равной степени как набор точек или как набор касательных линий, заданных их наклоном и значениями пересечения.
Понимание преобразования Лежандра с точки зрения производных
Для дифференцируемой выпуклой функции на действительной прямой с первой производной и ее обратной функцией преобразование Лежандра функции , , может быть задано с точностью до аддитивной константы условием, что первые производные функций являются обратными функциями друг друга, т. е. и .
Чтобы увидеть это, сначала отметим, что если как выпуклая функция на вещественной прямой дифференцируема и является критической точкой функции , то супремум достигается в (по выпуклости, см. первый рисунок на этой странице Википедии). Следовательно, преобразование Лежандра равно .
Затем предположим, что первая производная обратима, и пусть обратная будет . Тогда для каждого точка является единственной критической точкой функции (т.е. ), поскольку и первая производная функции по при равна . Следовательно, для каждого имеем . Дифференцируя по , находим
Поскольку это упрощается до . Другими словами, и являются обратными друг другу .
В общем случае, если как обратное , то интегрирование дает с константой
На практике, учитывая, что параметрический график зависимости от равен графику зависимости от
В некоторых случаях (например, термодинамические потенциалы, см. ниже) используется нестандартное требование, сводящееся к альтернативному определению f * со знаком минус ,
Формальное определение в контексте физики
В аналитической механике и термодинамике преобразование Лежандра обычно определяется следующим образом: предположим, что является функцией, тогда имеем
Выполнение преобразования Лежандра над этой функцией означает, что мы берем в качестве независимой переменной, так что приведенное выше выражение можно записать как
и согласно правилу Лейбница тогда мы имеем
и принимая мы имеем что означает
Когда является функцией переменных , то мы можем выполнить преобразование Лежандра над каждой одной или несколькими переменными: имеем
где Тогда, если мы хотим выполнить преобразование Лежандра над , например, тогда мы берем вместе с как независимые переменные, и с правилом Лейбница мы имеем
поэтому для функции мы имеем
Мы также можем сделать это преобразование для переменных . Если мы сделаем это для всех переменных, то у нас будет
где
В аналитической механике люди выполняют это преобразование над переменными Лагранжиана, чтобы получить гамильтониан:
и в термодинамике люди выполняют это преобразование переменных в соответствии с типом термодинамической системы, которую они хотят. Например, начиная с кардинальной функции состояния, внутренней энергии , мы имеем
мы можем выполнить преобразование Лежандра для одного или обоих из следующих
и каждое из этих трех выражений имеет физический смысл.
Это определение преобразования Лежандра первоначально было введено Лежандром в его работе в 1787 году [1] и до сих пор применяется физиками в наши дни. Действительно, это определение может быть математически строгим, если мы будем рассматривать все переменные и функции, определенные выше, например, как дифференцируемые функции, определенные на открытом множестве или на дифференцируемом многообразии, и их дифференциалы (которые рассматриваются как кокасательное векторное поле в контексте дифференцируемого многообразия). И это определение эквивалентно определению современных математиков, пока является дифференцируемым и выпуклым для переменных
Характеристики
Преобразование Лежандра выпуклой функции, все значения двойной производной которой положительны, также является выпуклой функцией, все значения двойной производной которой положительны.Доказательство. Покажем это с помощью дважды дифференцируемой функции со всеми положительными значениями двойной производной и с биективной (обратимой) производной.Для фиксированного пусть максимизирует или сделает функцию ограниченной по . Тогда преобразование Лежандра для равно , таким образом, максимизирующему или ограничивающему условию . Обратите внимание, что зависит от . (Это можно наглядно показать на 1-м рисунке этой страницы выше.)Таким образом , где , то есть это обратное к тому, что является производной от (так что ).Обратите внимание, что также дифференцируемо со следующей производной (правило обратной функции) . Таким образом, преобразование Лежандра представляет собой композицию дифференцируемых функций, следовательно, оно дифференцируемо.Применяя правило произведения и цепное правило с найденным равенством , получаем , что является выпуклым, и все его двойные производные положительны.
Преобразование Лежандра является инволюцией , т.е. .Доказательство. Используя приведенные выше тождества как , , и ее производную , Обратите внимание, что этот вывод не требует, чтобы условие имело все положительные значения в двойной производной исходной функции .
Идентичности
Как показано выше, для выпуклой функции , с максимизацией или ограничением в каждой для определения преобразования Лежандра и при , справедливы следующие тождества.
,
,
.
Примеры
Пример 1
Рассмотрим показательную функцию , которая имеет область определения . Из определения следует, что преобразование Лежандра равно ,
где осталось определить. Чтобы оценить супремум , вычислим производную по и приравняем ее к нулю:
Вторая производная везде отрицательна, поэтому максимальное значение достигается при . Таким образом, преобразование Лежандра равно
и имеет область определения Это иллюстрирует, что области определения функции и ее преобразования Лежандра могут быть разными.
Чтобы найти преобразование Лежандра для преобразования Лежандра ,
где переменная намеренно используется в качестве аргумента функции , чтобы показать свойство инволюции преобразования Лежандра как . мы вычисляем
таким образом, что максимум достигается при , поскольку вторая производная по области определения как В результате находится как ,
тем самым подтверждая то, что, как и ожидалось.
Пример 2
Пусть f ( x ) = cx 2 определена на R , где c > 0 — фиксированная константа.
При фиксированном x * функция x , x * x − f ( x ) = x * x − cx 2 имеет первую производную x * − 2 cx и вторую производную −2 c ; имеется одна стационарная точка при x = x */2 c , которая всегда является максимумом.
Таким образом, I * = R и
Первые производные f , 2 cx , и f * , x */(2 c ) , являются обратными функциями друг к другу. Ясно, кроме того,
что именно f ** = f .
Пример 3
Пусть f ( x ) = x 2 для x ∈ ( I = [2, 3]) .
При фиксированном x * x − f ( x ) непрерывна на компакте I , следовательно , она всегда принимает на нем конечный максимум; отсюда следует, что областью определения преобразования Лежандра является I * = R .
Стационарная точка при x = x */2 (найденная путем установки первой производной x * x − f ( x ) по отношению к равной нулю) находится в области [2, 3] тогда и только тогда, когда 4 ≤ x * ≤ 6 . В противном случае максимум берется либо при x = 2, либо при x = 3, поскольку вторая производная x * x − f ( x ) по отношению к отрицательна, так как ; для части области максимум, который x * x − f ( x ) может принять по отношению к , достигается при , а для он становится максимумом при . Таким образом, следует, что
Пример 4
Функция f ( x ) = cx является выпуклой для любого x (строгая выпуклость не требуется для корректного определения преобразования Лежандра). Очевидно, что x * x − f ( x ) = ( x * − c ) x никогда не ограничена сверху как функция x , если только x * − c = 0 . Следовательно, f * определена на I * = { c } и f *( c ) = 0 . (Определение преобразования Лежандра требует существования супремума , что требует верхних границ.)
Можно проверить инволютивность: конечно, x * x − f *( x *) всегда ограничена как функция x *∈{ c } , следовательно, I ** = R . Тогда для всех x имеем
и, следовательно, f **( x ) = cx = f ( x ) .
Пример 5
В качестве примера выпуклой непрерывной функции, которая не всюду дифференцируема, рассмотрим . Это дает и, таким образом, на ее области определения .
Пример 6: несколько переменных
Пусть
определено на X = Rn , где A — действительная, положительно определенная матрица .
Тогда f является выпуклой и
имеет градиент p − 2 Ax и гессиан −2 A , который отрицателен; следовательно, стационарная точка x = A −1 p /2 является максимумом.
Имеем X * = R n , и
Поведение дифференциалов при преобразованиях Лежандра
Пусть f ( x , y ) будет функцией двух независимых переменных x и y , с дифференциалом
Предположим, что функция f выпукла по x для всех y , так что можно выполнить преобразование Лежандра над f по x , где p — переменная, сопряженная с x (для информации, существует соотношение , где — точка в x, максимизирующая или делающая ограниченной для заданных p и y ). Поскольку новая независимая переменная преобразования относительно f — это p , дифференциалы dx и dy в df переходят в dp и dy в дифференциале преобразования, т. е. мы строим другую функцию с ее дифференциалом, выраженным через новый базис dp и dy .
Таким образом, мы рассматриваем функцию g ( p , y ) = f − px так, что
Функция − g ( p , y ) является преобразованием Лежандра функции f ( x , y ) , где только независимая переменная x заменена на p . Это широко используется в термодинамике , как показано ниже.
где — координаты на R n × R n , M — положительно определенная действительная матрица, а
Для каждого фиксированного q является выпуклой функцией , а играет роль константы.
Следовательно, преобразование Лежандра как функции является функцией Гамильтона,
В более общем случае — локальные координаты на касательном расслоении многообразия . Для каждого q — выпуклая функция касательного пространства V q . Преобразование Лежандра дает гамильтониан как функцию координат ( p , q ) кокасательного расслоения ; скалярное произведение, используемое для определения преобразования Лежандра, наследуется от соответствующей канонической симплектической структуры . В этом абстрактном случае преобразование Лежандра соответствует тавтологической одноформе . [ необходимо дальнейшее объяснение ]
Термодинамика
Стратегия использования преобразований Лежандра в термодинамике заключается в переходе от функции, зависящей от переменной, к новой (сопряженной) функции, зависящей от новой переменной, сопряженной исходной. Новая переменная является частной производной исходной функции по исходной переменной. Новая функция является разностью между исходной функцией и произведением старой и новой переменных. Обычно это преобразование полезно, поскольку оно смещает зависимость, например, энергии от экстенсивной переменной к ее сопряженной интенсивной переменной, которую часто легче контролировать в физическом эксперименте.
(Нижние индексы не являются необходимыми по определению частных производных, но оставлены здесь для пояснения переменных.) Задавая некоторое общее исходное состояние, используя (нестандартное) преобразование Лежандра внутренней энергии U относительно объема V , энтальпию H можно получить следующим образом.
Чтобы получить (стандартное) преобразование Лежандра внутренней энергии U относительно объема V , сначала определяется функция , затем она должна быть максимизирована или ограничена V . Для этого должно быть выполнено условие , поэтому получается . Этот подход оправдан, поскольку U является линейной функцией относительно V (то есть выпуклой функцией на V ) по определению экстенсивных переменных . Нестандартное преобразование Лежандра здесь получается путем отрицания стандартной версии, поэтому .
H определенно является функцией состояния , поскольку она получается путем добавления PV ( P и V как переменные состояния ) к функции состояния , поэтому ее дифференциал является точным дифференциалом . Из-за и того факта, что это должен быть точный дифференциал, .
Энтальпия подходит для описания процессов, в которых давление контролируется окружающей средой.
Аналогично можно сместить зависимость энергии от экстенсивной переменной энтропии S к (часто более удобной) интенсивной переменной T , что приводит к свободным энергиям Гельмгольца и Гиббса . Свободная энергия Гельмгольца A и энергия Гиббса G получаются путем выполнения преобразований Лежандра внутренней энергии и энтальпии соответственно,
Свободная энергия Гельмгольца часто является наиболее полезным термодинамическим потенциалом, когда температура и объем контролируются окружающей средой, в то время как энергия Гиббса часто является наиболее полезной, когда температура и давление контролируются окружающей средой.
Переменный конденсатор
В качестве другого примера из физики рассмотрим параллельный проводящий плоский конденсатор , в котором пластины могут двигаться относительно друг друга. Такой конденсатор позволит преобразовывать электрическую энергию, которая хранится в конденсаторе, во внешнюю механическую работу, выполняемую силой, действующей на пластины. Можно представить себе электрический заряд как аналог «заряда» газа в цилиндре , с результирующей механической силой , действующей на поршень .
Вычислите силу на пластинах как функцию x , расстояния, которое их разделяет. Чтобы найти силу, вычислите потенциальную энергию, а затем примените определение силы как градиента функции потенциальной энергии.
Электростатическая потенциальная энергия, запасенная в конденсаторе емкостью C ( x ) и положительным электрическим зарядом + Q или отрицательным зарядом - Q на каждой проводящей пластине, равна (используя определение емкости как ),
где зависимость от площади пластин, диэлектрической проницаемости изоляционного материала между пластинами и расстояния x абстрагируются как емкость C ( x ) . (Для конденсатора с параллельными пластинами она пропорциональна площади пластин и обратно пропорциональна расстоянию.)
Сила F между пластинами, возникающая из-за электрического поля, созданного разделением зарядов, тогда равна
Если конденсатор не подключен ни к какой электрической цепи, то электрические заряды на пластинах остаются постоянными, а напряжение изменяется при движении пластин относительно друг друга, а сила представляет собой отрицательный градиент электростатической потенциальной энергии, как
тогда как заряд в этой конфигурации фиксирован.
Однако вместо этого предположим, что напряжение между пластинами V поддерживается постоянным при движении пластины за счет подключения к батарее , которая является резервуаром для электрических зарядов при постоянной разности потенциалов. Тогда величина зарядов является переменной вместо напряжения; и являются сопряженными друг другу Лежандра. Чтобы найти силу, сначала вычислим нестандартное преобразование Лежандра относительно (также с использованием ),
Это преобразование возможно, поскольку теперь является линейной функцией, поэтому является выпуклой на ней. Сила теперь становится отрицательным градиентом этого преобразования Лежандра, что приводит к той же силе, полученной из исходной функции ,
Две сопряженные энергии и оказываются противоположными друг другу (их знаки противоположны) только из-за линейности емкости — за исключением того, что теперь Q больше не является константой. Они отражают два разных пути накопления энергии в конденсаторе, что приводит, например, к одному и тому же «притяжению» между пластинами конденсатора.
Если — независимые случайные величины, то пусть — соответствующее случайное блуждание и функция, генерирующая моменты . Для , . Следовательно, по неравенству Маркова для и ,
где . Поскольку левая часть не зависит от , мы можем взять нижнюю грань правой части, что приводит к рассмотрению верхней грани , т. е. преобразования Лежандра , оцененного при .
Микроэкономика
Преобразование Лежандра естественным образом возникает в микроэкономике в процессе нахождения предложения S ( P ) некоторого продукта при фиксированной цене P на рынке, зная функцию затрат C ( Q ) , т. е. затраты производителя на производство/добычу и т. д. Q единиц данного продукта.
Простая теория объясняет форму кривой предложения, основываясь исключительно на функции затрат. Предположим, что рыночная цена за единицу нашего продукта равна P. Для компании, продающей этот товар, наилучшей стратегией является корректировка производства Q таким образом, чтобы ее прибыль была максимальной. Мы можем максимизировать прибыль
, дифференцируя по Q и решая
Q opt представляет собой оптимальное количество Q товаров, которое производитель готов поставить, что по сути и является поставкой:
Если мы рассмотрим максимальную прибыль как функцию цены, то увидим, что это преобразование Лежандра функции затрат .
Геометрическая интерпретация
Для строго выпуклой функции преобразование Лежандра можно интерпретировать как отображение между графиком функции и семейством касательных графика. (Для функции одной переменной касательные хорошо определены во всех, но не более чем в счетном числе точек, поскольку выпуклая функция дифференцируема во всех, но не более чем в счетном числе точек.)
Уравнение прямой с наклоном и точкой пересечения задается формулой . Для того чтобы эта прямая была касательной к графику функции в точке , требуется
и
Будучи производной строго выпуклой функции, функция строго монотонна и, следовательно, инъективна . Второе уравнение можно решить, исключив из первого и решив для пересечения касательной с прямой как функцию ее наклона , где обозначает преобразование Лежандра
Семейство касательных линий графика, параметризованного наклоном, таким образом , задается выражением или, записанным неявно, решениями уравнения
График исходной функции может быть восстановлен из этого семейства линий как огибающей этого семейства, требуя
Исключая из этих двух уравнений, получаем
Отождествляя и распознавая правую часть предыдущего уравнения как преобразование Лежандра доходности
Преобразование Лежандра в более чем одном измерении
Для дифференцируемой действительной функции на открытом выпуклом подмножестве U пространства Rn лежандрово сопряжение пары ( U , f ) определяется как пара ( V , g ) , где V — образ U при градиентном отображении Df , а g — функция на V, заданная формулой
где
является скалярным произведением на R n . Многомерное преобразование можно интерпретировать как кодирование выпуклой оболочки надграфика функции в терминах ее опорных гиперплоскостей . [2] Это можно рассматривать как следствие следующих двух наблюдений. С одной стороны, гиперплоскость, касательная к надграфику в некоторой точке, имеет нормальный вектор . С другой стороны, любое замкнутое выпуклое множество можно охарактеризовать через множество его опорных гиперплоскостей уравнениями , где — опорная функция . Но определение преобразования Лежандра через максимизацию в точности совпадает с определением опорной функции, то есть . Таким образом, мы приходим к выводу, что преобразование Лежандра характеризует надграфик в том смысле, что касательная плоскость к надграфику в любой точке явно задается выражением
Альтернативно, если X — векторное пространство , а Y — его дуальное векторное пространство , то для каждой точки x из X и y из Y существует естественное отождествление кокасательных пространств T* X x с Y и T* Y y с X . Если f — вещественная дифференцируемая функция над X , то ее внешняя производная , df , является сечением кокасательного расслоения T* X , и, как таковая, мы можем построить отображение из X в Y . Аналогично, если g — вещественная дифференцируемая функция над Y , то dg определяет отображение из Y в X . Если оба отображения оказываются обратными друг другу, мы говорим, что у нас есть преобразование Лежандра. Понятие тавтологической одноформы обычно используется в этой обстановке.
Когда функция не дифференцируема, преобразование Лежандра все еще может быть расширено и известно как преобразование Лежандра-Фенхеля . В этой более общей ситуации некоторые свойства теряются: например, преобразование Лежандра больше не является своим собственным обратным (если только нет дополнительных предположений, таких как выпуклость ).
Как обычно, двойственное к обозначается как . Слой над обозначается как , а ограничение на обозначается как . Преобразование Лежандра для является гладким морфизмом, определяемым как , где . Здесь мы используем тот факт, что поскольку является векторным пространством, может быть отождествлено с . Другими словами, является ковектором, который отправляет в производную по направлению .
Чтобы локально описать преобразование Лежандра, пусть будет координатной картой над , которая тривиальна. Выбирая тривиализацию над , мы получаем карты и . В терминах этих карт имеем , где для всех . Если, как в классическом случае, ограничение на каждое волокно строго выпукло и ограничено снизу положительно определенной квадратичной формой за вычетом константы, то преобразование Лежандра является диффеоморфизмом. [3] Предположим, что является диффеоморфизмом, и пусть будет « гамильтоновой » функцией, определяемой соотношением , где . Используя естественный изоморфизм , мы можем рассматривать преобразование Лежандра как отображение . Тогда имеем [3]
Дополнительные свойства
Масштабирование свойств
Преобразование Лежандра имеет следующие масштабные свойства: при a > 0
Отсюда следует, что если функция однородна степени r , то ее образ при преобразовании Лежандра является однородной функцией степени s , где 1/ r + 1/ s = 1. (Поскольку f ( x ) = x r / r , при r > 1 , то f *( p ) = p s / s .) Таким образом, единственный моном, степень которого инвариантна относительно преобразования Лежандра, — это квадратичный.
Поведение при переводе
Поведение при инверсии
Поведение при линейных преобразованиях
Пусть A : R n → R m — линейное преобразование . Для любой выпуклой функции f на R n , имеем
где A * — сопряженный оператор A, определенный как
, а Af — прямой перенос f вдоль A
Инфинимальная свертка двух функций f и g определяется как
Пусть f 1 , ..., f m — собственные выпуклые функции на R n . Тогда
Неравенство Фенхеля
Для любой функции f и ее выпуклой сопряженной f * неравенство Фенхеля (также известное как неравенство Фенхеля–Юнга ) справедливо для любых x ∈ X и p ∈ X * , т. е. независимых пар x , p ,
^ аб Лежандр, Адриен-Мари (1789). Памятка по интеграции некоторых уравнений с различными частями. В Histoire de l'Académie Royale des Sciences, avec les Mémoires de Mathématique et de Physique (на французском языке). Том. 1787. Париж: Imprimerie royale. стр. 309–351.
^ "Legendre Transform | Nick Alger // Карты, искусство и т. д.". Архивировано из оригинала 2015-03-12 . Получено 2011-01-26 .
^ аб Ана Каннас да Силва. Лекции по симплектической геометрии , Исправленное 2-е издание. Springer-Verlag, 2008. стр. 147–148. ISBN 978-3-540-42195-5 .
Zia, RKP; Redish, EF; McKay, SR (2009). «Making sense of the Legendre transform». American Journal of Physics . 77 (7): 614. arXiv : 0806.1147 . Bibcode : 2009AmJPh..77..614Z. doi : 10.1119/1.3119512. S2CID 37549350.