stringtranslate.com

Градиент

Градиент, представленный синими стрелками, обозначает направление наибольшего изменения скалярной функции. Значения функции представлены в оттенках серого и увеличиваются по значению от белого (низкий) к темному (высокий).

В векторном исчислении градиент скалярно -значной дифференцируемой функции нескольких переменных — это векторное поле (или векторнозначная функция ), значение которого в точке задает направление и скорость наибольшего роста. Градиент преобразуется подобно вектору при изменении базиса пространства переменных . Если градиент функции не равен нулю в точке , направление градиента — это направление, в котором функция возрастает наиболее быстро от , а величина градиента — это скорость роста в этом направлении, наибольшая абсолютная производная по направлению. [1] Кроме того, точка, в которой градиент является нулевым вектором, известна как стационарная точка . Таким образом, градиент играет фундаментальную роль в теории оптимизации , где он используется для минимизации функции методом градиентного спуска . В терминах, не зависящих от координат, градиент функции может быть определен как:

где — полное бесконечно малое изменение для бесконечно малого смещения , и становится максимальным, когда находится в направлении градиента . Символ набла , записанный в виде перевернутого треугольника и произносимый как «дель», обозначает векторный дифференциальный оператор .

При использовании системы координат, в которой базисные векторы не являются функциями положения, градиент задается вектором [ a], компоненты которого являются частными производными от . [2] То есть, для его градиент определяется в точке в n -мерном пространстве как вектор [b ]

Обратите внимание, что приведенное выше определение градиента определено только для функции , если она дифференцируема в . Могут быть функции, для которых существуют частные производные в каждом направлении, но не являются дифференцируемыми. Более того, это определение как вектора частных производных справедливо только тогда, когда базис системы координат является ортонормированным. Для любого другого базиса необходимо учитывать метрический тензор в этой точке.

Например, функция, если только в начале координат, где , не дифференцируема в начале координат, поскольку она не имеет четко определенной касательной плоскости, несмотря на наличие четко определенных частных производных в каждом направлении в начале координат. [3] В этом конкретном примере при вращении системы координат xy приведенная выше формула для градиента не преобразуется как вектор (градиент становится зависимым от выбора базиса для системы координат), а также не указывает на «самый крутой подъем» в некоторых ориентациях. Для дифференцируемых функций, где формула для градиента верна, можно показать, что она всегда преобразуется как вектор при преобразовании базиса, чтобы всегда указывать на самый быстрый рост.

Градиент двойственен полной производной : значение градиента в точке является касательным вектором – вектором в каждой точке; в то время как значение производной в точке является кокасательным вектором – линейным функционалом на векторах. [c] Они связаны тем, что скалярное произведение градиента в точке с другим касательным вектором равно производной по направлению в функции вдоль ; то есть, . Градиент допускает множественные обобщения на более общие функции на многообразиях ; см. § Обобщения.

Мотивация

Градиент двумерной функции f ( x , y ) = xe −( x 2 + y 2 ) отображается в виде стрелок на псевдоцветном графике функции.

Рассмотрим комнату, где температура задана скалярным полем T , так что в каждой точке ( x , y , z ) температура равна T ( x , y , z ) , независимо от времени. В каждой точке комнаты градиент T в этой точке покажет направление, в котором температура растет быстрее всего, удаляясь от ( x , y , z ) . Величина градиента определит , насколько быстро температура растет в этом направлении.

Рассмотрим поверхность, высота которой над уровнем моря в точке ( x , y ) равна H ( x , y ) . Градиент H в точке — это плоский вектор, указывающий в направлении самого крутого склона или уклона в этой точке. Крутизна склона в этой точке определяется величиной вектора градиента.

Градиент также можно использовать для измерения того, как скалярное поле изменяется в других направлениях, а не только в направлении наибольшего изменения, взяв скалярное произведение . Предположим, что самый крутой склон на холме составляет 40%. Дорога, идущая прямо в гору, имеет уклон 40%, но дорога, огибающая холм под углом, будет иметь более пологий уклон. Например, если дорога находится под углом 60° к направлению подъема (когда оба направления проецируются на горизонтальную плоскость), то уклон вдоль дороги будет скалярным произведением между вектором градиента и единичным вектором вдоль дороги, поскольку скалярное произведение измеряет, насколько единичный вектор вдоль дороги выравнивается с самым крутым склоном, [d], что составляет 40% от косинуса 60°, или 20%.

В более общем случае, если функция высоты холма H дифференцируема , то градиент H, отмеченный единичным вектором, дает наклон холма в направлении вектора, производную по направлению от H вдоль единичного вектора.

Обозначение

Градиент функции в точке обычно записывается как . Он также может быть обозначен любым из следующих способов:

Определение

Градиент функции f ( x , y ) = −(cos 2 x + cos 2 y ) 2 изображен в виде спроецированного векторного поля на нижнюю плоскость.

Градиент (или градиентное векторное поле) скалярной функции f ( x 1 , x 2 , x 3 , …, x n ) обозначается f или f , где ( nabla ) обозначает векторный дифференциальный оператор , del . Обозначение grad f также обычно используется для представления градиента. Градиент f определяется как уникальное векторное поле, скалярное произведение которого с любым вектором v в каждой точке x является производной f по направлению v . То есть,

где правая часть — производная по направлению , и есть много способов ее представления. Формально производная двойственна градиенту; см. связь с производной.

Когда функция также зависит от такого параметра, как время, градиент часто относится просто к вектору ее пространственных производных (см. Пространственный градиент ).

Величина и направление вектора градиента не зависят от конкретного представления координат . [4] [5]

Декартовы координаты

В трехмерной декартовой системе координат с евклидовой метрикой градиент, если он существует, задается выражением

где i , j , kстандартные единичные векторы в направлениях координат x , y и z соответственно. Например, градиент функции равен или

В некоторых приложениях градиент принято представлять как вектор-строку или вектор-столбец его компонентов в прямоугольной системе координат; в данной статье принято считать градиент вектором-столбцом, а производную — вектором-строкой.

Цилиндрические и сферические координаты

В цилиндрических координатах с евклидовой метрикой градиент определяется по формуле: [6]

где ρ — осевое расстояние, φ — азимутальный или азимутальный угол, z — осевая координата, а e ρ , e φ и e z — единичные векторы, направленные вдоль направлений координат.

В сферических координатах градиент определяется по формуле: [6]

где r — радиальное расстояние, φ — азимутальный угол, θ — полярный угол, а e r , e θ и e φ — снова локальные единичные векторы, указывающие в направлениях координат (то есть нормализованный ковариантный базис ).

Для получения информации о градиенте в других ортогональных системах координат см. Ортогональные координаты (Дифференциальные операторы в трех измерениях) .

Общие координаты

Мы рассматриваем общие координаты , которые мы записываем как x 1 , …, x i , …, x n , где n — число измерений домена. Здесь верхний индекс относится к позиции в списке координаты или компонента, поэтому x 2 относится ко второму компоненту, а не к величине x в квадрате. Индексная переменная i относится к произвольному элементу x i . Используя обозначения Эйнштейна , градиент можно записать как:

(Обратите внимание, что его двойственным является ),

где и относятся к ненормализованным локальным ковариантным и контравариантным базисам соответственно, — обратный метрический тензор , а соглашение Эйнштейна о суммировании подразумевает суммирование по i и j .

Если координаты ортогональны, мы можем легко выразить градиент (и дифференциал ) через нормализованные базы, которые мы обозначаем как и , используя масштабные множители (также известные как коэффициенты Ламе )  :

(и ),

где мы не можем использовать обозначение Эйнштейна, поскольку невозможно избежать повторения более двух индексов. Несмотря на использование верхних и нижних индексов, , , и не являются ни контравариантными, ни ковариантными.

Последнее выражение соответствует выражениям, приведенным выше для цилиндрических и сферических координат.

Связь с производным

Связь с полной производной

Градиент тесно связан с полной производной ( полным дифференциалом ) : они транспонированы ( дуальны ) друг к другу. Используя соглашение, что векторы в представлены векторами-столбцами , а ковекторы (линейные отображения ) представлены векторами-строками , [a] градиент и производная выражаются как вектор-столбец и вектор-строка, соответственно, с теми же компонентами, но транспонированными друг к другу:

Хотя оба они имеют одинаковые компоненты, они различаются по тому, какой тип математического объекта они представляют: в каждой точке производная является котангенсом вектора , линейной формой (или ковектором), которая выражает, насколько изменяется (скалярный) выход для заданного бесконечно малого изменения (векторного) входа, в то время как в каждой точке градиент является касательным вектором , который представляет бесконечно малое изменение (векторного) входа. В символах градиент является элементом касательного пространства в точке, , в то время как производная является отображением из касательного пространства в действительные числа, . Касательные пространства в каждой точке могут быть «естественно» отождествлены [e] с самим векторным пространством , и аналогично котангенс пространство в каждой точке может быть естественно отождествлено с дуальным векторным пространством ковекторов; таким образом, значение градиента в точке можно рассматривать как вектор в исходном , а не просто как касательный вектор.

С вычислительной точки зрения, если задан касательный вектор, то его можно умножить на производную (как матрицы), что равносильно взятию скалярного произведения с градиентом:

Дифференциал или (внешняя) производная

Наилучшим линейным приближением к дифференцируемой функции в точке в является линейное отображение из в которое часто обозначается или и называется дифференциалом или полной производной от в . Функция , которая отображается в , называется полным дифференциалом или внешней производной от и является примером дифференциальной 1-формы .

Подобно тому , как производная функции одной переменной представляет собой наклон касательной к графику функции [7], производная по направлению функции нескольких переменных представляет собой наклон касательной гиперплоскости в направлении вектора.

Градиент связан с дифференциалом формулой для любого , где — скалярное произведение : взятие скалярного произведения вектора на градиент равносильно взятию производной по направлению вдоль вектора.

Если рассматривается как пространство (размерность ) векторов-столбцов (действительных чисел), то можно рассматривать как вектор-строку с компонентами, так что задается умножением матриц . Предполагая стандартную евклидову метрику на , градиент тогда является соответствующим вектором-столбцом, то есть,

Линейное приближение функции

Наилучшее линейное приближение к функции можно выразить через градиент, а не через производную. Градиент функции из евклидова пространства в в любой конкретной точке в характеризует наилучшее линейное приближение к в . Приближение выглядит следующим образом:

для близко к , где — градиент , вычисленный при , а точка обозначает скалярное произведение на . Это уравнение эквивалентно первым двум членам в многомерном разложении ряда Тейлора для при .

Отношения с.mw-parser-output .vanchor>:target~.vanchor-text{background-color:#b1d2ff}@media screen{html.skin-theme-clientpref-night .mw-parser-output .vanchor>:target~.vanchor-text{background-color:#0f4dc9}}@media screen and (prefers-color-scheme:dark){html.skin-theme-clientpref-os .mw-parser-output .vanchor>:target~.vanchor-text{background-color:#0f4dc9}}производная Фреше

Пусть Uоткрытое множество в R n . Если функция f  : UR дифференцируема, то дифференциал fпроизводная Фреше функции f . Таким образом, f — функция из U в пространство R n такая, что · — скалярное произведение.

Вследствие этого обычные свойства производной сохраняются для градиента, хотя градиент сам по себе не является производной, а скорее двойственен ей:

Линейность
Градиент линеен в том смысле, что если f и g — две действительные функции, дифференцируемые в точке a ∈ Rn , а α и βдве константы , то αf + βg дифференцируема в точке a , и, более того,
Правило продукта
Если f и g — действительные функции, дифференцируемые в точке aRn , то правило произведения утверждает, что произведение fg дифференцируемо в точке a , и
Правило цепочки
Предположим, что f  : AR — вещественная функция, определенная на подмножестве A из R n , и что f дифференцируема в точке a . Существуют две формы правила цепочки, применяемого к градиенту. Во-первых, предположим, что функция g является параметрической кривой ; то есть функция g  : IR n отображает подмножество IR в R n . Если g дифференцируема в точке cI такой, что g ( c ) = a , то где ∘ — оператор композиции : ( f  ∘  g )( x ) = f ( g ( x )) .

В более общем случае, если вместо этого IR k , то выполняется следующее: где ( Dg ) T обозначает транспонированную матрицу Якоби .

Для второй формы цепного правила предположим, что h  : IR — вещественная функция на подмножестве I множества R и что h дифференцируема в точке f ( a ) ∈ I. Тогда

Дополнительные свойства и области применения

Уровни наборы

Поверхность уровня, или изоповерхность , — это множество всех точек, где некоторая функция имеет заданное значение.

Если f дифференцируема, то скалярное произведение (∇ f  ) xv градиента в точке x с вектором v дает производную по направлению f в точке x в направлении v . Отсюда следует, что в этом случае градиент f ортогонален множествам уровня f . Например, поверхность уровня в трехмерном пространстве определяется уравнением вида F ( x , y , z ) = c . Градиент F тогда нормален к поверхности.

В более общем случае любая вложенная гиперповерхность в римановом многообразии может быть вырезана уравнением вида F ( P ) = 0 таким образом, что dF нигде не равен нулю. Тогда градиент F нормален к гиперповерхности.

Аналогично, аффинная алгебраическая гиперповерхность может быть определена уравнением F ( x 1 , ..., x n ) = 0 , где F — многочлен. Градиент F равен нулю в особой точке гиперповерхности (это определение особой точки). В неособой точке это ненулевой нормальный вектор.

Консервативные векторные поля и теорема о градиенте

Градиент функции называется градиентным полем. (Непрерывное) градиентное поле всегда является консервативным векторным полем : его линейный интеграл вдоль любого пути зависит только от конечных точек пути и может быть оценен с помощью теоремы о градиенте (фундаментальной теоремы исчисления для линейных интегралов). И наоборот, (непрерывное) консервативное векторное поле всегда является градиентом функции.

Градиент — это направление самого крутого подъема.

Градиент функции в точке x также является направлением ее наискорейшего подъема, т.е. он максимизирует свою производную по направлению :

Пусть будет произвольным единичным вектором. С направленной производной, определенной как

мы получаем, заменив функцию ее рядом Тейлора ,

где обозначает члены более высокого порядка в .

Разделив на и взяв предел, получим член, ограниченный сверху неравенством Коши-Шварца [8]

Выбор максимизирует производную по направлению и равен верхней границе

Обобщения

якобианский

Матрица Якоби является обобщением градиента для векторнозначных функций нескольких переменных и дифференцируемых отображений между евклидовыми пространствами или, в более общем смысле, многообразиями . [9] [10] Дальнейшим обобщением для функции между банаховыми пространствами является производная Фреше .

Предположим, что f  : R nR m — функция, такая, что каждая из ее частных производных первого порядка существует на n . Тогда матрица Якоби функции f определяется как матрица m × n , обозначаемая как или просто . Элемент ( i , j ) — это . Явно

Градиент векторного поля

Поскольку полная производная векторного поля представляет собой линейное отображение векторов в векторы, то она является тензорной величиной.

В прямоугольных координатах градиент векторного поля f = (  f 1 , f 2 , f 3 ) определяется как:

(где используется обозначение суммирования Эйнштейна , а тензорное произведение векторов e i и e k является двоичным тензором типа (2,0)). В целом это выражение равно транспонированной матрице Якоби:

В криволинейных координатах или, в более общем смысле, на искривленном многообразии градиент включает символы Кристоффеля :

где g jk — компоненты обратного метрического тензора , а e i — базисные векторы координат.

Выражаясь более инвариантно, градиент векторного поля f можно определить с помощью связности Леви-Чивиты и метрического тензора: [11]

где c — связь.

Римановы многообразия

Для любой гладкой функции f на римановом многообразии ( M , g ) градиент f — это векторное поле f такое, что для любого векторного поля X , то есть, где g x (, ) обозначает скалярное произведение касательных векторов в точке x, определяемое метрикой g , а X f — это функция, которая переводит любую точку xM в производную f по направлению в точке X , вычисленную в точке x . Другими словами, в координатной карте φ из открытого подмножества M в открытое подмножество R n , (∂ X f  )( x ) задается как: где X j обозначает j - ю компоненту X в этой координатной карте.

Итак, локальная форма градиента принимает вид:

Обобщая случай M = R n , градиент функции связан с ее внешней производной, так как Точнее, градиент f является векторным полем, связанным с дифференциальной 1-формой df с использованием музыкального изоморфизма (называемого «диезом»), определяемого метрикой g . Соотношение между внешней производной и градиентом функции на R n является частным случаем этого, в котором метрика является плоской метрикой, заданной скалярным произведением.

Смотрите также

Примечания

  1. ^ ab В этой статье используется соглашение, согласно которому векторы-столбцы представляют векторы, а векторы-строки представляют ковекторы, однако распространено и противоположное соглашение.
  2. ^ Строго говоря, градиент — это векторное поле , а значение градиента в точке — это касательный вектор в касательном пространстве в этой точке, а не вектор в исходном пространстве . Однако все касательные пространства можно естественным образом отождествить с исходным пространством , поэтому их не нужно различать; см. § Определение и связь с производной.
  3. ^ Значение градиента в точке можно рассматривать как вектор в исходном пространстве , тогда как значение производной в точке можно рассматривать как ковектор в исходном пространстве: линейное отображение .
  4. ^ скалярное произведение (уклон дороги вокруг холма) будет равно 40%, если угол между дорогой и самым крутым склоном равен 0°, т. е. когда они полностью выровнены, и ровное, если угол равен 90°, т. е. когда дорога перпендикулярна самому крутому склону.
  5. ^ Неформально, "естественно" идентифицировано означает, что это может быть сделано без каких-либо произвольных выборов. Это может быть формализовано с помощью естественного преобразования .

Ссылки

  1. ^
    • Бахман (2007, стр. 77)
    • Даунинг (2010, стр. 316–317)
    • Крейциг (1972, стр. 309)
    • Макгроу-Хилл (2007, стр. 196)
    • Моисей (1967, стр. 684)
    • Проттер и Морри (1970, стр. 715)
    • Своковски и др. (1994, стр. 1036, 1038–1039)
  2. ^
    • Бахман (2007, стр. 76)
    • Борегар и Фрели (1973, стр. 84)
    • Даунинг (2010, стр. 316)
    • Харпер (1976, стр. 15)
    • Крейциг (1972, стр. 307)
    • Макгроу-Хилл (2007, стр. 196)
    • Моисей (1967, стр. 683)
    • Проттер и Морри (1970, стр. 714)
    • Своковски и др. (1994, стр. 1038)
  3. ^ "Недифференцируемые функции должны иметь разрывные частные производные - Math Insight". mathinsight.org . Получено 21.10.2023 .
  4. ^ Крейциг (1972, стр. 308–309)
  5. ^ Стокер (1969, стр. 292)
  6. ^ ab Schey 1992, стр. 139–142.
  7. ^ Проттер и Морри (1970, стр. 21, 88)
  8. ^ Т. Аренс (2022). Математика (5-е изд.). Шпрингер Спектрум Берлин. дои : 10.1007/978-3-662-64389-1. ISBN 978-3-662-64388-4.
  9. ^ Борегар и Фрели (1973, стр. 87, 248)
  10. ^ Крейциг (1972, стр. 333, 353, 496)
  11. ^ Дубровин, Фоменко и Новиков 1991, стр. 348–349.

[1]

Дальнейшее чтение

Внешние ссылки

  1. ^ «Векторное исчисление: понимание градиента – BetterExplained». betterexplained.com . Получено 22.08.2024 .