stringtranslate.com

Градиент

Градиент, представленный синими стрелками, обозначает направление наибольшего изменения скалярной функции. Значения функции представлены в оттенках серого и увеличиваются в диапазоне от белого (низкий) до темного (высокий).

В векторном исчислении градиент скалярной дифференцируемой функции нескольких переменных представляет собой векторное поле (или векторную функцию ), значение которого в точке определяет направление и скорость наибольшего увеличения. Градиент преобразуется как вектор при изменении базиса пространства переменных . Если градиент функции отличен от нуля в точке , направление градиента — это направление, в котором функция увеличивается быстрее всего от , а величина градиента — это скорость увеличения в этом направлении, наибольшая абсолютная направленность. производная. [1] Кроме того, точка, где градиент равен нулевому вектору, называется стационарной точкой . Таким образом, градиент играет фундаментальную роль в теории оптимизации , где он используется для максимизации функции путем градиентного восхождения . В бескоординатных терминах градиент функции может быть определен как:

где - общее бесконечно малое изменение для бесконечно малого смещения , и считается максимальным, когда оно направлено в направлении градиента . Символ набла , написанный в виде перевернутого треугольника и произносимый как «дел», обозначает векторный дифференциальный оператор .

Когда используется система координат, в которой базисные векторы не являются функциями положения, градиент задается вектором [ a] , компоненты которого являются частными производными at . [2] То есть для его градиент определяется в точке n -мерного пространства как вектор [b]

Обратите внимание, что приведенное выше определение градиента определено только для функции , если она дифференцируема в точке . Могут существовать функции, у которых частные производные существуют во всех направлениях, но не дифференцируемы.

Например, функция, если только она не находится в начале координат, где , не является дифференцируемой в начале координат, поскольку она не имеет четко определенной касательной плоскости, несмотря на наличие четко определенных частных производных в каждом направлении в начале координат. [3] В этом конкретном примере при вращении системы координат xy приведенная выше формула для градиента не может трансформироваться как вектор (градиент становится зависимым от выбора основы для системы координат), а также не может указывать на «самый крутой подъем» в некоторые ориентации. Можно показать, что для дифференцируемых функций, для которых справедлива формула градиента, она всегда преобразуется как вектор при преобразовании базиса, чтобы всегда указывать на наиболее быстрое увеличение.

Градиент двойственен полной производной : значение градиента в точке представляет собой касательный вектор – вектор в каждой точке; а значение производной в точке представляет собой кокасательный вектор – линейный функционал от векторов. [c] Они связаны тем, что скалярное произведение градиента в точке с другим касательным вектором равно производной по направлению от функции вдоль ; то есть, . Градиент допускает множественные обобщения на более общие функции на многообразиях ; см. § Обобщения.

Мотивация

Градиент двумерной функции f ( x , y ) = xe − ( x 2 + y 2 ) отображается стрелками на псевдоцветном графике функции.

Рассмотрим комнату, где температура задается скалярным полем T , поэтому в каждой точке ( x , y , z ) температура равна T ( x , y , z ) , независимо от времени. В каждой точке комнаты градиент T в этой точке будет показывать направление, в котором температура повышается быстрее всего, удаляясь от ( x , y , z ) . Величина градиента будет определять, насколько быстро температура повысится в этом направлении.

Рассмотрим поверхность, высота которой над уровнем моря в точке ( x , y ) равна H ( x , y ) . Градиент H в точке представляет собой плоский вектор, указывающий в направлении самого крутого склона или уклона в этой точке. Крутизна склона в этой точке определяется величиной вектора градиента.

Градиент также можно использовать для измерения того, как скалярное поле изменяется в других направлениях, а не только в направлении наибольшего изменения, путем взятия скалярного произведения . Предположим, что самый крутой уклон холма составляет 40%. Дорога, идущая прямо в гору, имеет уклон 40%, но дорога, огибающая холм под углом, будет иметь более пологий уклон. Например, если дорога расположена под углом 60° к направлению подъема (когда оба направления проецируются на горизонтальную плоскость), то уклон вдоль дороги будет скалярным произведением вектора градиента и единичного вектора вдоль дороги. , поскольку скалярное произведение измеряет, насколько единичный вектор вдоль дороги совпадает с самым крутым уклоном [d] , который в 40% умножен на косинус 60°, или 20%.

В более общем смысле, если функция высоты холма H является дифференцируемой , то градиент H , отмеченный единичным вектором , дает наклон холма в направлении вектора, производную по направлению от H вдоль единичного вектора.

Обозначения

Градиент функции в точке обычно записывается как . Он также может обозначаться любым из следующих символов:


Определение

Градиент функции f ( x , y ) = −(cos 2 x + cos 2 y ) 2 изображен как спроецированное векторное поле на нижнюю плоскость.

Градиент (или векторное поле градиента) скалярной функции f ( x 1 , x 2 , x 3 , …, x n ) обозначается f или f , где ( nabla ) обозначает векторный дифференциальный оператор del . Обозначение grad f также часто используется для обозначения градиента. Градиент f определяется как уникальное векторное поле, скалярное произведение которого с любым вектором v в каждой точке x является производной f по направлению вдоль v . То есть,

где правая часть — это производная по направлению , и существует много способов ее представления. Формально производная двойственна градиенту ; см. связь с производной.

Когда функция также зависит от такого параметра, как время, градиент часто относится просто к вектору только ее пространственных производных (см. Пространственный градиент ).

Величина и направление вектора градиента не зависят от конкретного представления координат . [4] [5]

Декартовы координаты

В трехмерной декартовой системе координат с евклидовой метрикой градиент, если он существует, определяется выражением

где i , j , kстандартные единичные векторы в направлениях координат x , y и z соответственно. Например, градиент функции

В некоторых приложениях градиент принято представлять как вектор-строку или вектор-столбец его компонентов в прямоугольной системе координат; эта статья следует соглашению, согласно которому градиент является вектором-столбцом, а производная — вектором-строкой.

Цилиндрические и сферические координаты

В цилиндрических координатах с евклидовой метрикой градиент определяется по формуле: [6]

где ρ — осевое расстояние, φ — азимут или азимутальный угол, z — осевая координата, а e ρ , e φ и e z — единичные векторы, указывающие вдоль координатных направлений.

В сферических координатах градиент определяется по формуле: [6]

где r — радиальное расстояние, φ — азимутальный угол, а θ — полярный угол, а er , e θ и e φ это снова локальные единичные векторы, указывающие в координатных направлениях (то есть нормированный ковариантный базис ).

Информацию о градиенте в других ортогональных системах координат см. в разделе Ортогональные координаты (Дифференциальные операторы в трех измерениях) .

Общие координаты

Рассмотрим общие координаты , которые запишем как x 1 , …, x i , …, x n , где n — количество измерений области. Здесь верхний индекс относится к положению координаты или компонента в списке, поэтому x 2 относится ко второму компоненту, а не к величине x в квадрате. Индексная переменная i относится к произвольному элементу x i . Используя обозначения Эйнштейна , градиент можно записать как:

двойственно

где и относятся к ненормализованным локальным ковариантным и контравариантным базам соответственно, — обратный метрический тензор , а соглашение Эйнштейна о суммировании подразумевает суммирование по i и j .

Если координаты ортогональны, мы можем легко выразить градиент (и дифференциал ) через нормализованные основы, которые мы называем и , используя масштабные коэффициенты (также известные как коэффициенты Ламе )  :

где мы не можем использовать обозначения Эйнштейна, так как невозможно избежать повторения более двух индексов. Несмотря на использование верхних и нижних индексов, , и не являются ни контравариантными, ни ковариантными.

Последнее выражение соответствует приведенным выше выражениям для цилиндрических и сферических координат.

Связь с производной

Связь с полной производной

Градиент тесно связан с полной производной ( полным дифференциалом ) : они транспонированы ( двойственны ) друг другу. Используя соглашение, согласно которому векторы в представлены векторами-столбцами , а ковекторы (линейные карты ) представлены векторами-строками , [a] градиент и производная выражаются как вектор-столбец и вектор-строка соответственно с одинаковыми компонентами, но транспонировать друг друга:

Хотя они оба имеют одинаковые компоненты, они различаются тем, какой математический объект они представляют: в каждой точке производная представляет собой котангенс -вектор , линейную форму ( ковектор ), которая выражает, насколько (скалярный) выходной сигнал изменяется для заданной бесконечно малой величины. изменение входного (векторного) сигнала, тогда как в каждой точке градиент представляет собой касательный вектор , который представляет бесконечно малое изменение входного (векторного) сигнала. В символах градиент — это элемент касательного пространства в точке, а производная — это отображение касательного пространства в действительные числа . Касательные пространства в каждой точке могут быть «естественно» отождествлены [e] с самим векторным пространством , и аналогичным образом кокасательное пространство в каждой точке может быть естественным образом отождествлено с двойственным векторным пространством ковекторов; таким образом, значение градиента в точке можно рассматривать как вектор в оригинале , а не просто как касательный вектор.

В вычислительном отношении, учитывая касательный вектор, вектор можно умножить на производную (в виде матрицы), что равно скалярному произведению с градиентом:

Дифференциал или (внешняя) производная

Наилучшее линейное приближение дифференцируемой функции

дифференциаломполной производнойполным дифференциаломвнешней производной1-формы

Подобно тому, как производная функции одной переменной представляет собой наклон касательной к графику функции , [ 7] производная по направлению функции нескольких переменных представляет собой наклон касательной гиперплоскости в направлении вектора.

Градиент связан с дифференциалом формулой

произведение

Если рассматривать его как пространство векторов-столбцов (размерности) (действительных чисел), то его можно рассматривать как вектор-строку с компонентами

умножением матриц

Линейное приближение функции

Наилучшее линейное приближение функции можно выразить через градиент, а не через производную. Градиент функции из евклидова пространства в любую конкретную точку характеризует наилучшее линейное приближение к at . Приближение следующее:

для близких к , где – градиент, вычисленный при , а точка обозначает скалярное произведение на . Это уравнение эквивалентно первым двум слагаемым в разложении в ряд Тейлора при .

В отношениях с.mw-parser-output .vanchor>:target~.vanchor-text{background-color:#b1d2ff}Производная Фреше

Пусть U — открытое множество в Rn . Если функция f  : UR дифференцируема, то дифференциал f является производной Фреше от f . Таким образом, f функция из U в пространство Rn такая, что

Как следствие, для градиента сохраняются обычные свойства производной, хотя градиент сам по себе не является производной, а скорее двойственен производной:

Линейность
Градиент является линейным в том смысле, что если f и g — две действительные функции, дифференцируемые в точке a Rn , а α и β — две константы, то αf + βg дифференцируема в точке a , и, более того,
Правило продукта
Если f и g — вещественные функции, дифференцируемые в точке aRn , то правило произведения утверждает, что произведение fg дифференцируемо в точке a , и
Правило цепи
Предположим, что f  : AR — вещественная функция, определенная на подмножестве A множества Rn , и что f дифференцируема в точке a . К градиенту применяются две формы цепного правила. Предположим сначала, что функция g является параметрической кривой ; то есть функция g  : IRn отображает подмножество I R в Rn . Если g дифференцируема в точке cI такой, что g ( c ) = a , то
где ∘ - оператор композиции : ( ж  ∘  г )( Икс ) знак равно ж ( г ( Икс )) .

В более общем смысле, если вместо этого I Rk , то имеет место следующее:

( Dg ) Tматрицу Якобиана

Для второй формы цепного правила предположим, что h  : IR — вещественнозначная функция на подмножестве I из R и что h дифференцируема в точке f ( a ) ∈ I. Затем

Другие свойства и применение

Наборы уровней

Поверхность уровня, или изоповерхность , — это набор всех точек, в которых некоторая функция имеет заданное значение.

Если f дифференцируемо, то скалярное произведение (∇ f  ) xv градиента в точке x с вектором v дает производную по направлению от f в точке x в направлении v . Отсюда следует , что в этом случае градиент f ортогонален множествам уровня f . Например, поверхность уровня в трехмерном пространстве определяется уравнением вида F ( x , y , z ) = c . Тогда градиент F будет нормален к поверхности.

В более общем смысле, любая вложенная гиперповерхность в римановом многообразии может быть вырезана уравнением вида F ( P ) = 0 таким, что dF нигде не равен нулю. Тогда градиент F нормален к гиперповерхности.

Аналогично, аффинная алгебраическая гиперповерхность может быть определена уравнением F ( x 1 , ..., x n ) = 0 , где F — многочлен. Градиент F равен нулю в особой точке гиперповерхности (это определение особой точки). В неособой точке это ненулевой нормальный вектор.

Консервативные векторные поля и градиентная теорема

Градиент функции называется полем градиента. (Непрерывное) поле градиента всегда является консервативным векторным полем : его линейный интеграл вдоль любого пути зависит только от конечных точек пути и может быть оценен с помощью градиентной теоремы (фундаментальной теоремы исчисления для линейных интегралов). И наоборот, (непрерывное) консервативное векторное поле всегда является градиентом функции.

Обобщения

якобиан

Матрица Якоби является обобщением градиента для вектор-функций нескольких переменных и дифференцируемых отображений между евклидовыми пространствами или, в более общем плане, многообразиями . [8] [9] Дальнейшим обобщением функции между банаховыми пространствами является производная Фреше .

Предположим , f  : R nR m — такая функция, что каждая из ее частных производных первого порядка существует на n . Тогда матрица Якоби функции f определяется как матрица размера m × n , обозначаемая или просто . ( i , j ) -я запись . Явно

Градиент векторного поля

Поскольку полная производная векторного поля представляет собой линейное отображение векторов в векторы, она является тензорной величиной.

В прямоугольных координатах градиент векторного поля f = (  f 1 , f 2 , f 3 ) определяется следующим образом:

(где используются обозначения суммирования Эйнштейна и тензорное произведение векторов ei и ek является двоичным тензором типа (2,0) ) . В целом это выражение эквивалентно транспонированию матрицы Якобиана:

В криволинейных координатах или, в более общем смысле, на искривленном многообразии , градиент включает в себя символы Кристоффеля :

где g jk — компоненты обратного метрического тензора , а e i — координатные базисные векторы.

Выражаясь более инвариантно, градиент векторного поля f может быть определен связностью Леви-Чивита и метрическим тензором: [10]

где c — связь.

Римановы многообразия

Для любой гладкой функции f на римановом многообразии ( M , g ) градиент f — это векторное поле f такое, что для любого векторного поля X

g x (, )скалярное произведениеxg,X fxMfXxкоординатной карте φMR nX f  )( x )
X jj-X

Итак, локальная форма градиента принимает вид:

Обобщая случай M = Rn , градиент функции связан с ее внешней производной, поскольку

fdfмузыкального изоморфизма
gR n

Смотрите также

Примечания

  1. ^ ab В этой статье используется соглашение, согласно которому векторы-столбцы представляют векторы, а векторы-строки представляют ковекторы, но также распространено и противоположное соглашение.
  2. ^ Строго говоря, градиент — это векторное поле , а значение градиента в точке — это касательный вектор в касательном пространстве в этой точке, а не вектор в исходном пространстве . Однако все касательные пространства естественным образом отождествляются с исходным пространством , поэтому их не нужно различать; см. § Определение и связь с производной.
  3. ^ Значение градиента в точке можно рассматривать как вектор в исходном пространстве , а значение производной в точке можно рассматривать как ковектор в исходном пространстве: линейную карту .
  4. ^ скалярное произведение (наклон дороги вокруг холма) будет 40%, если угол между дорогой и самым крутым склоном равен 0 °, т. е. когда они полностью выровнены, и плоским, когда угол равен 90 °, т. е. когда дорога перпендикулярна самому крутому склону.
  5. ^ Неофициально «естественное» определение означает, что это можно сделать, не делая произвольного выбора. Это можно формализовать естественным преобразованием .

Рекомендации

  1. ^
    • Бахман (2007, стр. 77)
    • Даунинг (2010, стр. 316–317).
    • Крейциг (1972, стр. 309)
    • МакГроу-Хилл (2007, стр. 196)
    • Мойзе (1967, стр. 684)
    • Проттер и Морри (1970, стр. 715)
    • Своковский и др. (1994, стр. 1036, 1038–1039)
  2. ^
    • Бахман (2007, стр. 76)
    • Борегар и Фрели (1973, стр. 84)
    • Даунинг (2010, стр. 316)
    • Харпер (1976, стр. 15)
    • Крейциг (1972, стр. 307)
    • МакГроу-Хилл (2007, стр. 196)
    • Мойзе (1967, стр. 683)
    • Проттер и Морри (1970, стр. 714)
    • Своковский и др. (1994, стр. 1038)
  3. ^ «Недифференцируемые функции должны иметь разрывные частные производные - Math Insight». mathinsight.org . Проверено 21 октября 2023 г.
  4. ^ Крейциг (1972, стр. 308–309)
  5. ^ Стокер (1969, стр. 292)
  6. ^ ab Schey 1992, стр. 139–142.
  7. ^ Проттер и Морри (1970, стр. 21, 88)
  8. ^ Борегар и Фрели (1973, стр. 87, 248)
  9. ^ Крейциг (1972, стр. 333, 353, 496)
  10. ^ Дубровин, Фоменко и Новиков 1991, стр. 348–349.

дальнейшее чтение

Внешние ссылки