В векторном исчислении градиент скалярной дифференцируемой функции нескольких переменных представляет собой векторное поле (или векторную функцию ), значение которого в точке определяет направление и скорость наибольшего увеличения. Градиент преобразуется как вектор при изменении базиса пространства переменных . Если градиент функции отличен от нуля в точке , направление градиента — это направление, в котором функция увеличивается быстрее всего от , а величина градиента — это скорость увеличения в этом направлении, наибольшая абсолютная направленность. производная. [1] Кроме того, точка, где градиент равен нулевому вектору, называется стационарной точкой . Таким образом, градиент играет фундаментальную роль в теории оптимизации , где он используется для максимизации функции путем градиентного восхождения . В бескоординатных терминах градиент функции может быть определен как:
где - общее бесконечно малое изменение для бесконечно малого смещения , и считается максимальным, когда оно направлено в направлении градиента . Символ набла , написанный в виде перевернутого треугольника и произносимый как «дел», обозначает векторный дифференциальный оператор .
Когда используется система координат, в которой базисные векторы не являются функциями положения, градиент задается вектором [ a] , компоненты которого являются частными производными at . [2] То есть для его градиент определяется в точке n -мерного пространства как вектор [b]
Обратите внимание, что приведенное выше определение градиента определено только для функции , если она дифференцируема в точке . Могут существовать функции, у которых частные производные существуют во всех направлениях, но не дифференцируемы.
Например, функция, если только она не находится в начале координат, где , не является дифференцируемой в начале координат, поскольку она не имеет четко определенной касательной плоскости, несмотря на наличие четко определенных частных производных в каждом направлении в начале координат. [3] В этом конкретном примере при вращении системы координат xy приведенная выше формула для градиента не может трансформироваться как вектор (градиент становится зависимым от выбора основы для системы координат), а также не может указывать на «самый крутой подъем» в некоторые ориентации. Можно показать, что для дифференцируемых функций, для которых справедлива формула градиента, она всегда преобразуется как вектор при преобразовании базиса, чтобы всегда указывать на наиболее быстрое увеличение.
Градиент двойственен полной производной : значение градиента в точке представляет собой касательный вектор – вектор в каждой точке; а значение производной в точке представляет собой кокасательный вектор – линейный функционал от векторов. [c] Они связаны тем, что скалярное произведение градиента в точке с другим касательным вектором равно производной по направлению от функции вдоль ; то есть, . Градиент допускает множественные обобщения на более общие функции на многообразиях ; см. § Обобщения.
Мотивация
Рассмотрим комнату, где температура задается скалярным полем T , поэтому в каждой точке ( x , y , z ) температура равна T ( x , y , z ) , независимо от времени. В каждой точке комнаты градиент T в этой точке будет показывать направление, в котором температура повышается быстрее всего, удаляясь от ( x , y , z ) . Величина градиента будет определять, насколько быстро температура повысится в этом направлении.
Рассмотрим поверхность, высота которой над уровнем моря в точке ( x , y ) равна H ( x , y ) . Градиент H в точке представляет собой плоский вектор, указывающий в направлении самого крутого склона или уклона в этой точке. Крутизна склона в этой точке определяется величиной вектора градиента.
Градиент также можно использовать для измерения того, как скалярное поле изменяется в других направлениях, а не только в направлении наибольшего изменения, путем взятия скалярного произведения . Предположим, что самый крутой уклон холма составляет 40%. Дорога, идущая прямо в гору, имеет уклон 40%, но дорога, огибающая холм под углом, будет иметь более пологий уклон. Например, если дорога расположена под углом 60° к направлению подъема (когда оба направления проецируются на горизонтальную плоскость), то уклон вдоль дороги будет скалярным произведением вектора градиента и единичного вектора вдоль дороги. , поскольку скалярное произведение измеряет, насколько единичный вектор вдоль дороги совпадает с самым крутым уклоном [d] , который в 40% умножен на косинус 60°, или 20%.
Градиент (или векторное поле градиента) скалярной функции f ( x 1 , x 2 , x 3 , …, x n ) обозначается ∇ f или ∇ → f , где ∇ ( nabla ) обозначает векторный дифференциальный оператор del . Обозначение grad f также часто используется для обозначения градиента. Градиент f определяется как уникальное векторное поле, скалярное произведение которого с любым вектором v в каждой точке x является производной f по направлению вдоль v . То есть,
где правая часть — это производная по направлению , и существует много способов ее представления. Формально производная двойственна градиенту ; см. связь с производной.
Когда функция также зависит от такого параметра, как время, градиент часто относится просто к вектору только ее пространственных производных (см. Пространственный градиент ).
где i , j , k — стандартные единичные векторы в направлениях координат x , y и z соответственно. Например, градиент функции
В некоторых приложениях градиент принято представлять как вектор-строку или вектор-столбец его компонентов в прямоугольной системе координат; эта статья следует соглашению, согласно которому градиент является вектором-столбцом, а производная — вектором-строкой.
где ρ — осевое расстояние, φ — азимут или азимутальный угол, z — осевая координата, а e ρ , e φ и e z — единичные векторы, указывающие вдоль координатных направлений.
где r — радиальное расстояние, φ — азимутальный угол, а θ — полярный угол, а er , e θ и e φ — это снова локальные единичные векторы, указывающие в координатных направлениях (то есть нормированный ковариантный базис ).
Рассмотрим общие координаты , которые запишем как x 1 , …, x i , …, x n , где n — количество измерений области. Здесь верхний индекс относится к положению координаты или компонента в списке, поэтому x 2 относится ко второму компоненту, а не к величине x в квадрате. Индексная переменная i относится к произвольному элементу x i . Используя обозначения Эйнштейна , градиент можно записать как:
Если координаты ортогональны, мы можем легко выразить градиент (и дифференциал ) через нормализованные основы, которые мы называем и , используя масштабные коэффициенты (также известные как коэффициенты Ламе ) :
где мы не можем использовать обозначения Эйнштейна, так как невозможно избежать повторения более двух индексов. Несмотря на использование верхних и нижних индексов, , и не являются ни контравариантными, ни ковариантными.
Последнее выражение соответствует приведенным выше выражениям для цилиндрических и сферических координат.
Связь с производной
Связь с полной производной
Градиент тесно связан с полной производной ( полным дифференциалом ) : они транспонированы ( двойственны ) друг другу. Используя соглашение, согласно которому векторы в представлены векторами-столбцами , а ковекторы (линейные карты ) представлены векторами-строками , [a] градиент и производная выражаются как вектор-столбец и вектор-строка соответственно с одинаковыми компонентами, но транспонировать друг друга:
Хотя они оба имеют одинаковые компоненты, они различаются тем, какой математический объект они представляют: в каждой точке производная представляет собой котангенс -вектор , линейную форму ( ковектор ), которая выражает, насколько (скалярный) выходной сигнал изменяется для заданной бесконечно малой величины. изменение входного (векторного) сигнала, тогда как в каждой точке градиент представляет собой касательный вектор , который представляет бесконечно малое изменение входного (векторного) сигнала. В символах градиент — это элемент касательного пространства в точке, а производная — это отображение касательного пространства в действительные числа . Касательные пространства в каждой точке могут быть «естественно» отождествлены [e] с самим векторным пространством , и аналогичным образом кокасательное пространство в каждой точке может быть естественным образом отождествлено с двойственным векторным пространством ковекторов; таким образом, значение градиента в точке можно рассматривать как вектор в оригинале , а не просто как касательный вектор.
В вычислительном отношении, учитывая касательный вектор, вектор можно умножить на производную (в виде матрицы), что равно скалярному произведению с градиентом:
Дифференциал или (внешняя) производная
Наилучшее линейное приближение дифференцируемой функции
Подобно тому, как производная функции одной переменной представляет собой наклон касательной к графику функции , [ 7] производная по направлению функции нескольких переменных представляет собой наклон касательной гиперплоскости в направлении вектора.
Если рассматривать его как пространство векторов-столбцов (размерности) (действительных чисел), то его можно рассматривать как вектор-строку с компонентами
Наилучшее линейное приближение функции можно выразить через градиент, а не через производную. Градиент функции из евклидова пространства в любую конкретную точку характеризует наилучшее линейное приближение к at . Приближение следующее:
для близких к , где – градиент, вычисленный при , а точка обозначает скалярное произведение на . Это уравнение эквивалентно первым двум слагаемым в разложении в ряд Тейлора при .
В отношениях с.mw-parser-output .vanchor>:target~.vanchor-text{background-color:#b1d2ff}Производная Фреше
Пусть U — открытое множество в Rn . Если функция f : U → R дифференцируема, то дифференциал f является производной Фреше от f . Таким образом, ∇ f — функция из U в пространство Rn такая, что
Как следствие, для градиента сохраняются обычные свойства производной, хотя градиент сам по себе не является производной, а скорее двойственен производной:
Градиент является линейным в том смысле, что если f и g — две действительные функции, дифференцируемые в точке a ∈ Rn , а α и β — две константы, то αf + βg дифференцируема в точке a , и, более того,
Если f и g — вещественные функции, дифференцируемые в точке a ∈ Rn , то правило произведения утверждает, что произведение fg дифференцируемо в точке a , и
Предположим, что f : A → R — вещественная функция, определенная на подмножестве A множества Rn , и что f дифференцируема в точке a . К градиенту применяются две формы цепного правила. Предположим сначала, что функция g является параметрической кривой ; то есть функция g : I → Rn отображает подмножество I ⊂ R в Rn . Если g дифференцируема в точке c ∈ I такой, что g ( c ) = a , то
Для второй формы цепного правила предположим, что h : I → R — вещественнозначная функция на подмножестве I из R и что h дифференцируема в точке f ( a ) ∈ I. Затем
Другие свойства и применение
Наборы уровней
Поверхность уровня, или изоповерхность , — это набор всех точек, в которых некоторая функция имеет заданное значение.
Если f дифференцируемо, то скалярное произведение (∇ f ) x ⋅ v градиента в точке x с вектором v дает производную по направлению от f в точке x в направлении v . Отсюда следует , что в этом случае градиент f ортогонален множествам уровня f . Например, поверхность уровня в трехмерном пространстве определяется уравнением вида F ( x , y , z ) = c . Тогда градиент F будет нормален к поверхности.
В более общем смысле, любая вложенная гиперповерхность в римановом многообразии может быть вырезана уравнением вида F ( P ) = 0 таким, что dF нигде не равен нулю. Тогда градиент F нормален к гиперповерхности.
Аналогично, аффинная алгебраическая гиперповерхность может быть определена уравнением F ( x 1 , ..., x n ) = 0 , где F — многочлен. Градиент F равен нулю в особой точке гиперповерхности (это определение особой точки). В неособой точке это ненулевой нормальный вектор.
Консервативные векторные поля и градиентная теорема
Градиент функции называется полем градиента. (Непрерывное) поле градиента всегда является консервативным векторным полем : его линейный интеграл вдоль любого пути зависит только от конечных точек пути и может быть оценен с помощью градиентной теоремы (фундаментальной теоремы исчисления для линейных интегралов). И наоборот, (непрерывное) консервативное векторное поле всегда является градиентом функции.
Предположим , f : R n → R m — такая функция, что каждая из ее частных производных первого порядка существует на ℝ n . Тогда матрица Якоби функции f определяется как матрица размера m × n , обозначаемая или просто . ( i , j ) -я запись . Явно
^ ab В этой статье используется соглашение, согласно которому векторы-столбцы представляют векторы, а векторы-строки представляют ковекторы, но также распространено и противоположное соглашение.
^ Строго говоря, градиент — это векторное поле , а значение градиента в точке — это касательный вектор в касательном пространстве в этой точке, а не вектор в исходном пространстве . Однако все касательные пространства естественным образом отождествляются с исходным пространством , поэтому их не нужно различать; см. § Определение и связь с производной.
^ Значение градиента в точке можно рассматривать как вектор в исходном пространстве , а значение производной в точке можно рассматривать как ковектор в исходном пространстве: линейную карту .
^ скалярное произведение (наклон дороги вокруг холма) будет 40%, если угол между дорогой и самым крутым склоном равен 0 °, т. е. когда они полностью выровнены, и плоским, когда угол равен 90 °, т. е. когда дорога перпендикулярна самому крутому склону.
^ Неофициально «естественное» определение означает, что это можно сделать, не делая произвольного выбора. Это можно формализовать естественным преобразованием .
Рекомендации
^
Бахман (2007, стр. 77)
Даунинг (2010, стр. 316–317).
Крейциг (1972, стр. 309)
МакГроу-Хилл (2007, стр. 196)
Мойзе (1967, стр. 684)
Проттер и Морри (1970, стр. 715)
Своковский и др. (1994, стр. 1036, 1038–1039)
^
Бахман (2007, стр. 76)
Борегар и Фрели (1973, стр. 84)
Даунинг (2010, стр. 316)
Харпер (1976, стр. 15)
Крейциг (1972, стр. 307)
МакГроу-Хилл (2007, стр. 196)
Мойзе (1967, стр. 683)
Проттер и Морри (1970, стр. 714)
Своковский и др. (1994, стр. 1038)
^ «Недифференцируемые функции должны иметь разрывные частные производные - Math Insight». mathinsight.org . Проверено 21 октября 2023 г.
Борегар, Раймонд А.; Фрэли, Джон Б. (1973), Первый курс линейной алгебры: с дополнительным введением в группы, кольца и поля , Бостон: Houghton Mifflin Company , ISBN 0-395-14017-Х
Даунинг, Дуглас, доктор философии. (2010), EZ Calculus Бэррона , Нью-Йорк: Barron's , ISBN 978-0-7641-4461-5{{citation}}: CS1 maint: multiple names: authors list (link)
Дубровин, Б.А.; Фоменко А.Т.; Новиков, СП (1991). Современная геометрия — методы и приложения: Часть I: Геометрия поверхностей, группы преобразований и поля . Тексты для аспирантов по математике (2-е изд.). Спрингер. ISBN 978-0-387-97663-1.
Харпер, Чарли (1976), Введение в математическую физику , Нью-Джерси: Прентис-Холл , ISBN 0-13-487538-9
«Энциклопедия науки и технологий Макгроу Хилла». Энциклопедия науки и технологий McGraw-Hill (10-е изд.). Нью-Йорк: МакГроу-Хилл . 2007. ISBN 978-0-07-144143-8.
Мойс, Эдвин Э. (1967), Исчисление: полное , Чтение: Аддисон-Уэсли
Проттер, Мюррей Х.; Морри, Чарльз Б. младший (1970), Колледжское исчисление с аналитической геометрией (2-е изд.), Чтение: Аддисон-Уэсли , LCCN 76087042
Шей, Х.М. (1992). Див, Град, Керл и все такое (2-е изд.). WW Нортон. ISBN 0-393-96251-2. ОСЛК 25048561.
Стокер, Дж. Дж. (1969), Дифференциальная геометрия , Нью-Йорк: Wiley , ISBN 0-471-82825-4
Своковски, Эрл В.; Олиник, Майкл; Пенс, Деннис; Коул, Джеффри А. (1994), Исчисление (6-е изд.), Бостон: Издательская компания PWS, ISBN 0-534-93624-5
дальнейшее чтение
Корн, Тереза М .; Корн, Гранино Артур (2000). Математический справочник для ученых и инженеров: определения, теоремы и формулы для справки и обзора . Дуврские публикации. стр. 157–160. ISBN 0-486-41147-8. ОСЛК 43864234.
Внешние ссылки
Найдите градиент в Викисловаре, бесплатном словаре.