В математике критическая точка — это аргумент функции , где производная функции равна нулю (или не определена, как указано ниже). Значение функции в критической точке — этокритическое значение .[1]
Более конкретно, при работе с функциями действительной переменной критическая точка, также известная как стационарная точка , — это точка в области определения функции, где производная функции равна нулю (или где функция не дифференцируема ). [2] Аналогично, при работе с комплексными переменными критическая точка — это точка в области определения функции, где ее производная равна нулю (или функция не является голоморфной ). [3] [4] Аналогично, для функции нескольких действительных переменных критическая точка — это значение в ее области определения, где норма градиента равна нулю (или не определена). [5]
Этот вид определения распространяется на дифференцируемые отображения между и критической точкой , являющейся в этом случае точкой, где ранг матрицы Якоби не максимален. Он распространяется далее на дифференцируемые отображения между дифференцируемыми многообразиями , как на точки, где ранг матрицы Якоби уменьшается. В этом случае критические точки также называются точками бифуркации . В частности, если C — плоская кривая , определяемая неявным уравнением f ( x , y ) = 0 , критические точки проекции на ось x , параллельную оси y , — это точки, где касательная к C параллельна оси y , то есть точки, где . Другими словами, критические точки — это те, где теорема о неявной функции неприменима.
Критическая точка функции одной действительной переменной f ( x ) — это значение x 0 в области определения f , где f не дифференцируема или ее производная равна 0 (т. е. ) . [2] Критическое значение — это изображение критической точки под f . Эти концепции можно визуализировать с помощью графика f : в критической точке график имеет горизонтальную касательную , если ее вообще можно задать.
Обратите внимание, что для дифференцируемой функции критическая точка совпадает с стационарной точкой .
Хотя это легко визуализировать на графике (который является кривой), понятие критической точки функции не следует путать с понятием критической точки, в некотором направлении, кривой ( см. ниже для подробного определения). Если g ( x , y ) является дифференцируемой функцией двух переменных, то g ( x , y ) = 0 является неявным уравнением кривой. Критическая точка такой кривой, для проекции, параллельной оси y (отображение ( x , y ) → x ), является точкой кривой, где Это означает, что касательная к кривой параллельна оси y , и что в этой точке g не определяет неявную функцию из x в y (см. теорему о неявной функции ). Если ( x 0 , y 0 ) является такой критической точкой, то x 0 является соответствующим критическим значением . Такая критическая точка также называется точкой бифуркации , поскольку, как правило, при изменении x имеются две ветви кривой по одну сторону от x 0 и ноль по другую сторону.
Из этих определений следует, что дифференцируемая функция f ( x ) имеет критическую точку x 0 с критическим значением y 0 , тогда и только тогда, когда ( x 0 , y 0 ) является критической точкой ее графика для проекции, параллельной оси x , с тем же критическим значением y 0 . Если f не дифференцируема в точке x 0 из-за того, что касательная становится параллельной оси y , то x 0 снова является критической точкой f , но теперь ( x 0 , y 0 ) является критической точкой ее графика для проекции, параллельной оси y .
Например, критические точки единичной окружности уравнения — это (0, 1) и (0, -1) для проекции, параллельной оси x , и (1, 0) и (-1, 0) для направления, параллельного оси y . Если рассматривать верхнюю половину окружности как график функции , то x = 0 — критическая точка с критическим значением 1 из-за того, что производная равна 0, а x = ±1 — критические точки с критическим значением 0 из-за того, что производная не определена.
По теореме Гаусса–Лукаса все критические точки полиномиальной функции в комплексной плоскости находятся внутри выпуклой оболочки корней функции. Таким образом, для полиномиальной функции с только действительными корнями все критические точки являются действительными и находятся между наибольшими и наименьшими корнями .
Гипотеза Сендова утверждает, что если все корни функции лежат в единичном круге комплексной плоскости, то в пределах единичного расстояния от любого заданного корня существует по крайней мере одна критическая точка.
Критические точки играют важную роль в изучении плоских кривых, определяемых неявными уравнениями , в частности, для их построения и определения их топологии . Понятие критической точки, используемое в этом разделе, может показаться отличным от понятия предыдущего раздела. Фактически, это специализация к простому случаю общего понятия критической точки, приведенного ниже.
Таким образом, мы рассматриваем кривую C, заданную неявным уравнением , где f — дифференцируемая функция двух переменных, обычно двумерный полином . Точки кривой — это точки евклидовой плоскости , декартовы координаты которых удовлетворяют уравнению. Существуют две стандартные проекции и , определяемые и , которые отображают кривую на оси координат . Они называются проекцией, параллельной оси y , и проекцией, параллельной оси x , соответственно.
Точка C является критической для , если касательная к C существует и параллельна оси y . В этом случае образы критической точки и касательной являются одной и той же точкой оси x , называемой критическим значением . Таким образом, точка C является критической для , если ее координаты являются решением системы уравнений :
Это означает, что данное определение является частным случаем общего определения критической точки, которое приведено ниже.
Определение критической точки для аналогично. Если C — график функции , то ( x , y ) является критической для тогда и только тогда, когда x — критическая точка g , и критические значения одинаковы.
Некоторые авторы определяют критические точки C как точки, которые являются критическими для или , хотя они зависят не только от C , но и от выбора осей координат. От авторов также зависит, считать ли особые точки критическими. Фактически особые точки — это точки, которые удовлетворяют
и, таким образом, являются решениями любой из систем уравнений, характеризующих критические точки. При таком более общем определении критические точки для — это именно те точки, где теорема о неявной функции не применима.
Если кривая C является алгебраической, то есть она определяется двумерным полиномом f , то дискриминант является полезным инструментом для вычисления критических точек.
Здесь мы рассматриваем только проекцию ; аналогичные результаты можно получить, поменяв местами x и y .
Пусть будет дискриминантом f , рассматриваемым как многочлен от y с коэффициентами, которые являются многочленами от x . Таким образом, этот дискриминант является многочленом от x , имеющим критические значения среди своих корней.
Точнее, простой корень — это либо критическое значение, такое что соответствующая критическая точка — это точка, которая не является ни особой, ни точкой перегиба, либо координата x асимптоты , которая параллельна оси y и касается «в бесконечности» точки перегиба (асимптоты перегиба).
Кратный корень дискриминанта соответствует либо нескольким критическим точкам или асимптотам перегиба, имеющим одно и то же критическое значение, либо критической точке, которая также является точкой перегиба, либо особой точке.
Для функции нескольких действительных переменных точка P (то есть набор значений входных переменных, который рассматривается как точка в ) является критической , если это точка, где градиент равен нулю или не определен. [5] Критические значения — это значения функции в критических точках.
Критическая точка (где функция дифференцируема) может быть либо локальным максимумом , либо локальным минимумом , либо седловой точкой . Если функция по крайней мере дважды непрерывно дифференцируема, то различные случаи можно различить, рассматривая собственные значения матрицы Гессе вторых производных.
Критическая точка, в которой матрица Гессе невырождена , называется невырожденной , а знаки собственных значений Гессе определяют локальное поведение функции. В случае функции одной переменной Гессе — это просто вторая производная , рассматриваемая как матрица 1×1, которая невырождена тогда и только тогда, когда она не равна нулю. В этом случае невырожденная критическая точка — это локальный максимум или локальный минимум, в зависимости от знака второй производной, который положителен для локального минимума и отрицателен для локального максимума. Если вторая производная равна нулю, критическая точка, как правило, является точкой перегиба , но также может быть точкой волнообразности , которая может быть локальным минимумом или локальным максимумом.
Для функции n переменных число отрицательных собственных значений матрицы Гессе в критической точке называется индексом критической точки. Невырожденная критическая точка является локальным максимумом тогда и только тогда, когда индекс равен n , или, что эквивалентно, если матрица Гессе отрицательно определена ; она является локальным минимумом, если индекс равен нулю, или, что эквивалентно, если матрица Гессе положительно определена . Для других значений индекса невырожденная критическая точка является седловой точкой , то есть точкой, которая является максимумом в некоторых направлениях и минимумом в других.
По теореме Ферма все локальные максимумы и минимумы непрерывной функции происходят в критических точках. Поэтому, чтобы найти локальные максимумы и минимумы дифференцируемой функции, теоретически достаточно вычислить нули градиента и собственные значения матрицы Гессе в этих нулях. Это требует решения системы уравнений , что может быть сложной задачей. Обычные численные алгоритмы гораздо более эффективны для поиска локальных экстремумов, но не могут подтвердить, что все экстремумы были найдены. В частности, в глобальной оптимизации эти методы не могут подтвердить, что выход действительно является глобальным оптимумом.
Когда минимизируемая функция представляет собой многомерный полином , критические точки и критические значения являются решениями системы полиномиальных уравнений , а современные алгоритмы решения таких систем предоставляют конкурентоспособные сертифицированные методы поиска глобального минимума.
При заданном дифференцируемом отображении критические точки f являются точками , в которых ранг матрицы Якоби f не является максимальным. [6] Образ критической точки при f называется критическим значением. Точка в дополнении к множеству критических значений называется регулярным значением . Теорема Сарда утверждает , что множество критических значений гладкого отображения имеет меру ноль .
Некоторые авторы [7] дают несколько иное определение: критическая точка f — это точка , где ранг матрицы Якоби функции f меньше n . При таком соглашении все точки являются критическими, когда m < n .
Эти определения распространяются на дифференциальные отображения между дифференцируемыми многообразиями следующим образом. Пусть — дифференциальное отображение между двумя многообразиями V и W соответствующих размерностей m и n . В окрестности точки p многообразий V и f ( p ) карты являются диффеоморфизмами и Точка p является критической для f, если является критической для Это определение не зависит от выбора карт, поскольку отображения переходов являются диффеоморфизмами, их матрицы Якоби обратимы, и умножение на них не изменяет ранг матрицы Якоби Если M — гильбертово многообразие (не обязательно конечномерное), а f — вещественная функция, то мы говорим, что p — критическая точка f , если f не является погружением в p . [8]
Критические точки имеют основополагающее значение для изучения топологии многообразий и действительных алгебраических многообразий . [1] В частности, они являются основным инструментом теории Морса и теории катастроф .
Связь между критическими точками и топологией проявляется уже на более низком уровне абстракции. Например, пусть будет подмногообразием , а P будет точкой вне Квадрат расстояния до P точки является дифференциальным отображением таким, что каждая связная компонента содержит по крайней мере критическую точку, где расстояние минимально. Из этого следует, что число связных компонент ограничено сверху числом критических точек.
В случае действительных алгебраических многообразий это наблюдение, связанное с теоремой Безу, позволяет нам ограничить число связных компонент функцией степеней многочленов, определяющих многообразие.
{{cite book}}
: CS1 maint: others (link)