stringtranslate.com

Выпуклая функция

Выпуклая функция на интервале .
Функция (черного цвета) является выпуклой тогда и только тогда, когда область над ее графиком (зеленого цвета) представляет собой выпуклое множество .
График двумерной выпуклой функции x 2 + xy + y 2 .
Выпуклый против невыпуклого

В математике действительная функция называется выпуклой , если отрезок прямой между любыми двумя различными точками на графике функции лежит выше или на графике между двумя точками. Эквивалентно, функция является выпуклой, если ее надграфик (множество точек на или над графиком функции) является выпуклым множеством . Проще говоря, график выпуклой функции имеет форму чашки (или прямой линии, как у линейной функции), в то время как график вогнутой функции имеет форму колпачка .

Дважды дифференцируемая функция одной переменной является выпуклой тогда и только тогда, когда ее вторая производная неотрицательна на всей своей области определения . [1] Хорошо известными примерами выпуклых функций одной переменной являются линейная функция (где — действительное число ), квадратичная функция ( как неотрицательное действительное число) и показательная функция ( как неотрицательное действительное число).

Выпуклые функции играют важную роль во многих областях математики. Они особенно важны при изучении задач оптимизации , где они отличаются рядом удобных свойств. Например, строго выпуклая функция на открытом множестве имеет не более одного минимума . Даже в бесконечномерных пространствах при подходящих дополнительных гипотезах выпуклые функции продолжают удовлетворять таким свойствам и, как следствие, они являются наиболее хорошо изученными функционалами в вариационном исчислении . В теории вероятностей выпуклая функция, примененная к ожидаемому значению случайной величины, всегда ограничена сверху ожидаемым значением выпуклой функции случайной величины. Этот результат, известный как неравенство Йенсена , может быть использован для вывода неравенств, таких как неравенство среднего арифметического и геометрического и неравенство Гёльдера .

Определение

Визуализация выпуклой функции и неравенства Йенсена

Пусть — выпуклое подмножество действительного векторного пространства и пусть — функция.

Тогда называется выпуклым тогда и только тогда, когда выполняется любое из следующих эквивалентных условий:

  1. Для всех и всех : Правая сторона представляет прямую линию между и на графике как функция увеличения от до или уменьшения от до заметает эту линию. Аналогично, аргумент функции в левой стороне представляет прямую линию между и на или -оси графика Таким образом, это условие требует, чтобы прямая линия между любой парой точек на кривой была выше или просто пересекала график. [2]
  2. Для всех и всех таких, что : Отличие этого второго условия от первого условия выше заключается в том, что это условие не включает точки пересечения (например, и ) между прямой линией, проходящей через пару точек на кривой (прямая линия представлена ​​правой частью этого условия), и кривой первого условия включает точки пересечения, поскольку она становится или при или или На самом деле, точки пересечения не нужно рассматривать в условии выпуклости, используя, поскольку и всегда истинны (поэтому бесполезно быть частью условия).

Второе утверждение, характеризующее выпуклые функции, которые оцениваются в вещественной прямой , также является утверждением, используемым для определения выпуклых функций , которые оцениваются в расширенной вещественной прямой, где такая функция может принимать значение. Первое утверждение не используется, поскольку оно позволяет принимать или в качестве значения, и в этом случае, если или соответственно, то будет неопределенным (поскольку умножения и не определены). Сумма также не определена, поэтому выпуклая расширенная вещественная функция обычно может принимать только одно из и в качестве значения.

Второе утверждение также можно модифицировать, чтобы получить определение строгой выпуклости , где последнее получается заменой на строгое неравенство Явно, отображение называется строго выпуклым тогда и только тогда, когда для всех действительных и всех таких, что :

Строго выпуклая функция — это функция, прямая линия между любой парой точек на кривой находится выше кривой, за исключением точек пересечения прямой и кривой. Примером функции, которая является выпуклой, но не строго выпуклой, является . Эта функция не является строго выпуклой, поскольку любые две точки, разделяющие координату x, будут иметь прямую линию между ними, в то время как любые две точки, НЕ разделяющие координату x, будут иметь большее значение функции, чем точки между ними.

Функция называется вогнутой (соответственно строго вогнутой ), если ( умноженная на −1) является выпуклой (соответственно строго выпуклой).

Альтернативное наименование

Термин выпуклый часто называют выпуклым вниз или вогнутым вверх , а термин вогнутый часто называют вогнутым вниз или выпуклым вверх . [3] [4] [5] Если термин «выпуклый» используется без ключевых слов «вверх» или «вниз», то он относится строго к чашеобразному графику . Например, неравенство Йенсена относится к неравенству, включающему выпуклую или выпуклую (вниз) функцию. [6]

Характеристики

Многие свойства выпуклых функций имеют ту же простую формулировку для функций многих переменных, что и для функций одной переменной. Ниже приведены свойства для случая многих переменных, так как некоторые из них не перечислены для функций одной переменной.

Функции одной переменной

Доказательство

Так как является выпуклым, то, используя одно из определений выпуклой функции выше и допуская , что для всех действительных Из следует, что А именно, .

Функции многих переменных

Операции, сохраняющие выпуклость

Сильно выпуклые функции

Концепция сильной выпуклости расширяет и параметризует понятие строгой выпуклости. Интуитивно, сильно выпуклая функция — это функция, которая растет так же быстро, как квадратичная функция. [11] Сильно выпуклая функция также строго выпукла, но не наоборот. Если одномерная функция дважды непрерывно дифференцируема, а область определения — вещественная прямая, то мы можем охарактеризовать ее следующим образом:

Например, пусть будет строго выпуклой, и предположим, что существует последовательность точек такая, что . Даже если , функция не является сильно выпуклой, поскольку станет произвольно малой.

В более общем случае дифференцируемая функция называется сильно выпуклой с параметром , если для всех точек ее области определения выполняется следующее неравенство : [12] или, в более общем случае, где — любое скалярное произведение , а — соответствующая норма . Некоторые авторы, например [13], называют функции, удовлетворяющие этому неравенству, эллиптическими функциями.

Эквивалентным условием является следующее: [14]

Для того чтобы функция была сильно выпуклой, не обязательно быть дифференцируемой. Третье определение [14] для сильно выпуклой функции с параметром заключается в том, что для всех в области определения и

Обратите внимание, что это определение приближается к определению строгой выпуклости при и идентично определению выпуклой функции при Несмотря на это, существуют функции, которые являются строго выпуклыми, но не являются сильно выпуклыми ни для какого (см. пример ниже).

Если функция дважды непрерывно дифференцируема, то она сильно выпукла с параметром тогда и только тогда, когда для всех в области определения, где — единица, а — матрица Гессе , и неравенство означает, что является положительно полуопределенной . Это эквивалентно требованию, чтобы минимальное собственное значение было не менее для всех Если область определения — это просто вещественная прямая, то — это просто вторая производная , поэтому условие становится . Если то это означает, что гессиан положительно полуопределен (или если область определения — это вещественная прямая, то это означает, что ), что подразумевает, что функция выпукла и, возможно, строго выпукла, но не сильно выпукла.

Предполагая по-прежнему, что функция дважды непрерывно дифференцируема, можно показать, что нижняя граница влечет ее сильную выпуклость. Используя теорему Тейлора, существует такое, что Тогда по предположению о собственных значениях, и, следовательно, мы восстанавливаем второе уравнение сильной выпуклости выше.

Функция является сильно выпуклой с параметром m тогда и только тогда, когда функция выпукла.

Дважды непрерывно дифференцируемая функция на компактной области , удовлетворяющая для всех , является сильно выпуклой. Доказательство этого утверждения следует из теоремы об экстремальном значении , которая утверждает, что непрерывная функция на компактном множестве имеет максимум и минимум.

С сильно выпуклыми функциями в целом проще работать, чем с выпуклыми или строго выпуклыми функциями, поскольку они представляют собой меньший класс. Как и строго выпуклые функции, сильно выпуклые функции имеют уникальные минимумы на компактных множествах.

Свойства сильно выпуклых функций

Если f — сильно выпуклая функция с параметром m , то: [15] : Предложение 6.1.4 

Равномерно выпуклые функции

Равномерно выпуклая функция [16] [17] с модулем , является функцией , которая для всех в области и удовлетворяет условию , где — функция, которая неотрицательна и обращается в нуль только в точке 0. Это обобщение концепции сильно выпуклой функции; взяв , мы восстанавливаем определение сильной выпуклости.

Стоит отметить, что некоторые авторы требуют, чтобы модуль был возрастающей функцией, [17] но это условие требуется не всеми авторами. [16]

Примеры

Функции одной переменной

Функциинпеременные

Смотрите также

Примечания

  1. ^ "Lecture Notes 2" (PDF) . www.stat.cmu.edu . Получено 3 марта 2017 г. .
  2. ^ "Вогнутый вверх и вниз". Архивировано из оригинала 2013-12-18.
  3. ^ Стюарт, Джеймс (2015). Calculus (8-е изд.). Cengage Learning. стр. 223–224. ISBN 978-1305266643.
  4. ^ W. Hamming, Richard (2012). Методы математики, применяемые к исчислению, вероятности и статистике (иллюстрированное издание). Courier Corporation. стр. 227. ISBN 978-0-486-13887-9.Выдержка из страницы 227
  5. ^ Уваров, Василий Борисович (1988). Математический анализ. Издательство «Мир». С. 126-127. ISBN 978-5-03-000500-3.
  6. ^ Прюгель-Беннетт, Адам (2020). Вероятностный компаньон для инженерии и компьютерных наук (иллюстрированное издание). Cambridge University Press. стр. 160. ISBN 978-1-108-48053-6.Выдержка из страницы 160
  7. ^ ab Boyd, Stephen P.; Vandenberghe, Lieven (2004). Выпуклая оптимизация (pdf) . Cambridge University Press. ISBN 978-0-521-83378-3. Получено 15 октября 2011 г. .
  8. ^ Донохью, Уильям Ф. (1969). Распределения и преобразования Фурье. Academic Press. стр. 12. ISBN 9780122206504. Получено 29 августа 2012 г. .
  9. ^ "Если f строго выпукло в выпуклом множестве, покажите, что оно имеет не более 1 минимума". Math StackExchange. 21 марта 2013 г. Получено 14 мая 2016 г.
  10. ^ Альтенберг, Л., 2012. Резольвентные положительные линейные операторы демонстрируют явление редукции. Труды Национальной академии наук, 109(10), стр.3705-3710.
  11. ^ "Сильная выпуклость · Блог Синю Чжоу". xingyuzhou.org . Получено 2023-09-27 .
  12. ^ Димитрий Берцекас (2003). Выпуклый анализ и оптимизация . Авторы: Анджелия Недич и Асуман Э. Оздаглар. Athena Scientific. стр. 72. ISBN 9781886529458.
  13. ^ Филипп Г. Сиарле (1989). Введение в численную линейную алгебру и оптимизацию . Cambridge University Press. ISBN 9780521339841.
  14. ^ ab Юрий Нестеров (2004). Вводные лекции по выпуклой оптимизации: базовый курс . Kluwer Academic Publishers. стр. 63–64. ISBN 9781402075537.
  15. ^ Немировски и Бен-Тал (2023). «Оптимизация III: Выпуклая оптимизация» (PDF) .
  16. ^ ab C. Zalinescu (2002). Выпуклый анализ в общих векторных пространствах . World Scientific. ISBN 9812380671.
  17. ^ ab H. Bauschke и PL Combettes (2011). Выпуклый анализ и теория монотонных операторов в гильбертовых пространствах . Springer. стр. 144. ISBN 978-1-4419-9467-7.
  18. ^ Кингман, Дж. Ф. К. (1961). «Свойство выпуклости положительных матриц». The Quarterly Journal of Mathematics . 12 : 283–284. doi :10.1093/qmath/12.1.283.
  19. ^ Коэн, Дж. Э., 1981. Выпуклость доминирующего собственного значения существенно неотрицательной матрицы. Труды Американского математического общества, 81(4), стр. 657-658.

Ссылки

Внешние ссылки