stringtranslate.com

Выпуклая функция

Выпуклая функция на интервале .
Функция (черный цвет) является выпуклой тогда и только тогда, когда область над ее графиком (зеленый цвет) представляет собой выпуклое множество .
График двумерной выпуклой функции x 2 + xy + y 2 .
Выпуклый против невыпуклого

В математике действительная функция называется выпуклой , если отрезок между любыми двумя различными точками на графике функции лежит над графиком между двумя точками. Аналогично, функция является выпуклой, если ее надграфик (множество точек на графике функции или над ним) представляет собой выпуклое множество . Проще говоря, график выпуклой функции имеет форму чашки (или прямой линии, как у линейной функции), а график вогнутой функции имеет форму шапки .

Дважды дифференцируемая функция одной переменной является выпуклой тогда и только тогда, когда ее вторая производная неотрицательна во всей области определения . [1] Хорошо известные примеры выпуклых функций одной переменной включают линейную функцию (где – действительное число ), квадратичную функцию ( как неотрицательное действительное число) и экспоненциальную функцию ( как неотрицательное действительное число).

Выпуклые функции играют важную роль во многих областях математики. Они особенно важны при исследовании задач оптимизации , где отличаются рядом удобных свойств. Например, строго выпуклая функция на открытом множестве имеет не более одного минимума . Даже в бесконечномерных пространствах при подходящих дополнительных гипотезах выпуклые функции продолжают удовлетворять таким свойствам и в результате являются наиболее хорошо изученными функционалами в вариационном исчислении . В теории вероятностей выпуклая функция, примененная к ожидаемому значению случайной величины , всегда ограничена сверху ожидаемым значением выпуклой функции случайной величины. Этот результат, известный как неравенство Йенсена , может быть использован для вывода таких неравенств , как среднее арифметико-геометрическое неравенство и неравенство Гёльдера .

Определение

Визуализация выпуклой функции и неравенства Йенсена

Пусть – выпуклое подмножество вещественного векторного пространства , и пусть – функция.

Тогда называется выпуклым тогда и только тогда, когда выполняется любое из следующих эквивалентных условий:

  1. Для всех и вся :
    Правая часть представляет собой прямую линию между и на графике как функцию увеличения от до или убывания от этой линии. Аналогично, аргумент функции в левой части представляет собой прямую линию между и внутри или -осью графика графика. Итак, это условие требует, чтобы прямая линия между любой парой точек на кривой была выше или чуть выше соответствует графику. [2]
  2. Для всех и вся такая, что :
    Отличие этого второго условия от первого условия выше состоит в том, что это условие не включает точки пересечения (например, и ) между прямой, проходящей через пару точек на кривой (прямая линия представлена ​​как правая часть этого условия), а кривая первого условия включает в себя точки пересечения, как это становится или в или или . Фактически, точки пересечения не нужно рассматривать в состоянии выпуклости, используя
    потому что и всегда верны (поэтому бесполезно быть частью условия).

Второе утверждение, характеризующее выпуклые функции, которые оцениваются в вещественной строке, также является утверждением, используемым для определения выпуклых функций , которые оцениваются в расширенной строке действительных чисел , где такой функции разрешено принимать значение. Первый оператор не используется, поскольку он позволяет принимать или в качестве значения, и в этом случае, если или соответственно, then будет неопределенным (поскольку умножения и не определены). Сумма также не определена, поэтому выпуклой расширенной функции с действительным знаком обычно разрешено принимать только одно из и в качестве значения.

Второе утверждение также можно изменить, чтобы получить определение строгой выпуклости , где последнее получается заменой на строгое неравенство . Явно отображение называется строго выпуклым тогда и только тогда, когда для всех действительных и всех таких, что :

Строго выпуклая функция — это функция, у которой прямая между любой парой точек кривой находится над кривой, за исключением точек пересечения прямой и кривой. Примером функции, которая является выпуклой, но не строго выпуклой, является . Эта функция не является строго выпуклой, поскольку между любыми двумя точками, имеющими общую координату x, будет прямая линия, а любые две точки, НЕ имеющие общую координату x, будут иметь большее значение функции, чем точки между ними.

Функция называется вогнутой (соответственно строго вогнутой ), если ( умноженная на −1) является выпуклой (соответственно строго выпуклой).

Альтернативное наименование

Термин «выпуклый» часто называют «выпуклым вниз » или «вогнутым вверх» , а термин «вогнутый» часто называют «вогнутым вниз » или «выпуклым вверх» . [3] [4] [5] Если термин «выпуклый» используется без ключевых слов «вверх» или «вниз», то он относится строго к графу в форме чаши . Например, неравенство Йенсена относится к неравенству, включающему выпуклую или выпуклую (вниз) функцию. [6]

Характеристики

Многие свойства выпуклых функций имеют для функций многих переменных такую ​​же простую формулировку, как и для функций одной переменной. Ниже приведены свойства для случая многих переменных, так как некоторые из них не указаны для функций одной переменной.

Функции одной переменной

Доказательство

Поскольку функция выпукла, используя одно из приведенных выше определений выпуклой функции и допустив, что для всех вещественных

Отсюда следует, что

Функции нескольких переменных

Операции, сохраняющие выпуклость

Сильно выпуклые функции

Понятие сильной выпуклости расширяет и параметризует понятие строгой выпуклости. Интуитивно понятно, что сильно выпуклая функция — это функция, которая растет так же быстро, как квадратичная функция. [11] Сильно выпуклая функция является также строго выпуклой, но не наоборот. Если одномерная функция дважды непрерывно дифференцируема и областью определения является действительная прямая, то мы можем охарактеризовать ее следующим образом:

Например, пусть будет строго выпуклым, и предположим, что существует последовательность точек такая, что . Несмотря на то , что функция не является сильно выпуклой, поскольку станет сколь угодно малой.

В более общем смысле, дифференцируемая функция называется сильно выпуклой с параметром, если для всех точек ее области определения выполняется следующее неравенство : [12]

внутренний продуктнорма[13]эллиптическими

Эквивалентным условием является следующее: [14]

Чтобы функция была сильно выпуклой, не обязательно быть дифференцируемой. Третье определение [14] для сильно выпуклой функции с параметром состоит в том, что для всех в области определения и

Обратите внимание, что это определение приближается к определению строгой выпуклости и идентично определению выпуклой функции, когда Несмотря на это, существуют функции, которые являются строго выпуклыми, но не являются сильно выпуклыми ни для одного (см. пример ниже).

Если функция дважды непрерывно дифференцируема, то она сильно выпукла с параметром тогда и только тогда, когда для всех в области, где – единица и – матрица Гессе , а неравенство означает, что она положительно полуопределена . Это эквивалентно требованию, чтобы минимальное собственное значение было по крайней мере для всех. Если областью определения является просто действительная линия, то это всего лишь вторая производная, поэтому условие становится . Если тогда это означает, что гессиан положительно полуопределен (или если областью определения является вещественная прямая, это означает, что ), что означает, что функция выпуклая и, возможно, строго выпуклая, но не сильно выпуклая.

Полагая еще, что функция дважды непрерывно дифференцируема, можно показать, что из нижней оценки следует, что она сильно выпукла. Используя теорему Тейлора, существует

Функция является сильно выпуклой с параметром m тогда и только тогда, когда функция

Дважды непрерывно дифференцируемая функция на компактной области , удовлетворяющая всем требованиям, является сильно выпуклой. Доказательство этого утверждения следует из теоремы о крайних значениях , которая утверждает, что непрерывная функция на компакте имеет максимум и минимум.

С сильно выпуклыми функциями обычно легче работать, чем с выпуклыми или строго выпуклыми функциями, поскольку они представляют собой меньший класс. Как и строго выпуклые функции, сильно выпуклые функции имеют единственные минимумы на компактах.

Свойства сильно выпуклых функций

Если f — сильно выпуклая функция с параметром m , то: [15] : Предложение 6.1.4. 

Равномерно выпуклые функции

Равномерно выпуклая функция [16] [17] с модулем , является функцией , которая для всех в области и удовлетворяет

Стоит отметить, что некоторые авторы требуют, чтобы модуль был возрастающей функцией, [17] , но этого условия требуют не все авторы. [16]

Примеры

Функции одной переменной

Функции n переменных

Смотрите также

Примечания

  1. ^ «Конспекты лекций 2» (PDF) . www.stat.cmu.edu . Проверено 3 марта 2017 г.
  2. ^ «Вогнутость вверх и вниз». Архивировано из оригинала 18 декабря 2013 г.
  3. ^ Стюарт, Джеймс (2015). Исчисление (8-е изд.). Cengage Обучение. стр. 223–224. ISBN 978-1305266643.
  4. ^ В. Хэмминг, Ричард (2012). Методы математики, применяемые к исчислению, теории вероятностей и статистике (иллюстрированное издание). Курьерская корпорация. п. 227. ИСБН 978-0-486-13887-9.Выдержка со страницы 227
  5. ^ Уваров, Василий Борисович (1988). Математический анализ. Издательство «Мир». п. 126-127. ISBN 978-5-03-000500-3.
  6. ^ Прюгель-Беннетт, Адам (2020). The Probability Companion for Engineering and Computer Science (иллюстрированное издание). Издательство Кембриджского университета. п. 160. ИСБН 978-1-108-48053-6.Выдержка со страницы 160
  7. ^ Аб Бойд, Стивен П.; Ванденберге, Ливен (2004). Выпуклая оптимизация (pdf) . Издательство Кембриджского университета. ISBN 978-0-521-83378-3. Проверено 15 октября 2011 г.
  8. ^ Донохью, Уильям Ф. (1969). Распределения и преобразования Фурье. Академическая пресса. п. 12. ISBN 9780122206504. Проверено 29 августа 2012 г.
  9. ^ «Если f строго выпукло в выпуклом множестве, покажите, что оно имеет не более 1 минимума». Математический StackExchange. 21 марта 2013 г. Проверено 14 мая 2016 г. .
  10. ^ Альтенберг, Л., 2012. Резольвентные положительные линейные операторы демонстрируют явление редукции. Труды Национальной академии наук, 109 (10), стр. 3705-3710.
  11. ^ "Сильная выпуклость · Блог Синъюй Чжоу" . xingyuzhou.org . Проверено 27 сентября 2023 г.
  12. ^ Дмитрий Берцекас (2003). Выпуклый анализ и оптимизация . Авторы: Анжелия Недич и Асуман Э. Оздаглар. Афина Сайентифик. п. 72. ИСБН 9781886529458.
  13. ^ Филипп Дж. Сиарле (1989). Введение в численную линейную алгебру и оптимизацию . Издательство Кембриджского университета. ISBN 9780521339841.
  14. ^ аб Юрий Нестеров (2004). Вводные лекции по выпуклой оптимизации: базовый курс . Академическое издательство Клувер. стр. 63–64. ISBN 9781402075537.
  15. ^ Немировский и Бен-Тал (2023). «Оптимизация III: Выпуклая оптимизация» (PDF) .
  16. ^ аб К. Залинеску (2002). Выпуклый анализ в общих векторных пространствах . Всемирная научная. ISBN 9812380671.
  17. ^ ab H. Bauschke и PL Combettes (2011). Выпуклый анализ и теория монотонных операторов в гильбертовых пространствах . Спрингер. п. 144. ИСБН 978-1-4419-9467-7.
  18. ^ Кингман, JFC (1961). «Свойство выпуклости положительных матриц». Ежеквартальный математический журнал . 12 : 283–284. дои : 10.1093/qmath/12.1.283.
  19. ^ Коэн, Дж. Э., 1981. Выпуклость доминирующего собственного значения существенно неотрицательной матрицы. Труды Американского математического общества, 81 (4), стр. 657-658.

Рекомендации

Внешние ссылки