Реальная функция с секущей линией между точками над самим графиком
В математике действительная функция называется выпуклой , если отрезок между любыми двумя различными точками на графике функции лежит над графиком между двумя точками. Аналогично, функция является выпуклой, если ее надграфик (множество точек на графике функции или над ним) представляет собой выпуклое множество . Проще говоря, график выпуклой функции имеет форму чашки (или прямой линии, как у линейной функции), а график вогнутой функции имеет форму шапки .
Выпуклые функции играют важную роль во многих областях математики. Они особенно важны при исследовании задач оптимизации , где отличаются рядом удобных свойств. Например, строго выпуклая функция на открытом множестве имеет не более одного минимума . Даже в бесконечномерных пространствах при подходящих дополнительных гипотезах выпуклые функции продолжают удовлетворять таким свойствам и в результате являются наиболее хорошо изученными функционалами в вариационном исчислении . В теории вероятностей выпуклая функция, примененная к ожидаемому значению случайной величины , всегда ограничена сверху ожидаемым значением выпуклой функции случайной величины. Этот результат, известный как неравенство Йенсена , может быть использован для вывода таких неравенств , как среднее арифметико-геометрическое неравенство и неравенство Гёльдера .
Тогда называется выпуклым тогда и только тогда, когда выполняется любое из следующих эквивалентных условий:
Для всех и вся :
Правая часть представляет собой прямую линию между и на графике как функцию увеличения от до или убывания от этой линии. Аналогично, аргумент функции в левой части представляет собой прямую линию между и внутри или -осью графика графика. Итак, это условие требует, чтобы прямая линия между любой парой точек на кривой была выше или чуть выше соответствует графику. [2]
Для всех и вся такая, что :
Отличие этого второго условия от первого условия выше состоит в том, что это условие не включает точки пересечения (например, и ) между прямой, проходящей через пару точек на кривой (прямая линия представлена как правая часть этого условия), а кривая первого условия включает в себя точки пересечения, как это становится или в или или . Фактически, точки пересечения не нужно рассматривать в состоянии выпуклости, используя
потому что и всегда верны (поэтому бесполезно быть частью условия).
Второе утверждение, характеризующее выпуклые функции, которые оцениваются в вещественной строке, также является утверждением, используемым для определения выпуклых функций , которые оцениваются в расширенной строке действительных чисел , где такой функции разрешено принимать значение. Первый оператор не используется, поскольку он позволяет принимать или в качестве значения, и в этом случае, если или соответственно, then будет неопределенным (поскольку умножения и не определены). Сумма также не определена, поэтому выпуклой расширенной функции с действительным знаком обычно разрешено принимать только одно из и в качестве значения.
Второе утверждение также можно изменить, чтобы получить определение строгой выпуклости , где последнее получается заменой на строгое неравенство
. Явно отображение называется строго выпуклым тогда и только тогда, когда для всех действительных и всех таких, что :
Строго выпуклая функция — это функция, у которой прямая между любой парой точек кривой находится над кривой, за исключением точек пересечения прямой и кривой. Примером функции, которая является выпуклой, но не строго выпуклой, является . Эта функция не является строго выпуклой, поскольку между любыми двумя точками, имеющими общую координату x, будет прямая линия, а любые две точки, НЕ имеющие общую координату x, будут иметь большее значение функции, чем точки между ними.
Функция называется вогнутой (соответственно строго вогнутой ), если ( умноженная на −1) является выпуклой (соответственно строго выпуклой).
Альтернативное наименование
Термин «выпуклый» часто называют «выпуклым вниз » или «вогнутым вверх» , а термин «вогнутый» часто называют «вогнутым вниз » или «выпуклым вверх» . [3] [4] [5] Если термин «выпуклый» используется без ключевых слов «вверх» или «вниз», то он относится строго к графу в форме чаши . Например, неравенство Йенсена относится к неравенству, включающему выпуклую или выпуклую (вниз) функцию. [6]
Характеристики
Многие свойства выпуклых функций имеют для функций многих переменных такую же простую формулировку, как и для функций одной переменной. Ниже приведены свойства для случая многих переменных, так как некоторые из них не указаны для функций одной переменной.
Функции одной переменной
Предположим , что это функция одной действительной переменной, определенной на интервале, и пусть
(обратите внимание, что это наклон фиолетовой линии на рисунке выше; функция симметрична в смысле, который не меняется при замене и ). выпукла тогда и только тогда, когда монотонно не убывает при каждом фиксированном (или наоборот). Эта характеристика выпуклости весьма полезна для доказательства следующих результатов.
Выпуклая функция одной действительной переменной, определенная на некотором открытом интервале, непрерывна на и допускает левые и правые производные , причем они монотонно не убывают . Как следствие, дифференцируемо во всех точках, но не более чем в счетном числе , причем множество, в которых не дифференцируемо, тем не менее, может быть плотным . Если замкнуто, то может не быть непрерывным на концах (пример показан в разделе примеров).
Дифференцируемая функция одной переменной выпукла на отрезке тогда и только тогда, когда ее производная монотонно не убывает на этом отрезке. Если функция дифференцируема и выпукла, то она также непрерывно дифференцируема .
Дифференцируемая функция одной переменной выпукла на отрезке тогда и только тогда, когда ее график лежит выше всех ее касательных : [7] : 69
для всех и в интервале.
Дважды дифференцируемая функция одной переменной выпукла на отрезке тогда и только тогда, когда ее вторая производная на этом интервале неотрицательна; это дает практический тест на выпуклость. Визуально дважды дифференцируемая выпуклая функция «выгибается вверх», без каких-либо изгибов в другую сторону ( точки перегиба ). Если ее вторая производная положительна во всех точках, то функция строго выпуклая, но обратное неверно . Например, вторая производная от равна нулю, но строго выпукла.
Это свойство и указанное выше свойство в терминах «... его производная монотонно не убывает ...» не равны, поскольку, если оно неотрицательно на интервале , то оно монотонно не убывает, в то время как его обратное неверно, например, монотонно не убывает на , пока его производная не определена в некоторых точках на .
Поскольку функция выпукла, используя одно из приведенных выше определений выпуклой функции и допустив, что для всех вещественных
Отсюда следует, что
Функция называется выпуклой в средней точке на отрезке, если для всех
Это условие лишь немного слабее выпуклости. Например, вещественная измеримая функция Лебега , выпуклая в средней точке, является выпуклой: это теорема Серпинского . [8] В частности, непрерывная функция, выпуклая в средней точке, будет выпуклой.
Для выпуклой функции множества подуровней и с являются выпуклыми множествами. Функция, удовлетворяющая этому свойству, называется квазивыпуклой функцией и может не быть выпуклой функцией.
Следовательно, множество глобальных минимизаторов выпуклой функции является выпуклым множеством: - выпуклым.
Любой локальный минимум выпуклой функции также является глобальным минимумом . Строго выпуклая функция будет иметь не более одного глобального минимума. [9]
Неравенство Йенсена применимо к любой выпуклой функции . Если — случайная величина, принимающая значения в области то где обозначает математическое ожидание . Действительно, выпуклые функции — это именно те, которые удовлетворяют гипотезе неравенства Йенсена .
Однородная функция первого порядка двух положительных переменных и (то есть функция, удовлетворяющая для всех положительных действительных ), выпуклая по одной переменной, должна быть выпуклой по другой переменной. [10]
Операции, сохраняющие выпуклость
вогнута тогда и только тогда, когда выпукла.
Если - любое действительное число, то оно выпукло тогда и только тогда, когда оно выпукло.
Неотрицательные взвешенные суммы:
если и все выпуклы, то и выпуклы. В частности, сумма двух выпуклых функций выпукла.
это свойство распространяется также на бесконечные суммы, интегралы и ожидаемые значения (при условии, что они существуют).
Поэлементный максимум: пусть это набор выпуклых функций. Тогда выпукло. Область определения — это совокупность точек, в которых выражение конечно. Важные особые случаи:
Если выпуклые функции, то и выпуклые
Теорема Данскина : если множество выпукло, то оно выпукло, даже если оно не является выпуклым множеством.
Состав:
Если и являются выпуклыми функциями и не убывает в одномерной области, то является выпуклой. Например, если выпукло, то так оно и есть, потому что оно выпукло и монотонно возрастает.
Если оно вогнуто, выпукло и не возрастает в одномерной области, то оно выпукло.
Выпуклость инвариантна относительно аффинных отображений: то есть, если выпукло с областью определения , то так же является и , где с областью определения
Минимизация: если выпукло в , то оно выпукло при условии, что это выпуклое множество и что
Если выпукло, то его перспектива с областью выпукла.
Пусть векторное пространство. является выпуклым и удовлетворяет тогда и только тогда, когда для любых и любых неотрицательных действительных чисел , которые удовлетворяют
Сильно выпуклые функции
Понятие сильной выпуклости расширяет и параметризует понятие строгой выпуклости. Интуитивно понятно, что сильно выпуклая функция — это функция, которая растет так же быстро, как квадратичная функция. [11] Сильно выпуклая функция является также строго выпуклой, но не наоборот. Если одномерная функция дважды непрерывно дифференцируема и областью определения является действительная прямая, то мы можем охарактеризовать ее следующим образом:
выпукло тогда и только тогда, когда для всех
строго выпуклый, если для всех (примечание: этого достаточно, но не обязательно).
сильно выпуклый тогда и только тогда, когда для всех
Например, пусть будет строго выпуклым, и предположим, что существует последовательность точек такая, что . Несмотря на то , что функция не является сильно выпуклой, поскольку станет сколь угодно малой.
В более общем смысле, дифференцируемая функция называется сильно выпуклой с параметром, если для всех точек ее области определения выполняется следующее неравенство : [12]
Чтобы функция была сильно выпуклой, не обязательно быть дифференцируемой. Третье определение [14] для сильно выпуклой функции с параметром состоит в том, что для всех в области определения и
Обратите внимание, что это определение приближается к определению строгой выпуклости и идентично определению выпуклой функции, когда Несмотря на это, существуют функции, которые являются строго выпуклыми, но не являются сильно выпуклыми ни для одного (см. пример ниже).
Если функция дважды непрерывно дифференцируема, то она сильно выпукла с параметром тогда и только тогда, когда для всех в области, где – единица и – матрица Гессе , а неравенство означает, что она положительно полуопределена . Это эквивалентно требованию, чтобы минимальное собственное значение было по крайней мере для всех. Если областью определения является просто действительная линия, то это всего лишь вторая производная, поэтому условие становится . Если тогда это означает, что гессиан положительно полуопределен (или если областью определения является вещественная прямая, это означает, что ), что означает, что функция выпуклая и, возможно, строго выпуклая, но не сильно выпуклая.
Полагая еще, что функция дважды непрерывно дифференцируема, можно показать, что из нижней оценки следует, что она сильно выпукла. Используя теорему Тейлора, существует
Функция является сильно выпуклой с параметром m тогда и только тогда, когда функция
Дважды непрерывно дифференцируемая функция на компактной области , удовлетворяющая всем требованиям, является сильно выпуклой. Доказательство этого утверждения следует из теоремы о крайних значениях , которая утверждает, что непрерывная функция на компакте имеет максимум и минимум.
С сильно выпуклыми функциями обычно легче работать, чем с выпуклыми или строго выпуклыми функциями, поскольку они представляют собой меньший класс. Как и строго выпуклые функции, сильно выпуклые функции имеют единственные минимумы на компактах.
Свойства сильно выпуклых функций
Если f — сильно выпуклая функция с параметром m , то: [15] : Предложение 6.1.4.
Для каждого действительного числа r набор уровней { x | ж ( Икс ) ≤ р } компактен .
Равномерно выпуклая функция [16] [17] с модулем , является функцией , которая для всех в области и удовлетворяет
Стоит отметить, что некоторые авторы требуют, чтобы модуль был возрастающей функцией, [17] , но этого условия требуют не все авторы. [16]
Примеры
Функции одной переменной
Функция имеет , поэтому f — выпуклая функция. Он также сильно выпуклый (а значит, и строго выпуклый) с сильной константой выпуклости 2.
Функция имеет , поэтому f — выпуклая функция. Он строго выпуклый, хотя вторая производная не является строго положительной во всех точках. Он не сильно выпуклый.
Функция абсолютного значения является выпуклой (как это отражено в неравенстве треугольника ), даже если она не имеет производной в точке. Она не является строго выпуклой.
Функция for выпуклая.
Показательная функция выпуклая. Она также строго выпукла, поскольку , но не сильно выпукла, поскольку вторая производная может быть сколь угодно близкой к нулю. В более общем смысле, функция является логарифмически выпуклой, если она является выпуклой функцией. Вместо этого иногда используется термин «сверхвыпуклый». [18]
Функция с областью определения [0,1], определяемая for, является выпуклой; он непрерывен на открытом интервале , но не непрерывен в точках 0 и 1.
Функция имеет вторую производную ; таким образом, он выпуклый на множестве где и вогнутый на множестве где
Всякое вещественнозначное линейное преобразование выпукло, но не строго выпукло, так как если линейно, то . Это утверждение справедливо и в том случае, если мы заменим слово «выпуклое» на «вогнутое».
Всякая вещественная аффинная функция , то есть каждая функция вида одновременно выпукла и вогнута.
^ В. Хэмминг, Ричард (2012). Методы математики, применяемые к исчислению, теории вероятностей и статистике (иллюстрированное издание). Курьерская корпорация. п. 227. ИСБН978-0-486-13887-9.Выдержка со страницы 227
^ Уваров, Василий Борисович (1988). Математический анализ. Издательство «Мир». п. 126-127. ISBN978-5-03-000500-3.
^ Прюгель-Беннетт, Адам (2020). The Probability Companion for Engineering and Computer Science (иллюстрированное издание). Издательство Кембриджского университета. п. 160. ИСБН978-1-108-48053-6.Выдержка со страницы 160
^ Аб Бойд, Стивен П.; Ванденберге, Ливен (2004). Выпуклая оптимизация (pdf) . Издательство Кембриджского университета. ISBN978-0-521-83378-3. Проверено 15 октября 2011 г.
^ Донохью, Уильям Ф. (1969). Распределения и преобразования Фурье. Академическая пресса. п. 12. ISBN9780122206504. Проверено 29 августа 2012 г.
^ «Если f строго выпукло в выпуклом множестве, покажите, что оно имеет не более 1 минимума». Математический StackExchange. 21 марта 2013 г. Проверено 14 мая 2016 г. .
^ Альтенберг, Л., 2012. Резольвентные положительные линейные операторы демонстрируют явление редукции. Труды Национальной академии наук, 109 (10), стр. 3705-3710.
^ "Сильная выпуклость · Блог Синъюй Чжоу" . xingyuzhou.org . Проверено 27 сентября 2023 г.
^ Дмитрий Берцекас (2003). Выпуклый анализ и оптимизация . Авторы: Анжелия Недич и Асуман Э. Оздаглар. Афина Сайентифик. п. 72. ИСБН9781886529458.
^ Филипп Дж. Сиарле (1989). Введение в численную линейную алгебру и оптимизацию . Издательство Кембриджского университета. ISBN9780521339841.
^ аб Юрий Нестеров (2004). Вводные лекции по выпуклой оптимизации: базовый курс . Академическое издательство Клувер. стр. 63–64. ISBN9781402075537.
^ аб К. Залинеску (2002). Выпуклый анализ в общих векторных пространствах . Всемирная научная. ISBN9812380671.
^ ab H. Bauschke и PL Combettes (2011). Выпуклый анализ и теория монотонных операторов в гильбертовых пространствах . Спрингер. п. 144. ИСБН978-1-4419-9467-7.
^ Коэн, Дж. Э., 1981. Выпуклость доминирующего собственного значения существенно неотрицательной матрицы. Труды Американского математического общества, 81 (4), стр. 657-658.
Рекомендации
Берцекас, Дмитрий (2003). Выпуклый анализ и оптимизация . Афина Сайентифик.
Борвейн, Джонатан и Льюис, Адриан. (2000). Выпуклый анализ и нелинейная оптимизация. Спрингер.
Донохью, Уильям Ф. (1969). Распределения и преобразования Фурье . Академическая пресса.
Хириар-Уррути, Жан-Батист, и Лемарешаль, Клод . (2004). Основы выпуклого анализа. Берлин: Шпрингер.
Красносельский М.А. , Рутицкий Я.Б. (1961). Выпуклые функции и пространства Орлича . Гронинген: P.Noordhoff Ltd.
Люенбергер, Дэвид (1984). Линейное и нелинейное программирование . Аддисон-Уэсли.
Люенбергер, Дэвид (1969). Оптимизация методами векторного пространства . Уайли и сыновья.
Рокафеллар, RT (1970). Выпуклый анализ . Принстон: Издательство Принстонского университета.
Томсон, Брайан (1994). Симметричные свойства действительных функций . ЦРК Пресс.
Залинеску, К. (2002). Выпуклый анализ в общих векторных пространствах . Ривер Эдж, Нью-Джерси: World Scientific Publishing Co., Inc., стр. xx+367. ISBN 981-238-067-1. МР 1921556.