Действительная функция с секущей линией между точками над самим графиком
В математике действительная функция называется выпуклой , если отрезок прямой между любыми двумя различными точками на графике функции лежит выше или на графике между двумя точками. Эквивалентно, функция является выпуклой, если ее надграфик (множество точек на или над графиком функции) является выпуклым множеством . Проще говоря, график выпуклой функции имеет форму чашки (или прямой линии, как у линейной функции), в то время как график вогнутой функции имеет форму колпачка .
Тогда называется выпуклым тогда и только тогда, когда выполняется любое из следующих эквивалентных условий:
Для всех и всех :
Правая сторона представляет прямую линию между и на графике как функция увеличения от до или уменьшения от до заметает эту линию. Аналогично, аргумент функции в левой стороне представляет прямую линию между и на или -оси графика Таким образом, это условие требует, чтобы прямая линия между любой парой точек на кривой была выше или просто пересекала график. [2]
Для всех и всех таких, что :
Отличие этого второго условия от первого условия выше заключается в том, что это условие не включает точки пересечения (например, и ) между прямой линией, проходящей через пару точек на кривой (прямая линия представлена правой частью этого условия), и кривой первого условия включает точки пересечения, поскольку она становится или при или или На самом деле, точки пересечения не нужно рассматривать в условии выпуклости, используя, поскольку и всегда истинны (поэтому бесполезно быть частью условия).
Второе утверждение, характеризующее выпуклые функции, которые оцениваются в вещественной прямой , также является утверждением, используемым для определения выпуклых функций , которые оцениваются в расширенной вещественной прямой, где такая функция может принимать значение. Первое утверждение не используется, поскольку оно позволяет принимать или в качестве значения, и в этом случае, если или соответственно, то будет неопределенным (поскольку умножения и не определены). Сумма также не определена, поэтому выпуклая расширенная вещественная функция обычно может принимать только одно из и в качестве значения.
Второе утверждение также можно модифицировать, чтобы получить определение строгой выпуклости , где последнее получается заменой на строгое неравенство
Явно, отображение называется строго выпуклым тогда и только тогда, когда для всех действительных и всех таких, что :
Строго выпуклая функция — это функция, прямая линия между любой парой точек на кривой находится выше кривой, за исключением точек пересечения прямой и кривой. Примером функции, которая является выпуклой, но не строго выпуклой, является . Эта функция не является строго выпуклой, поскольку любые две точки, разделяющие координату x, будут иметь прямую линию между ними, в то время как любые две точки, НЕ разделяющие координату x, будут иметь большее значение функции, чем точки между ними.
Функция называется вогнутой (соответственно строго вогнутой ), если ( умноженная на −1) является выпуклой (соответственно строго выпуклой).
Альтернативное наименование
Термин выпуклый часто называют выпуклым вниз или вогнутым вверх , а термин вогнутый часто называют вогнутым вниз или выпуклым вверх . [3] [4] [5] Если термин «выпуклый» используется без ключевых слов «вверх» или «вниз», то он относится строго к чашеобразному графику . Например, неравенство Йенсена относится к неравенству, включающему выпуклую или выпуклую (вниз) функцию. [6]
Характеристики
Многие свойства выпуклых функций имеют ту же простую формулировку для функций многих переменных, что и для функций одной переменной. Ниже приведены свойства для случая многих переменных, так как некоторые из них не перечислены для функций одной переменной.
Функции одной переменной
Предположим, что является функцией одной действительной переменной, определенной на интервале, и пусть (обратите внимание, что является наклоном фиолетовой линии на первом рисунке; функция симметрична относительно означает , что не меняется при замене и ). является выпуклой тогда и только тогда, когда является монотонно неубывающей по для каждого фиксированного (или наоборот). Эта характеристика выпуклости весьма полезна для доказательства следующих результатов.
Выпуклая функция одной действительной переменной, определенная на некотором открытом интервале , непрерывна на допускает левые и правые производные , и они монотонно не убывающие . Кроме того, левая производная непрерывна слева, а правая производная непрерывна справа. Как следствие, дифференцируема во всех, кроме счетного числа точек, множество, в котором она не дифференцируема, может, однако, быть плотным. Если замкнуто, то может не быть непрерывным в конечных точках (пример показан в разделе примеров).
Дифференцируемая функция одной переменной выпукла на интервале тогда и только тогда, когда ее производная монотонно не убывает на этом интервале. Если функция дифференцируема и выпукла, то она также непрерывно дифференцируема .
Дифференцируемая функция одной переменной выпукла на интервале тогда и только тогда, когда ее график лежит выше всех своих касательных : [7] : 69 для всех и на интервале.
Дважды дифференцируемая функция одной переменной выпукла на интервале тогда и только тогда, когда ее вторая производная неотрицательна там; это дает практический тест на выпуклость. Визуально дважды дифференцируемая выпуклая функция «изгибается вверх», без каких-либо изгибов в другую сторону ( точки перегиба ). Если ее вторая производная положительна во всех точках, то функция строго выпукла, но обратное не верно. Например, вторая производная от равна , которая равна нулю при , но является строго выпуклой.
Это свойство и указанное выше свойство в терминах «...ее производная монотонно не убывает...» не равны, поскольку если неотрицательна на интервале , то монотонно не убывает на , в то время как обратное утверждение неверно, например, монотонно не убывает на , в то время как ее производная не определена в некоторых точках на .
Так как является выпуклой, то, используя одно из определений выпуклой функции выше и допуская , что для всех действительных Из следует, что
А именно, .
Функция является средневыпуклой на интервале , если для всех Это условие лишь немного слабее, чем выпуклость. Например, вещественная измеримая по Лебегу функция , которая является средневыпуклой, является выпуклой: это теорема Серпинского . [8] В частности, непрерывная функция, которая является средневыпуклой, будет выпуклой.
Функции многих переменных
Функция, которая является предельно выпуклой по каждой отдельной переменной, не обязательно является (совместно) выпуклой. Например, функция является предельно линейной , и, таким образом, предельно выпуклой, по каждой переменной, но не (совместно) выпуклой.
Дифференцируемая функция, определенная на выпуклой области, является выпуклой тогда и только тогда, когда выполняется для всех функций в области.
Дважды дифференцируемая функция многих переменных является выпуклой на выпуклом множестве тогда и только тогда, когда ее матрица Гессе вторых частных производных положительно полуопределена на внутренней части выпуклого множества.
Для выпуклой функции множества подуровней и с являются выпуклыми множествами. Функция, удовлетворяющая этому свойству, называется квазивыпуклой функцией и может не быть выпуклой функцией.
Следовательно, множество глобальных минимизаторов выпуклой функции является выпуклым множеством: - выпукло.
Любой локальный минимум выпуклой функции также является глобальным минимумом . Строго выпуклая функция будет иметь не более одного глобального минимума. [9]
Неравенство Йенсена применимо к любой выпуклой функции . Если — случайная величина, принимающая значения в области , то где обозначает математическое ожидание . Действительно, выпуклые функции — это в точности те, которые удовлетворяют гипотезе неравенства Йенсена .
Однородная функция первого порядка двух положительных переменных и (то есть функция, удовлетворяющая для всех положительных действительных ), которая является выпуклой по одной переменной, должна быть выпуклой и по другой переменной. [10]
Операции, сохраняющие выпуклость
является вогнутым тогда и только тогда, когда является выпуклым.
Если — любое действительное число, то оно выпукло тогда и только тогда, когда оно выпукло.
Неотрицательные взвешенные суммы:
если и все выпуклые, то также выпукла и В частности, сумма двух выпуклых функций является выпуклой.
это свойство распространяется также на бесконечные суммы, интегралы и ожидаемые значения (при условии, что они существуют).
Поэлементный максимум: пусть будет набором выпуклых функций. Тогда является выпуклым. Область определения — это набор точек, где выражение конечно. Важные особые случаи:
Если являются выпуклыми функциями, то также
Теорема Данскина : Если является выпуклым по , то является выпуклым по , даже если не является выпуклым множеством.
Состав:
Если и являются выпуклыми функциями и не убывает в одномерной области, то является выпуклой. Например, если является выпуклой, то также является, поскольку является выпуклой и монотонно возрастает.
Если вогнутая, выпуклая и невозрастающая в одномерной области, то выпуклая.
Выпуклость инвариантна относительно аффинных отображений: то есть, если выпукло с областью , то также выпукло , где с областью
Минимизация: Если является выпуклым по , то является выпуклым по при условии, что является выпуклым множеством и что
Если выпукло, то его перспектива с областью определения выпукла.
Пусть — векторное пространство. является выпуклым и удовлетворяет тогда и только тогда, когда для любого и любых неотрицательных действительных чисел , удовлетворяющих
Сильно выпуклые функции
Концепция сильной выпуклости расширяет и параметризует понятие строгой выпуклости. Интуитивно, сильно выпуклая функция — это функция, которая растет так же быстро, как квадратичная функция. [11] Сильно выпуклая функция также строго выпукла, но не наоборот. Если одномерная функция дважды непрерывно дифференцируема, а область определения — вещественная прямая, то мы можем охарактеризовать ее следующим образом:
выпуклый тогда и только тогда, когда для всех
строго выпукло, если для всех (примечание: этого достаточно, но не необходимо).
сильно выпуклый тогда и только тогда, когда для всех
Например, пусть будет строго выпуклой, и предположим, что существует последовательность точек такая, что . Даже если , функция не является сильно выпуклой, поскольку станет произвольно малой.
В более общем случае дифференцируемая функция называется сильно выпуклой с параметром , если для всех точек ее области определения выполняется следующее неравенство : [12]
или, в более общем случае,
где — любое скалярное произведение , а — соответствующая норма . Некоторые авторы, например [13], называют функции, удовлетворяющие этому неравенству, эллиптическими функциями.
Эквивалентным условием является следующее: [14]
Для того чтобы функция была сильно выпуклой, не обязательно быть дифференцируемой. Третье определение [14] для сильно выпуклой функции с параметром заключается в том, что для всех в области определения и
Обратите внимание, что это определение приближается к определению строгой выпуклости при и идентично определению выпуклой функции при Несмотря на это, существуют функции, которые являются строго выпуклыми, но не являются сильно выпуклыми ни для какого (см. пример ниже).
Если функция дважды непрерывно дифференцируема, то она сильно выпукла с параметром тогда и только тогда, когда для всех в области определения, где — единица, а — матрица Гессе , и неравенство означает, что является положительно полуопределенной . Это эквивалентно требованию, чтобы минимальное собственное значение было не менее для всех Если область определения — это просто вещественная прямая, то — это просто вторая производная , поэтому условие становится . Если то это означает, что гессиан положительно полуопределен (или если область определения — это вещественная прямая, то это означает, что ), что подразумевает, что функция выпукла и, возможно, строго выпукла, но не сильно выпукла.
Предполагая по-прежнему, что функция дважды непрерывно дифференцируема, можно показать, что нижняя граница влечет ее сильную выпуклость. Используя теорему Тейлора, существует
такое, что
Тогда
по предположению о собственных значениях, и, следовательно, мы восстанавливаем второе уравнение сильной выпуклости выше.
Функция является сильно выпуклой с параметром m тогда и только тогда, когда функция
выпукла.
Дважды непрерывно дифференцируемая функция на компактной области , удовлетворяющая для всех , является сильно выпуклой. Доказательство этого утверждения следует из теоремы об экстремальном значении , которая утверждает, что непрерывная функция на компактном множестве имеет максимум и минимум.
С сильно выпуклыми функциями в целом проще работать, чем с выпуклыми или строго выпуклыми функциями, поскольку они представляют собой меньший класс. Как и строго выпуклые функции, сильно выпуклые функции имеют уникальные минимумы на компактных множествах.
Свойства сильно выпуклых функций
Если f — сильно выпуклая функция с параметром m , то: [15] : Предложение 6.1.4
Для каждого действительного числа r множество уровня { x | f ( x ) ≤ r } является компактным .
Равномерно выпуклая функция [16] [17] с модулем , является функцией , которая для всех в области и удовлетворяет условию
, где — функция, которая неотрицательна и обращается в нуль только в точке 0. Это обобщение концепции сильно выпуклой функции; взяв , мы восстанавливаем определение сильной выпуклости.
Стоит отметить, что некоторые авторы требуют, чтобы модуль был возрастающей функцией, [17] но это условие требуется не всеми авторами. [16]
Примеры
Функции одной переменной
Функция имеет , поэтому f — выпуклая функция. Она также сильно выпукла (и, следовательно, строго выпукла тоже), с константой сильной выпуклости 2.
Функция имеет , поэтому f — выпуклая функция. Она строго выпукла, хотя вторая производная не строго положительна во всех точках. Она не сильно выпукла.
Экспоненциальная функция является выпуклой. Она также строго выпукла, так как , но она не является сильно выпуклой, так как вторая производная может быть сколь угодно близка к нулю. В более общем случае функция является логарифмически выпуклой, если является выпуклой функцией. Иногда вместо этого используется термин «супервыпуклая». [18]
Функция с областью определения [0,1], определенная с помощью for, является выпуклой; она непрерывна на открытом интервале , но не непрерывна в точках 0 и 1.
Функция имеет вторую производную ; таким образом, она выпукла на множестве , где и вогнута на множестве , где
Примерами функций, которые монотонно возрастают , но не являются выпуклыми, являются и .
Каждое действительное линейное преобразование является выпуклым, но не строго выпуклым, поскольку если является линейным, то . Это утверждение также справедливо, если мы заменим «выпуклый» на «вогнутый».
Каждая вещественная аффинная функция , то есть каждая функция вида, является одновременно выпуклой и вогнутой.
^ W. Hamming, Richard (2012). Методы математики, применяемые к исчислению, вероятности и статистике (иллюстрированное издание). Courier Corporation. стр. 227. ISBN978-0-486-13887-9.Выдержка из страницы 227
^ Уваров, Василий Борисович (1988). Математический анализ. Издательство «Мир». С. 126-127. ISBN978-5-03-000500-3.
^ Прюгель-Беннетт, Адам (2020). Вероятностный компаньон для инженерии и компьютерных наук (иллюстрированное издание). Cambridge University Press. стр. 160. ISBN978-1-108-48053-6.Выдержка из страницы 160
^ ab Boyd, Stephen P.; Vandenberghe, Lieven (2004). Выпуклая оптимизация (pdf) . Cambridge University Press. ISBN978-0-521-83378-3. Получено 15 октября 2011 г. .
^ Донохью, Уильям Ф. (1969). Распределения и преобразования Фурье. Academic Press. стр. 12. ISBN9780122206504. Получено 29 августа 2012 г. .
^ "Если f строго выпукло в выпуклом множестве, покажите, что оно имеет не более 1 минимума". Math StackExchange. 21 марта 2013 г. Получено 14 мая 2016 г.
^ Альтенберг, Л., 2012. Резольвентные положительные линейные операторы демонстрируют явление редукции. Труды Национальной академии наук, 109(10), стр.3705-3710.
^ ab C. Zalinescu (2002). Выпуклый анализ в общих векторных пространствах . World Scientific. ISBN9812380671.
^ ab H. Bauschke и PL Combettes (2011). Выпуклый анализ и теория монотонных операторов в гильбертовых пространствах . Springer. стр. 144. ISBN978-1-4419-9467-7.
^ Кингман, Дж. Ф. К. (1961). «Свойство выпуклости положительных матриц». The Quarterly Journal of Mathematics . 12 : 283–284. doi :10.1093/qmath/12.1.283.
^ Коэн, Дж. Э., 1981. Выпуклость доминирующего собственного значения существенно неотрицательной матрицы. Труды Американского математического общества, 81(4), стр. 657-658.
Ссылки
Берцекас, Димитрий (2003). Выпуклый анализ и оптимизация . Athena Scientific.
Борвейн, Джонатан и Льюис, Адриан. (2000). Выпуклый анализ и нелинейная оптимизация. Springer.
Донохью, Уильям Ф. (1969). Распределения и преобразования Фурье . Academic Press.
Ириар-Уррути, Жан-Батист, и Лемарешаль, Клод . (2004). Основы выпуклого анализа. Берлин: Шпрингер.
Красносельский М.А. , Рутицкий Я.Б. (1961). Выпуклые функции и пространства Орлича . Гронинген: P.Noordhoff Ltd.
Лауритцен, Нильс (2013). Выпуклость бакалавриата . World Scientific Publishing.
Люенбергер, Дэвид (1984). Линейное и нелинейное программирование . Эддисон-Уэсли.
Люенбергер, Дэвид (1969). Оптимизация методами векторного пространства . Wiley & Sons.
Рокафеллар, Р. Т. (1970). Выпуклый анализ . Принстон: Princeton University Press.
Томсон, Брайан (1994). Симметричные свойства действительных функций . CRC Press.
Zălinescu, C. (2002). Выпуклый анализ в общих векторных пространствах . River Edge, NJ: World Scientific Publishing Co., Inc. стр. xx+367. ISBN 981-238-067-1. МР 1921556.