Пусть – вещественная выпуклая функция, определенная на отрезке вещественной прямой. Такая функция не обязательно должна быть дифференцируемой во всех точках: например, функция абсолютного значения недифференцируема, когда . Однако, как видно на графике справа (где синий цвет имеет недифференцируемые изломы, подобные функции абсолютного значения), для любой области определения функции можно провести линию, проходящую через точку и которая либо находится везде, либо касаясь или ниже графика f . Наклон такой прямой называется субпроизводной .
Определение
Строго говоря, субпроизводная выпуклой функции в точке открытого интервала — это действительное число такое, что
Рассмотрим функцию , которая является выпуклой. Тогда субдифференциалом в начале координат является интервал . Субдифференциал в любой точке является одноэлементным множеством , тогда как субдифференциал в любой точке является одноэлементным множеством . Это похоже на функцию знака , но не является однозначной в точке , а включает все возможные производные.
Характеристики
Выпуклая функция дифференцируема тогда и только тогда, когда субдифференциал представляет собой одноэлементное множество, то есть .
Точка является глобальным минимумом выпуклой функции тогда и только тогда, когда нуль содержится в субдифференциале. Например, на рисунке выше можно провести горизонтальную «касательную линию» к графику at . Это последнее свойство является обобщением того факта, что производная функции, дифференцируемой в локальном минимуме, равна нулю.
Если и являются выпуклыми функциями с субдифференциалами и являются внутренней точкой одной из функций, то субдифференциал есть ( где оператор сложения обозначает сумму Минковского ). Это звучит так: «Субдифференциал суммы есть сумма субдифференциалов». [3]
Субградиент
Понятия субпроизводной и субдифференциала можно обобщить на функции нескольких переменных. Если выпуклая функция с действительным знаком, определенная на выпуклом открытом множестве в евклидовом пространстве , вектор в этом пространстве называется субградиентом в , если для любого из них есть это
где точка обозначает скалярное произведение . Совокупность всех субградиентов at называется субдифференциалом at и обозначается . Субдифференциал всегда представляет собой непустой выпуклый компакт .
Множество всех субградиентов at называется субдифференциалом at и снова обозначается . Субдифференциал всегда является выпуклым замкнутым множеством . Это может быть пустой набор; рассмотрим, например, неограниченный оператор , который является выпуклым, но не имеет субградиента. Если непрерывен, то субдифференциал непуст.
История
Субдифференциал выпуклых функций был введен Жан-Жаком Моро и Р. Тирреллом Рокафелларом в начале 1960-х годов. Обобщенный субдифференциал для невыпуклых функций был введен Ф. Х. Кларком и Р. Т. Рокафелларом в начале 1980-х годов. [4]
^ Бубек, С. (2014). Теория выпуклой оптимизации машинного обучения. ArXiv, абс/1405.4980.
^ Рокафеллар, RT (1970). Выпуклый анализ . Издательство Принстонского университета. п. 242 [теорема 25.1]. ISBN 0-691-08069-0.
^ Лемарешаль, Клод; Хириар-Уррути, Жан-Батист (2001). Основы выпуклого анализа . Шпрингер-Верлаг Берлин Гейдельберг. п. 183. ИСБН978-3-642-56468-0.
^ Кларк, Фрэнк Х. (1983). Оптимизация и негладкий анализ . Нью-Йорк: Джон Уайли и сыновья . стр. xiii+308. ISBN0-471-87504-Х. МР 0709590.
Борвейн, Джонатан; Льюис, Адриан С. (2010). Выпуклый анализ и нелинейная оптимизация: теория и примеры (2-е изд.). Нью-Йорк: Спрингер. ISBN 978-0-387-31256-9.
Залинеску, К. (2002). Выпуклый анализ в общих векторных пространствах . World Scientific Publishing Co., Inc., стр. xx+367. ISBN 981-238-067-1. МР 1921556.
Внешние ссылки
«Использование lim час → 0 ж ( Икс + час ) - ж ( Икс - час ) 2 час {\ displaystyle \ lim \limits _ {h \ to 0} {\ frac {f (x + h) -f (xh )}{2ч}}} ". Обмен стеками . 18 сентября 2011 г.