stringtranslate.com

Субдеривативный

Выпуклая функция (синяя) и «подкасательные линии» в точке (красная).

В математике субпроизводные (или субградиенты) обобщают производную на выпуклые функции , которые не обязательно дифференцируемы . Набор субпроизводных в точке называется субдифференциалом в этой точке. [1] Субпроизводные возникают в выпуклом анализе , изучении выпуклых функций , часто в связи с выпуклой оптимизацией .

Пусть будет вещественной -значной выпуклой функцией, определенной на открытом интервале вещественной прямой. Такая функция не обязана быть дифференцируемой во всех точках: Например, функция абсолютного значения недифференцируема, когда . Однако, как видно на графике справа (где синим цветом обозначены недифференцируемые изломы, подобные функции абсолютного значения), для любого в области определения функции можно провести линию, которая проходит через точку и которая всюду касается или находится ниже графика функции f . Наклон такой линии называется субпроизводной .

Определение

Строго говоря, субпроизводная выпуклой функции в точке открытого интервала — это действительное число, такое что для всех . По обратной теореме о среднем значении множество субпроизводных в для выпуклой функции является непустым замкнутым интервалом , где и — односторонние пределы Интервал всех субпроизводных называется субдифференциалом функции в , обозначаемым . Если является выпуклой, то ее субдифференциал в любой точке непуст. Более того, если ее субдифференциал в содержит ровно одну субпроизводную, то дифференцируем в и . [2]

Пример

Рассмотрим функцию, которая является выпуклой. Тогда субдифференциал в начале координат — это интервал . Субдифференциал в любой точке — это одноэлементное множество , в то время как субдифференциал в любой точке — это одноэлементное множество . Это похоже на функцию знака , но не является однозначной в , а вместо этого включает все возможные субпроизводные.

Характеристики

Субградиент

Понятия субпроизводной и субдифференциала можно обобщить на функции нескольких переменных. Если - вещественнозначная выпуклая функция, определенная на выпуклом открытом множестве в евклидовом пространстве , вектор в этом пространстве называется субградиентом в , если для любого имеет место, что

где точка обозначает скалярное произведение . Множество всех субградиентов в точке называется субдифференциалом в точке и обозначается . Субдифференциал всегда является непустым выпуклым компактным множеством .

Эти концепции далее обобщаются на выпуклые функции на выпуклом множестве в локально выпуклом пространстве . Функционал в сопряженном пространстве называется субградиентом в , если для всех ,

Множество всех субградиентов в называется субдифференциалом в и снова обозначается . Субдифференциал всегда является выпуклым замкнутым множеством . Он может быть пустым множеством; рассмотрим, например, неограниченный оператор , который является выпуклым, но не имеет субградиента. Если является непрерывным, то субдифференциал непуст.

История

Субдифференциал на выпуклых функциях был введен Жаном Жаком Моро и Р. Тирреллом Рокафелларом в начале 1960-х годов. Обобщенный субдифференциал для невыпуклых функций был введен Ф. Х. Кларком и Р. Т. Рокафелларом в начале 1980-х годов. [4]

Смотрите также

Ссылки

  1. ^ Бубек, С. (2014). Теория выпуклой оптимизации для машинного обучения. ArXiv, abs/1405.4980.
  2. ^ Рокафеллар, РТ (1970). Выпуклый анализ . Princeton University Press. стр. 242 [Теорема 25.1]. ISBN 0-691-08069-0.
  3. ^ Лемарешаль, Клод; Хириар-Уррути, Жан-Батист (2001). Основы выпуклого анализа . Шпрингер-Верлаг Берлин Гейдельберг. п. 183. ИСБН 978-3-642-56468-0.
  4. ^ Кларк, Фрэнк Х. (1983). Оптимизация и негладкий анализ . Нью-Йорк: John Wiley & Sons . С. xiii+308. ISBN  0-471-87504-X. МР  0709590.

Внешние ссылки