stringtranslate.com

Субпроизводная

Выпуклая функция (синий) и «касательные линии» (красный).

В математике субпроизводные (или субградиент) обобщают производную на выпуклые функции , которые не обязательно дифференцируемы . Совокупность субпроизводных в точке называется субдифференциалом в этой точке. [1] Субпроизводные возникают в выпуклом анализе , изучении выпуклых функций , часто в связи с выпуклой оптимизацией .

Пусть – вещественная выпуклая функция, определенная на отрезке вещественной прямой. Такая функция не обязательно должна быть дифференцируемой во всех точках: например, функция абсолютного значения недифференцируема, когда . Однако, как видно на графике справа (где синий цвет имеет недифференцируемые изломы, подобные функции абсолютного значения), для любой области определения функции можно провести линию, проходящую через точку и которая либо находится везде, либо касаясь или ниже графика f . Наклон такой прямой называется субпроизводной .

Определение

Строго говоря, субпроизводная выпуклой функции в точке открытого интервала — это действительное число такое, что

теореме о среднемсубпроизводныхнепустой замкнутый интервалодносторонние пределы
функции. [2]

Пример

Рассмотрим функцию , которая является выпуклой. Тогда субдифференциалом в начале координат является интервал . Субдифференциал в любой точке является одноэлементным множеством , тогда как субдифференциал в любой точке является одноэлементным множеством . Это похоже на функцию знака , но не является однозначной в точке , а включает все возможные производные.

Характеристики

Субградиент

Понятия субпроизводной и субдифференциала можно обобщить на функции нескольких переменных. Если выпуклая функция с действительным знаком, определенная на выпуклом открытом множестве в евклидовом пространстве , вектор в этом пространстве называется субградиентом в , если для любого из них есть это

где точка обозначает скалярное произведение . Совокупность всех субградиентов at называется субдифференциалом at и обозначается . Субдифференциал всегда представляет собой непустой выпуклый компакт .

Эти концепции далее обобщаются на выпуклые функции на выпуклом множестве в локально выпуклом пространстве . Функционал в дуальном пространстве называется субградиентом в , если для всех

Множество всех субградиентов at называется субдифференциалом at и снова обозначается . Субдифференциал всегда является выпуклым замкнутым множеством . Это может быть пустой набор; рассмотрим, например, неограниченный оператор , который является выпуклым, но не имеет субградиента. Если непрерывен, то субдифференциал непуст.

История

Субдифференциал выпуклых функций был введен Жан-Жаком Моро и Р. Тирреллом Рокафелларом в начале 1960-х годов. Обобщенный субдифференциал для невыпуклых функций был введен Ф. Х. Кларком и Р. Т. Рокафелларом в начале 1980-х годов. [4]

Смотрите также

Рекомендации

  1. ^ Бубек, С. (2014). Теория выпуклой оптимизации машинного обучения. ArXiv, абс/1405.4980.
  2. ^ Рокафеллар, RT (1970). Выпуклый анализ . Издательство Принстонского университета. п. 242 [теорема 25.1]. ISBN 0-691-08069-0.
  3. ^ Лемарешаль, Клод; Хириар-Уррути, Жан-Батист (2001). Основы выпуклого анализа . Шпрингер-Верлаг Берлин Гейдельберг. п. 183. ИСБН 978-3-642-56468-0.
  4. ^ Кларк, Фрэнк Х. (1983). Оптимизация и негладкий анализ . Нью-Йорк: Джон Уайли и сыновья . стр. xiii+308. ISBN  0-471-87504-Х. МР  0709590.

Внешние ссылки