stringtranslate.com

Множитель Лагранжа

В математической оптимизации метод множителей Лагранжа представляет собой стратегию нахождения локальных максимумов и минимумов функции, подчиняющейся ограничениям уравнения (т. е. условию, что одно или несколько уравнений должны точно удовлетворяться выбранными значениями переменных ) . [1] Он назван в честь математика Жозефа-Луи Лагранжа .

Резюме и обоснование

Основная идея заключается в том, чтобы преобразовать ограниченную задачу в такую ​​форму, чтобы производный тест неограниченной задачи все еще мог быть применен. Связь между градиентом функции и градиентами ограничений довольно естественно приводит к переформулировке исходной задачи, известной как функция Лагранжа или лагранжиан. [2] В общем случае лагранжиан определяется как для функций ; называется множителем Лагранжа.

В простых случаях, когда скалярное произведение определяется как скалярное произведение , лагранжиан равен

Метод можно обобщить следующим образом: для того, чтобы найти максимум или минимум функции, подчиненной ограничению равенства , найдите стационарные точки рассматриваемой как функции и множителя Лагранжа . Это означает, что все частные производные должны быть равны нулю, включая частную производную по . [3]

 и 

или эквивалентно

 и 

Решение, соответствующее исходной ограниченной оптимизации, всегда является седловой точкой функции Лагранжа, [4] [5] , которую можно выделить среди стационарных точек из определенности ограниченной матрицы Гессе . [6]

Большим преимуществом этого метода является то, что он позволяет решать оптимизацию без явной параметризации в терминах ограничений. В результате метод множителей Лагранжа широко используется для решения сложных задач ограниченной оптимизации. Кроме того, метод множителей Лагранжа обобщается условиями Каруша–Куна–Таккера , которые также могут учитывать ограничения-неравенства вида для заданной константы .

Заявление

Следующее утверждение известно как теорема о множителях Лагранжа. [7]

Пусть будет целевой функцией, будет функцией ограничений, обе принадлежат (то есть имеют непрерывные первые производные). Пусть будет оптимальным решением следующей задачи оптимизации таким образом, что для матрицы частных производных , :

Тогда существует уникальный множитель Лагранжа, такой что (обратите внимание, что это довольно условная вещь, где явно рассматривается как вектор-столбец, чтобы гарантировать соответствие измерений. Но мы могли бы также сделать его просто вектором-строкой, не выполняя транспонирование.)

Теорема о множителях Лагранжа утверждает, что в любом локальном максимуме (или минимуме) функции, вычисленной при ограничениях равенства, если применяется квалификация ограничений (объясняется ниже), то градиент функции (в этой точке) может быть выражен как линейная комбинация градиентов ограничений (в этой точке), с множителями Лагранжа, действующими как коэффициенты . [8] Это эквивалентно утверждению, что любое направление, перпендикулярное всем градиентам ограничений, также перпендикулярно градиенту функции. Или, еще говоря, что производная по направлению функции равна 0 в каждом возможном направлении.

Единичное ограничение

Рисунок 1: Красная кривая показывает ограничение g ( x , y ) = c . Синие кривые являются контурами f ( x , y ) . Точка, в которой красное ограничение тангенциально касается синего контура, является максимумом f ( x , y ) вдоль ограничения, поскольку d 1 > d 2 .

Для случая только одного ограничения и только двух переменных выбора (как показано на рисунке 1) рассмотрим задачу оптимизации (иногда аддитивная константа отображается отдельно, а не включается в , в этом случае ограничение записывается как на рисунке 1.) Мы предполагаем, что и имеют непрерывные первые частные производные . Мы вводим новую переменную ( ), называемую множителем Лагранжа (или неопределенным множителем Лагранжа ) и изучаем функцию Лагранжа (или лагранжево или лагранжево выражение ), определяемую как , где член может быть либо добавлен, либо вычтен. Если является максимумом для исходной задачи с ограничениями и тогда существует такое, что ( ) является стационарной точкой для функции Лагранжа (стационарные точки — это те точки, где первые частные производные равны нулю). Это предположение называется квалификацией ограничения. Однако не все стационарные точки дают решение исходной задачи, поскольку метод множителей Лагранжа дает только необходимое условие оптимальности в задачах с ограничениями. [9] [10] [11] [12] [13] Достаточные условия для минимума или максимума также существуют , но если конкретное решение-кандидат удовлетворяет достаточным условиям, то гарантируется только то, что это решение является лучшим локально – то есть оно лучше любых допустимых близлежащих точек. Глобальный оптимум может быть найден путем сравнения значений исходной целевой функции в точках, удовлетворяющих необходимым и локально достаточным условиям.

Метод множителей Лагранжа опирается на интуицию, что в максимуме f ( x , y ) не может увеличиваться в направлении любой такой соседней точки, которая также имеет g = 0 . Если бы это было так, мы могли бы идти вдоль g = 0 , чтобы подняться выше, что означает, что начальная точка на самом деле не была максимумом. Рассматриваемый таким образом, это точный аналог проверки того, равна ли производная неограниченной функции 0 , то есть мы проверяем, что производная по направлению равна 0 в любом соответствующем (жизнеспособном) направлении.

Мы можем визуализировать контуры f , заданные выражением f ( x , y ) = d для различных значений d , и контур g , заданный выражением g ( x , y ) = c .

Предположим, мы идем вдоль контурной линии с g = c . Нас интересует нахождение точек, где f почти не меняется по мере нашего движения, поскольку эти точки могут быть максимумами.

Это может произойти двумя способами:

  1. Мы могли бы коснуться контурной линии f , поскольку по определению f не меняется, когда мы идем вдоль ее контурных линий. Это означало бы, что касательные к контурным линиям f и g здесь параллельны.
  2. Мы достигли «ровной» части f , что означает, что f не изменяется ни в каком направлении.

Чтобы проверить первую возможность (мы касаемся контурной линии f ), обратите внимание, что поскольку градиент функции перпендикулярен контурным линиям, касательные к контурным линиям f и g параллельны тогда и только тогда, когда градиенты f и g параллельны. Таким образом, нам нужны точки ( x , y ) , где g ( x , y ) = c и для некоторых

где — соответствующие градиенты. Константа необходима, поскольку, хотя два вектора градиента параллельны, величины векторов градиента, как правило, не равны. Эта константа называется множителем Лагранжа. (В некоторых соглашениях перед ней стоит знак минус).

Обратите внимание, что этот метод также решает вторую возможность, когда f является уровнем: если f является уровнем, то его градиент равен нулю, и установка является решением независимо от .

Чтобы объединить эти условия в одно уравнение, введем вспомогательную функцию и решим

Обратите внимание, что это равносильно решению трех уравнений с тремя неизвестными. Это метод множителей Лагранжа.

Обратите внимание, что подразумевается , что частная производная по отношению к равна

Подводя итог

Метод легко обобщается на функции переменных , что равносильно решению n + 1 уравнений с n + 1 неизвестными.

Ограниченные экстремумы функции f являются критическими точками функции Лагранжа , но они не обязательно являются локальными экстремумами ( см. § Пример 2 ниже).

Можно переформулировать лагранжиан как гамильтониан , в этом случае решения являются локальными минимумами для гамильтониана. Это делается в теории оптимального управления в форме принципа минимума Понтрягина .

Тот факт, что решения метода множителей Лагранжа не обязательно являются экстремумами лагранжиана, также создает трудности для численной оптимизации. Это можно решить путем минимизации величины градиента лагранжиана, поскольку эти минимумы совпадают с нулями величины, как показано в Примере 5: Численная оптимизация.

Множественные ограничения

Рисунок 2: Параболоид, ограниченный двумя пересекающимися линиями.
Рисунок 3: Контурная карта рисунка 2.

Метод множителей Лагранжа можно расширить для решения задач с несколькими ограничениями, используя похожий аргумент. Рассмотрим параболоид, подчиненный двум линейным ограничениям, которые пересекаются в одной точке. Как единственное допустимое решение, эта точка, очевидно, является ограниченным экстремумом. Однако множество уровня явно не параллельно ни одному из ограничений в точке пересечения (см. рисунок 3); вместо этого оно является линейной комбинацией градиентов двух ограничений. В случае нескольких ограничений это будет то, что мы ищем в общем случае: Метод Лагранжа ищет точки не в которых градиент обязательно кратен градиенту любого одного ограничения, а в которых он является линейной комбинацией градиентов всех ограничений.

Конкретно, предположим, что у нас есть ограничения и мы идем по множеству точек, удовлетворяющих Каждая точка на контуре заданной функции ограничений имеет пространство допустимых направлений: пространство векторов, перпендикулярных Множество направлений, которые разрешены всеми ограничениями, таким образом, является пространством направлений, перпендикулярных всем градиентам ограничений. Обозначим это пространство допустимых перемещений через и обозначим диапазон градиентов ограничений через Тогда пространство векторов, перпендикулярных каждому элементу

Мы все еще заинтересованы в поиске точек, где не меняется по мере нашего движения, поскольку эти точки могут быть (ограниченными) экстремумами. Поэтому мы ищем такие, чтобы любое допустимое направление движения от было перпендикулярно (иначе мы могли бы увеличивать , двигаясь вдоль этого допустимого направления). Другими словами, Таким образом, существуют скаляры, такие, что

Эти скаляры — множители Лагранжа. Теперь у нас их есть, по одному на каждое ограничение.

Как и прежде, вводим вспомогательную функцию и решаем, что равносильно решению уравнений с неизвестными.

Предположение об ограничении при наличии нескольких ограничений заключается в том, что градиенты ограничений в соответствующей точке линейно независимы.

Современная формулировка через дифференцируемые многообразия

Проблема нахождения локальных максимумов и минимумов с учетом ограничений может быть обобщена на нахождение локальных максимумов и минимумов на дифференцируемом многообразии [14] В дальнейшем не обязательно, чтобы это было евклидово пространство или даже риманово многообразие. Все появления градиента (который зависит от выбора римановой метрики) можно заменить внешней производной

Единичное ограничение

Пусть — гладкое многообразие размерности Предположим, что мы хотим найти стационарные точки гладкой функции , ограниченные подмногообразием, определяемым соотношением, где — гладкая функция, для которой 0 является регулярным значением .

Пусть и будут внешними производными и . Стационарность для ограничения в означает Эквивалентно, ядро ​​содержит Другими словами, и являются пропорциональными 1-формами. Для этого необходимо и достаточно, чтобы выполнялась следующая система уравнений: где обозначает внешнее произведение . Стационарные точки являются решениями указанной выше системы уравнений плюс ограничение Заметим, что уравнения не являются независимыми, поскольку левая часть уравнения принадлежит подмногообразию, состоящему из разложимых элементов .

В этой формулировке нет необходимости явно находить множитель Лагранжа, число такое, что

Множественные ограничения

Пусть и будут такими же, как в предыдущем разделе относительно случая одного ограничения. Вместо функции, описанной там, теперь рассмотрим гладкую функцию с компонентными функциями, для которых есть регулярное значение . Пусть будет подмногообразием, определенным как

является стационарной точкой тогда и только тогда, когда содержит Для удобства пусть и где обозначает касательное отображение или якобиан ( можно канонически отождествить с ). Подпространство имеет размерность, меньшую, чем у , а именно и принадлежит тогда и только тогда, когда принадлежит образу С вычислительной точки зрения условие заключается в том, что принадлежит пространству строк матрицы или, что эквивалентно, пространству столбцов матрицы (транспонирование). Если обозначает внешнее произведение столбцов матрицы стационарного условия для при становится Еще раз, в этой формулировке нет необходимости явно находить множители Лагранжа, числа такие, что

Интерпретация множителей Лагранжа

В этом разделе мы преобразуем уравнения связей из вида в вид, где — m действительных констант, которые считаются дополнительными аргументами выражения Лагранжа .

Часто множители Лагранжа имеют интерпретацию как некую величину интереса. Например, параметризуя контурную линию ограничения, то есть, если выражение Лагранжа то

Итак, λ k — это скорость изменения оптимизируемой величины как функции параметра ограничения. Например, в механике Лагранжа уравнения движения выводятся путем нахождения стационарных точек действия , временного интеграла разности между кинетической и потенциальной энергией. Таким образом, сила, действующая на частицу из-за скалярного потенциала, F = −∇ V , может быть интерпретирована как множитель Лагранжа, определяющий изменение действия (переход потенциальной энергии в кинетическую) после изменения ограниченной траектории частицы. В теории управления это формулируется как уравнения costate .

Более того, по теореме об огибающей оптимальное значение множителя Лагранжа имеет интерпретацию как предельное влияние соответствующей константы ограничения на оптимальное достижимое значение исходной целевой функции: Если обозначить значения в оптимуме звездочкой ( ), то можно показать, что

Например, в экономике оптимальная прибыль игрока рассчитывается с учетом ограниченного пространства действий, где множитель Лагранжа представляет собой изменение оптимального значения целевой функции (прибыли) из-за ослабления заданного ограничения (например, за счет изменения дохода); в таком контексте это предельная стоимость ограничения, и она называется теневой ценой . [15]

Достаточные условия

Достаточные условия для ограниченного локального максимума или минимума могут быть сформулированы в терминах последовательности главных миноров (детерминантов подматриц, выровненных в верхнем левом углу) ограниченной матрицы Гессе вторых производных выражения Лагранжа. [6] [16]

Примеры

Пример 1

Иллюстрация задачи ограниченной оптимизации  1

Предположим, что мы хотим максимизировать при условии ограничения Допустимое множество — это единичная окружность, а множества уровня f диагональные линии (с наклоном −1), поэтому мы можем графически увидеть, что максимум достигается при , а минимум — при

Для метода множителей Лагранжа ограничением является, следовательно, функция Лагранжа, — это функция, которая эквивалентна , когда равна 0 .

Теперь мы можем вычислить градиент: и, следовательно:

Обратите внимание, что последнее уравнение является исходным ограничением.

Первые два уравнения дают Подставляя в последнее уравнение, имеем: итак , что означает, что стационарные точки являются

Оценка целевой функции f в этих точках дает

Таким образом, ограниченный максимум равен , а ограниченный минимум равен .

Пример 2

Иллюстрация задачи ограниченной оптимизации  2

Теперь изменим целевую функцию примера  1 так, чтобы мы минимизировали вместо того, чтобы снова вдоль окружности Теперь множества уровня по-прежнему являются линиями наклона −1, а точки на окружности, касательные к этим множествам уровня, снова и Эти точки касания являются максимумами

С другой стороны, минимумы возникают на уровне, заданном для (поскольку по своей конструкции не может принимать отрицательных значений), при и где кривые уровня не касаются ограничения. Условие, которое правильно определяет все четыре точки как экстремумы; минимумы характеризуются в и максимумы в

Пример 3

Иллюстрация задачи ограниченной оптимизации  3 .

В этом примере используются более сложные вычисления, но это все еще проблема с одним ограничением.

Предположим, что требуется найти максимальные значения при условии, что координаты - и - лежат на окружности вокруг начала координат с радиусом То есть, при условии соблюдения ограничения

Поскольку существует только одно ограничение, существует и один множитель, скажем

Ограничение тождественно равно нулю на окружности радиуса Любое кратное может быть добавлено к оставляя неизменным в интересующей области (на окружности, где наше исходное ограничение выполняется).

Применение обычного метода множителей Лагранжа дает, из которого можно вычислить градиент: И, следовательно: (iii) — это просто исходное ограничение. (i) подразумевает или Если то по (iii) и, следовательно, из (ii). Если подстановка этого в (ii) дает Подстановка этого в (iii) и решение для дает Таким образом, существует шесть критических точек

Оценивая цель в этих точках, можно обнаружить, что

Таким образом, целевая функция достигает глобального максимума (с учетом ограничений) при и глобального минимума при Точка является локальным минимумом и является локальным максимумом , что может быть определено путем рассмотрения матрицы Гессе

Обратите внимание, что в то время как является критической точкой, она не является локальным экстремумом. Мы имеем

При наличии любой окрестности единицы можно выбрать малое положительное и малое любого знака, чтобы получить значения как больше, так и меньше, чем Это также можно увидеть из матрицы Гессе, оцененной в этой точке (или, на самом деле, в любой из критических точек), которая является неопределенной матрицей . Каждая из критических точек является седловой точкой [ 4]

Пример 4 – Энтропия

Предположим, мы хотим найти дискретное распределение вероятностей в точках с максимальной информационной энтропией . Это то же самое, что сказать, что мы хотим найти наименее структурированное распределение вероятностей в точках Другими словами, мы хотим максимизировать уравнение энтропии Шеннона :

Чтобы это было распределением вероятностей, сумма вероятностей в каждой точке должна быть равна 1, поэтому наше ограничение:

Мы используем множители Лагранжа, чтобы найти точку максимальной энтропии среди всех дискретных распределений вероятностей на Мы требуем, чтобы: что дает систему из n уравнений, такую, что:

Проводя дифференцирование этих n уравнений, получаем

Это показывает, что все они равны (потому что зависят только от λ ). Используя ограничение, мы находим

Следовательно, равномерное распределение — это распределение с наибольшей энтропией среди распределений по n точкам.

Пример 5 – Численная оптимизация

Множители Лагранжа приводят к тому, что критические точки возникают в седловых точках (пример  5 ).
Величину градиента можно использовать для того, чтобы заставить критические точки возникнуть в локальных минимумах (пример  5 ).

Критические точки лагранжианов возникают в седловых точках , а не в локальных максимумах (или минимумах). [4] [17] К сожалению, многие методы численной оптимизации, такие как восхождение на холм , градиентный спуск , некоторые из квазиньютоновских методов и другие, предназначены для поиска локальных максимумов (или минимумов), а не седловых точек. По этой причине необходимо либо изменить формулировку, чтобы гарантировать, что это проблема минимизации (например, путем экстремизации квадрата градиента лагранжиана , как показано ниже), либо использовать метод оптимизации, который находит стационарные точки (например, метод Ньютона без поиска линии экстремума ), а не обязательно экстремумы.

В качестве простого примера рассмотрим задачу нахождения значения x , которое минимизирует ограничение таким образом, что (Эта задача несколько нетипична, поскольку существует только два значения, удовлетворяющих этому ограничению, но она полезна для иллюстративных целей, поскольку соответствующую безограниченную функцию можно визуализировать в трех измерениях.)

Используя множители Лагранжа, эту задачу можно преобразовать в задачу безусловной оптимизации:

Две критические точки возникают в седловых точках, где x = 1 и x = −1 .

Чтобы решить эту задачу с помощью численного метода оптимизации, мы должны сначала преобразовать эту задачу таким образом, чтобы критические точки попадали в локальные минимумы. Это делается путем вычисления величины градиента задачи безусловной оптимизации.

Сначала вычисляем частную производную безусловной задачи по каждой переменной:

Если целевая функция не является легко дифференцируемой, дифференциал по каждой переменной можно аппроксимировать как , где — малое значение.

Далее мы вычисляем величину градиента, которая представляет собой квадратный корень из суммы квадратов частных производных:

(Поскольку величина всегда неотрицательна, оптимизация по квадрату величины эквивалентна оптимизации по величине. Таким образом, «квадратный корень» можно исключить из этих уравнений без ожидаемой разницы в результатах оптимизации.)

Критические точки h возникают при x = 1 и x = −1 , как и в Однако, в отличие от критических точек в , критические точки в h возникают в локальных минимумах, поэтому для их поиска можно использовать методы численной оптимизации.

Приложения

Теория управления

В теории оптимального управления множители Лагранжа интерпретируются как сопутствующие переменные, а множители Лагранжа переформулируются как минимизация гамильтониана в принципе минимума Понтрягина .

Нелинейное программирование

Метод множителей Лагранжа имеет несколько обобщений. В нелинейном программировании существует несколько правил множителей, например, правило множителей Каратеодори–Джона и правило выпуклых множителей для ограничений неравенства. [18]

Энергетические системы

Методы, основанные на множителях Лагранжа, применяются в энергосистемах , например, при размещении распределенных энергетических ресурсов (DER) и сбросе нагрузки. [19]

Безопасное обучение с подкреплением

Метод множителей Лагранжа применяется к ограниченным марковским процессам принятия решений. [20] Он естественным образом производит градиентные прямо-двойственные алгоритмы в безопасном обучении с подкреплением. [21]

Нормализованные решения

При рассмотрении задач УЧП с ограничениями, т.е. при изучении свойств нормализованных решений, важную роль играют множители Лагранжа.

Смотрите также

Ссылки

  1. ^ Хоффманн, Лоуренс Д.; Брэдли, Джеральд Л. (2004). Исчисление для бизнеса, экономики, социальных и естественных наук (8-е изд.). С. 575–588. ISBN 0-07-242432-X.
  2. ^ Бивис, Брайан; Доббс, Ян М. (1990). "Статическая оптимизация". Оптимизация и теория устойчивости для экономического анализа . Нью-Йорк: Cambridge University Press. стр. 40. ISBN 0-521-33605-8.
  3. ^ Проттер, Мюррей Х .; Моррей, Чарльз Б. младший (1985). Промежуточный исчисление (2-е изд.). Нью-Йорк, Нью-Йорк: Springer. стр. 267. ISBN 0-387-96058-9.
  4. ^ abc Уолш, GR (1975). "Свойство седловой точки функции Лагранжа". Методы оптимизации . Нью-Йорк, Нью-Йорк: John Wiley & Sons. стр. 39–44. ISBN 0-471-91922-5.
  5. ^ Калман, Дэн (2009). «Выравнивание с помощью Лагранжа: альтернативный взгляд на ограниченную оптимизацию». Mathematics Magazine . 82 (3): 186–196. doi :10.1080/0025570X.2009.11953617. JSTOR  27765899. S2CID  121070192.
  6. ^ ab Silberberg, Eugene; Suen, Wing (2001). Структура экономики: математический анализ (третье изд.). Бостон: Irwin McGraw-Hill. стр. 134–141. ISBN 0-07-234352-4.
  7. ^ де ла Фуэнте , Энджел (2000). Математические методы и модели для экономистов . Кембридж: Издательство Кембриджского университета. стр. 285. doi :10.1017/CBO9780511810756. ISBN 978-0-521-58512-5.
  8. ^ Луенбергер, Дэвид Г. (1969). Оптимизация методами векторного пространства . Нью-Йорк: John Wiley & Sons. С. 188–189.
  9. ^ Берцекас, Димитрий П. (1999). Нелинейное программирование (второе изд.). Кембридж, Массачусетс: Athena Scientific. ISBN 1-886529-00-0.
  10. ^ Вапнярский, И.Б. (2001) [1994], "Множители Лагранжа", Энциклопедия математики , EMS Press.
  11. ^ Ласдон, Леон С. (2002) [1970]. Теория оптимизации для больших систем (переиздание). Минеола, Нью-Йорк, Нью-Йорк: Довер. ISBN 0-486-41999-1. МР  1888251.
  12. ^ Хириар-Уррути, Жан-Батист; Лемарешаль, Клод (1993). «Глава XII: Абстрактная двойственность для практиков». Алгоритмы выпуклого анализа и минимизации . Grundlehren der Mathematischen Wissenschaften [Основные принципы математических наук]. Том. 306. Берлин, Германия: Springer-Verlag. стр. 136–193 (и библиографические комментарии, стр. 334–335). ISBN 3-540-56852-2. MR  1295240. Том II: Расширенная теория и методы пучков.
  13. ^ Лемарешаль, Клод (15–19 мая 2000 г.). «Лагранжева релаксация». В Юнгере, Майкл; Наддеф, Денис (ред.). Вычислительная комбинаторная оптимизация: статьи весенней школы, проходившей в замке Дагштуль . Весенняя школа прошла в замке Дагштуль, 15–19 мая 2000 г. Конспекты лекций по информатике. Том. 2241. Берлин, Германия: Springer-Verlag (опубликовано в 2001 г.). стр. 112–156. дои : 10.1007/3-540-45586-8_4. ISBN 3-540-42877-1. MR  1900016. S2CID  9048698.
  14. ^ Лафонтен, Жак (2015). Введение в дифференциальные многообразия. Springer. стр. 70. ISBN 978-3-319-20735-3.
  15. ^ Диксит, Авинаш К. (1990). «Теневые цены». Оптимизация в экономической теории (2-е изд.). Нью-Йорк: Oxford University Press. С. 40–54. ISBN 0-19-877210-6.
  16. ^ Чианг, Альфа С. (1984). Фундаментальные методы математической экономики (третье изд.). McGraw-Hill. стр. 386. ISBN 0-07-010813-7.
  17. ^ Хит, Майкл Т. (2005). Научные вычисления: вводный обзор. McGraw-Hill. стр. 203. ISBN 978-0-07-124489-3.
  18. ^ Pourciau, Bruce H. (1980). «Современные правила множителей». American Mathematical Monthly . 87 (6): 433–452. doi :10.2307/2320250. JSTOR  2320250.
  19. ^ Гаутам, Мукеш; Бхусал, Нараян; Бенидрис, Мохаммед (2020). Подход на основе чувствительности к адаптивному отключению нагрузки при пониженной частоте . Техасская конференция по энергетике и электротехнике IEEE 2020 г. (TPEC). Институт инженеров-электронщиков и электротехников . стр. 1–5. doi :10.1109/TPEC48276.2020.9042569.
  20. ^ Альтман, Эйтан (2021). Ограниченные марковские процессы принятия решений . Routledge .
  21. ^ Дин, Дуншэн; Чжан, Кайцин; Йованович, Михайло; Басар, Тамер (2020). Прямо-двойственный метод градиента естественной политики для ограниченных марковских процессов принятия решений . Достижения в области нейронных систем обработки информации.

Дальнейшее чтение

Внешние ссылки

Экспозиция

Дополнительный текст и интерактивные апплеты