stringtranslate.com

Множитель Лагранжа

В математической оптимизации метод множителей Лагранжа представляет собой стратегию поиска локальных максимумов и минимумов функции с учетом ограничений уравнения (т . е. при условии, что одно или несколько уравнений должны точно удовлетворяться выбранными значениями переменных) . ). [1] Он назван в честь математика Жозефа-Луи Лагранжа .

Резюме и обоснование

Основная идея состоит в том, чтобы преобразовать задачу с ограничениями в такую ​​форму, в которой все еще можно было бы применить тест производной задачи без ограничений. Связь между градиентом функции и градиентами ограничений довольно естественно приводит к переформулировке исходной задачи, известной как функция Лагранжа . [2] В общем случае лагранжиан определяется как

для функций ; называется множителем Лагранжа.

В простом случае это упрощается до

Метод можно резюмировать следующим образом: чтобы найти максимум или минимум функции, на которую распространяется ограничение равенства , найдите стационарные точки рассматриваемой как функции и множителя Лагранжа . Это означает, что все частные производные должны быть равны нулю, включая частную производную по . [3]

и

или эквивалентно

и

Решение, соответствующее исходной оптимизации с ограничениями, всегда является седловой точкой функции Лагранжа, [4] [5] которую можно выделить среди стационарных точек по определенности ограниченной матрицы Гессе . [6]

Большим преимуществом этого метода является то, что он позволяет решать оптимизацию без явной параметризации с точки зрения ограничений. В результате метод множителей Лагранжа широко используется для решения сложных задач оптимизации с ограничениями. Далее метод множителей Лагранжа обобщается условиями Каруша–Куна–Таккера , которые также могут учитывать ограничения-неравенства вида для заданной константы .

Заявление

Следующее утверждение известно как теорема о множителе Лагранжа. [7]

Пусть – целевая функция, – функция ограничений, обе из которых принадлежат (т. е. имеют непрерывные первые производные). Пусть – оптимальное решение следующей задачи оптимизации такое, что для матрицы частных производных , :

Тогда существует уникальный множитель Лагранжа, такой что (Обратите внимание, что это несколько традиционная вещь, которая явно рассматривается как вектор-столбец, чтобы гарантировать совпадение размеров. Но мы могли бы с тем же успехом сделать его просто вектором-строкой, не принимая транспонирование) .

Теорема о множителе Лагранжа утверждает, что в любом локальном максимуме (или минимуме) функции, оцениваемой при ограничениях равенства, если применяется квалификация ограничения (поясняется ниже), то градиент функции (в этой точке) может быть выражен как линейная комбинация градиентов ограничений (в этой точке), при этом множители Лагранжа действуют как коэффициенты . [8] Это эквивалентно утверждению, что любое направление, перпендикулярное всем градиентам ограничений, также перпендикулярно градиенту функции. Или еще сказать, что производная функции по направлению равна 0 во всех возможных направлениях.

Единое ограничение

Рисунок 1: Красная кривая показывает ограничение g ( x , y ) = c . Синие кривые — это контуры f ( x , y ) . Точка, в которой красное ограничение по касательной касается синего контура, является максимумом f ( x , y ) вдоль ограничения, поскольку d 1 > d 2 .

Для случая только одного ограничения и только двух переменных выбора (как показано на рисунке 1), рассмотрим задачу оптимизации

(Иногда аддитивная константа отображается отдельно, а не включается в , и в этом случае ограничение записывается , как показано на рисунке 1.) Мы предполагаем, что оба и имеют непрерывные первые частные производные . Мы вводим новую переменную ( ), называемую множителем Лагранжа (или неопределенным множителем Лагранжа ), и изучаем функцию Лагранжа (или лагранжиан или выражение Лагранжа ), определяемую формулой

где термин может быть добавлен или вычтен. If является максимумом для исходной задачи с ограничениями, и тогда существует такое, что ( ) является стационарной точкой для функции Лагранжа (стационарные точки - это те точки, где первые частные производные равны нулю). Это предположение называется квалификацией ограничений. Однако не все стационарные точки дают решение исходной задачи, поскольку метод множителей Лагранжа дает лишь необходимое условие оптимальности в задачах с ограничениями. [9] [10] [11] [12] [13] Также существуют достаточные условия для минимума или максимума , но если конкретное решение-кандидат удовлетворяет достаточным условиям, гарантируется только то, что это решение является лучшим локально - что то есть это лучше, чем любые допустимые близлежащие точки. Глобальный оптимум можно найти путем сравнения значений исходной целевой функции в точках, удовлетворяющих необходимым и локально достаточным условиям .

Метод множителей Лагранжа основан на интуитивном понимании того, что в максимуме f ( x , y ) не может увеличиваться в направлении любой такой соседней точки, которая также имеет g = 0 . Если бы это было так, мы могли бы идти по g = 0 , чтобы подняться выше, а это означало бы, что отправная точка на самом деле не была максимальной. С этой точки зрения, это точный аналог проверки того, равна ли производная неограниченной функции 0 , то есть мы проверяем, что производная по направлению равна 0 в любом соответствующем (жизнеспособном) направлении.

Мы можем визуализировать контуры f , заданные как f ( x , y ) = d для различных значений d , и контур g , заданный g ( x , y ) = c .

Предположим, мы идем по контурной линии с g = c . Нас интересует поиск точек, в которых f почти не меняется при ходьбе, поскольку эти точки могут быть максимумами.

Это может произойти двумя способами:

  1. Мы могли бы коснуться контурной линии f , поскольку по определению f не меняется, когда мы идем по ее контурным линиям. Это означало бы, что касательные к контурным линиям f и g здесь параллельны.
  2. Мы достигли «ровной» части f , что означает, что f не меняется ни в каком направлении.

Чтобы проверить первую возможность (мы касаемся контурной линии f ), обратите внимание, что, поскольку градиент функции перпендикулярен контурным линиям, касательные к контурным линиям f и g параллельны тогда и только тогда, когда градиенты f и g параллельны. Таким образом, нам нужны точки ( x , y ) , где g ( x , y ) = c и

для некоторых

где

являются соответствующими градиентами. Константа необходима, поскольку, хотя два вектора градиента параллельны, величины векторов градиента обычно не равны. Эта константа называется множителем Лагранжа. (В некоторых соглашениях перед словом ставится знак минус).

Обратите внимание, что этот метод также решает вторую возможность, что f является уровнем: если f является уровнем, то его градиент равен нулю, и установка является решением независимо от .

Чтобы объединить эти условия в одно уравнение, введем вспомогательную функцию

и решить

Обратите внимание, что это равносильно решению трех уравнений с тремя неизвестными. Это метод множителей Лагранжа.

Обратите внимание, что подразумевается , что частная производная по

Обобщить

Метод легко обобщается на функции от переменных.

что представляет собой решение n + 1 уравнений с n + 1 неизвестными.

Ограниченные экстремумы f являются критическими точками лагранжиана , но они не обязательно являются локальными экстремумами ( см. пример 2 ниже).

Можно переформулировать лагранжиан как гамильтониан , и в этом случае решения являются локальными минимумами гамильтониана. Это сделано в теории оптимального управления , в форме принципа минимума Понтрягина .

Тот факт, что решения метода множителей Лагранжа не обязательно являются экстремумами лагранжиана, также создает трудности для численной оптимизации. Эту проблему можно решить, минимизировав величину градиента лагранжиана, поскольку эти минимумы совпадают с нулями величины, как показано в примере 5: Численная оптимизация.

Множественные ограничения

Рисунок 2: Параболоид, ограниченный двумя пересекающимися линиями.
Рисунок 3: Контурная карта рисунка 2.

Метод множителей Лагранжа можно расширить для решения задач с несколькими ограничениями, используя аналогичный аргумент. Рассмотрим параболоид , на который наложены два ограничения на линии, пересекающиеся в одной точке. Поскольку это единственное возможное решение, эта точка, очевидно, является ограниченным экстремумом. Однако набор уровней явно не параллелен ни одному из ограничений в точке пересечения (см. рисунок 3); вместо этого это линейная комбинация градиентов двух ограничений. В случае нескольких ограничений именно это мы и ищем в целом: метод Лагранжа ищет точки, не в которых градиент обязательно кратен градиенту любого отдельного ограничения, а в которых он представляет собой линейную комбинацию всех ограничений. градиенты.

Конкретно, предположим, что у нас есть ограничения и мы идем по множеству точек, удовлетворяющих условиям. Каждая точка на контуре данной ограничительной функции имеет пространство допустимых направлений: пространство векторов, перпендикулярных множеству направлений, которые разрешены всеми ограничениями, таким образом, пространство направлений, перпендикулярных всем градиентам ограничений. Обозначим это пространство допустимых ходов через и обозначим диапазон градиентов ограничений через Тогда пространство векторов, перпендикулярных каждому элементу

Нас по-прежнему интересует поиск точек, в которых изменения не меняются при движении, поскольку эти точки могут быть (ограниченными) экстремумами. Поэтому мы ищем такое, чтобы любое допустимое направление движения от было перпендикулярно к (в противном случае мы могли бы увеличиться , двигаясь вдоль этого допустимого направления). Другими словами, Таким образом, существуют скаляры такие, что

Эти скаляры являются множителями Лагранжа. Теперь они у нас есть, по одному на каждое ограничение.

Как и раньше, введем вспомогательную функцию

и решить

что сводится к решению уравнений с неизвестными.

Допущение квалификации ограничений при наличии нескольких ограничений заключается в том, что градиенты ограничений в соответствующей точке линейно независимы.

Современная формулировка с помощью дифференцируемых многообразий

Проблему поиска локальных максимумов и минимумов с учетом ограничений можно обобщить до поиска локальных максимумов и минимумов на дифференцируемом многообразии [14] . В дальнейшем не обязательно, чтобы это было евклидово пространство или даже риманово многообразие. Все проявления градиента (зависящие от выбора римановой метрики) можно заменить внешней производной

Единое ограничение

Пусть — гладкое многообразие размерности. Предположим, что мы хотим найти стационарные точки гладкой функции, ограниченной подмногообразием, определяемым формулой где — гладкая функция, для которой 0регулярное значение .

Позвольте и быть внешними производными и . Стационарность при ограничении означает . Эквивалентно ядро ​​содержит . Другими словами, и являются пропорциональными 1-формами. Для этого необходимо и достаточно, чтобы выполнялась следующая система уравнений:

где обозначает внешний продукт . Стационарные точки являются решениями приведенной выше системы уравнений плюс ограничение. Обратите внимание, что уравнения не являются независимыми, поскольку левая часть уравнения принадлежит подмногообразию, состоящему из разложимых элементов .

В этой формулировке нет необходимости явно находить множитель Лагранжа, число такое, что

Множественные ограничения

Пусть и будут такими же, как в предыдущем разделе относительно случая одного ограничения. Вместо описанной там функции теперь рассмотрим гладкую функцию с компонентными функциями , для которой является регулярным значением . Пусть – подмногообразие определенного

является стационарной точкой тогда и только тогда, когда содержит . Для удобства пусть и где обозначает касательное отображение или якобиан. Подпространство имеет размерность меньшую, чем размерность , а именно, и принадлежит тогда и только тогда, когда принадлежит образу. Говоря вычислительным языком, условие состоит в том, что принадлежит пространству строк матрицы или, что эквивалентно, пространству столбцов матрицы (транспонирования). If обозначает внешнее произведение столбцов матрицы стационарного условия для at становится

Еще раз: в этой формулировке нет необходимости явно находить множители Лагранжа — числа такие, что

Интерпретация множителей Лагранжа

В этом разделе мы изменяем форму уравнений ограничений к форме, где m действительные константы, которые считаются дополнительными аргументами выражения Лагранжа .

Часто множители Лагранжа интерпретируются как некоторая процентная величина. Например, параметризовав контурную линию ограничения, то есть, если выражение Лагранжа равно

затем

Итак, λ k — скорость изменения оптимизируемой величины в зависимости от параметра ограничения. Например, в лагранжевой механике уравнения движения выводятся путем нахождения стационарных точек действия , интеграла по времени от разницы между кинетической и потенциальной энергией. Таким образом, силу, действующую на частицу вследствие скалярного потенциала, F = −∇ V , можно интерпретировать как множитель Лагранжа, определяющий изменение действия (переход потенциала в кинетическую энергию) после изменения ограниченной траектории частицы. В теории управления это формулируется вместо этого как уравнения стоимости .

Более того, согласно теореме о конверте оптимальное значение множителя Лагранжа интерпретируется как предельное влияние соответствующей константы ограничения на оптимально достижимое значение исходной целевой функции: Если мы обозначим оптимальные значения звездочкой ( ), то можно показать, что

Например, в экономике оптимальная прибыль игрока рассчитывается при условии ограниченного пространства действий, где множителем Лагранжа является изменение оптимального значения целевой функции (прибыли) вследствие ослабления заданного ограничения (например, за счет изменение дохода); в таком контексте — это предельная стоимость ограничения, и ее называют теневой ценой . [15]

Достаточные условия

Достаточные условия для ограниченного локального максимума или минимума могут быть сформулированы в терминах последовательности главных миноров (определителей выровненных в верхнем левом углу подматриц) граничной матрицы Гессе вторых производных выражения Лагранжа. [6] [16]

Примеры

Пример 1

Иллюстрация задачи оптимизации с ограничениями  1

Предположим, мы хотим максимизировать с учетом ограничения. Допустимое множество — это единичный круг, а множества уровня f это диагональные линии (с наклоном −1), поэтому мы можем графически видеть, что максимум происходит в точке, а минимум — в точке.

Для метода множителей Лагранжа ограничение имеет вид

следовательно, функция Лагранжа,

— это функция, которая эквивалентна функции, когда установлено значение 0 .

Теперь мы можем рассчитать градиент:

и поэтому:

Обратите внимание, что последнее уравнение является исходным ограничением.

Первые два уравнения дают

Подставив в последнее уравнение, получим:

так

откуда следует, что стационарные точки

Оценка целевой функции f в этих точках дает

Таким образом, ограниченный максимум равен , а ограниченный минимум равен .

Пример 2

Иллюстрация задачи оптимизации  2 с ограничениями

Теперь мы модифицируем целевую функцию из примера  1 так, чтобы мы минимизировали , а не снова вдоль окружности. Теперь множества уровней по-прежнему являются линиями наклона -1, а точки на окружности, касающиеся этих наборов уровней, снова и Эти точки касания максимумы

С другой стороны, минимумы возникают на уровне, заданном для (поскольку по его построению не могут принимать отрицательные значения), в и где кривые уровня не касаются ограничения. Условие, которое правильно идентифицирует все четыре точки как экстремумы; минимумы характеризуются , а максимумы –

Пример 3

Иллюстрация задачи ограниченной оптимизации  3 .

В этом примере рассматриваются более сложные вычисления, но это по-прежнему проблема с одним ограничением.

Предположим, кто-то хочет найти максимальные значения

с условием, что координаты - и - лежат на окружности вокруг начала координат с радиусом. То есть при условии соблюдения ограничения

Поскольку существует только одно ограничение, существует один множитель, скажем

Ограничение тождественно равно нулю на окружности радиуса. Любое кратное может быть добавлено к оставлению неизменным в интересующей области (на окружности, где удовлетворяется наше исходное ограничение).

Применение обычного метода множителей Лагранжа дает

из которого можно вычислить градиент:

И поэтому:

(iii) является исходным ограничением. (i) подразумевает или Если то из (iii) и, следовательно, из (ii). Подстановка этого в (ii) дает результат. Подстановка этого в (iii) и решение дает. Таким образом, существует шесть критических точек

Оценивая цель в этих точках, можно обнаружить, что

Таким образом, целевая функция достигает глобального максимума (с учетом ограничений) в и глобального минимума в. Точка является локальным минимумом и является локальным максимумом для того, что может быть определено путем рассмотрения матрицы Гессе

Обратите внимание, что это критическая точка, которая не является локальным экстремумом.

Учитывая любую окрестность одного, можно выбрать маленькое положительное и маленькое значение любого знака, чтобы получить значения как большие, так и меньшие, чем. Это также можно увидеть из матрицы Гессе, оцененной в этой точке (или даже в любой из критических точек), которая неопределенная матрица . Каждая из критических точек является седловой точкой [ 4]

Пример 4

Энтропия

Предположим, мы хотим найти дискретное распределение вероятностей в точках с максимальной информационной энтропией . Это то же самое, что сказать, что мы хотим найти наименее структурированное распределение вероятностей в точках . Другими словами, мы хотим максимизировать уравнение энтропии Шеннона :

Чтобы это было распределение вероятностей, сумма вероятностей в каждой точке должна равняться 1, поэтому наше ограничение:

Мы используем множители Лагранжа, чтобы найти точку максимальной энтропии для всех дискретных распределений вероятностей. Мы требуем, чтобы:

что дает систему из n уравнений, такую ​​что:

Проведя дифференцирование этих n уравнений, получим

Это показывает, что все они равны (поскольку они зависят только от λ ). Используя ограничение

мы нашли

Следовательно, равномерное распределение — это распределение с наибольшей энтропией среди распределений по n точкам.

Пример 5

Численная оптимизация
Множители Лагранжа приводят к тому, что критические точки возникают в седловых точках (пример  5 ).
Величину градиента можно использовать для того, чтобы критические точки находились в локальных минимумах (Пример  5 ).

Критические точки лагранжиана возникают в седловых точках , а не в локальных максимумах (или минимумах). [4] [17] К сожалению, многие методы численной оптимизации, такие как восхождение на холм , градиентный спуск , некоторые квазиньютоновские методы и другие, предназначены для поиска локальных максимумов (или минимумов), а не седловых точек. По этой причине необходимо либо изменить формулировку, чтобы гарантировать, что это задача минимизации (например, путем экстремизации квадрата градиента лагранжиана , как показано ниже), либо использовать метод оптимизации, который находит стационарные точки (например, метод Ньютона без экстремума поиск строки ) и не обязательно экстремумов.

В качестве простого примера рассмотрим задачу нахождения значения x , которое минимизирует ограничение так, что (Эта задача несколько нетипична, поскольку есть только два значения, которые удовлетворяют этому ограничению, но она полезна для целей иллюстрации, поскольку соответствующая неограниченная функция может быть визуализируется в трех измерениях.)

Используя множители Лагранжа, эту задачу можно преобразовать в задачу неограниченной оптимизации:

Две критические точки возникают в седловых точках, где x = 1 и x = −1 .

Чтобы решить эту проблему с помощью метода численной оптимизации, мы должны сначала преобразовать эту проблему так, чтобы критические точки находились в локальных минимумах. Это делается путем вычисления величины градиента задачи неограниченной оптимизации.

Сначала мы вычисляем частную производную задачи без ограничений по каждой переменной:

Если целевая функция не является легко дифференцируемой, дифференциал по каждой переменной можно аппроксимировать как

где небольшое значение.

Далее мы вычисляем величину градиента, которая представляет собой квадратный корень из суммы квадратов частных производных:

(Поскольку величина всегда неотрицательна, оптимизация по квадрату величины эквивалентна оптимизации по величине. Таким образом, «квадратный корень» можно опустить в этих уравнениях без ожидаемой разницы в результатах оптимизации.)

Критические точки h встречаются в точках x = 1 и x = −1 , как и в случае, когда в отличие от критических точек , критические точки h встречаются в локальных минимумах, поэтому для их поиска можно использовать методы численной оптимизации.

Приложения

Теория управления

В теории оптимального управления множители Лагранжа интерпретируются как переменные стоимости , а множители Лагранжа переформулируются как минимизация гамильтониана в принципе минимума Понтрягина .

Нелинейное программирование

Метод множителей Лагранжа имеет несколько обобщений. В нелинейном программировании существует несколько правил множителей, например правило множителей Каратеодори – Джона и правило выпуклых множителей, для ограничений-неравенств. [18]

Энергетические системы

Методы, основанные на множителях Лагранжа, находят применение в энергосистемах , например, при размещении распределенных энергетических ресурсов (DER) и сбросе нагрузки. [19]

Безопасное обучение с подкреплением

Метод множителей Лагранжа применяется к марковским процессам принятия решений с ограничениями. [20] Естественно, он создает основанные на градиенте первичные двойственные алгоритмы в безопасном обучении с подкреплением. [21]

Смотрите также

Рекомендации

  1. ^ Хоффманн, Лоуренс Д.; Брэдли, Джеральд Л. (2004). Исчисление для бизнеса, экономики, социальных наук и наук о жизни (8-е изд.). стр. 575–588. ISBN 0-07-242432-Х.
  2. ^ Бивис, Брайан; Доббс, Ян М. (1990). «Статическая оптимизация». Теория оптимизации и устойчивости для экономического анализа . Нью-Йорк: Издательство Кембриджского университета. п. 40. ISBN 0-521-33605-8.
  3. ^ Проттер, Мюррей Х .; Морри, Чарльз Б. младший (1985). Промежуточное исчисление (2-е изд.). Нью-Йорк, штат Нью-Йорк: Спрингер. п. 267. ИСБН 0-387-96058-9.
  4. ^ abc Уолш, Греция (1975). «Свойство перевала функции Лагранжа». Методы оптимизации . Нью-Йорк, штат Нью-Йорк: Джон Уайли и сыновья. стр. 39–44. ISBN 0-471-91922-5.
  5. ^ Кальман, Дэн (2009). «Выравнивание с помощью Лагранжа: альтернативный взгляд на оптимизацию с ограничениями». Журнал «Математика» . 82 (3): 186–196. дои : 10.1080/0025570X.2009.11953617. JSTOR  27765899. S2CID  121070192.
  6. ^ аб Зильберберг, Юджин; Суен, Винг (2001). Структура экономики: математический анализ (Третье изд.). Бостон: Ирвин МакГроу-Хилл. стр. 134–141. ISBN 0-07-234352-4.
  7. ^ де ла Фуэнте , Анхель (2000). Математические методы и модели для экономистов . Кембридж: Издательство Кембриджского университета. п. 285. дои : 10.1017/CBO9780511810756. ISBN 978-0-521-58512-5.
  8. ^ Люенбергер, Дэвид Г. (1969). Оптимизация методами векторного пространства . Нью-Йорк: Джон Уайли и сыновья. стр. 188–189.
  9. ^ Берцекас, Дмитрий П. (1999). Нелинейное программирование (Второе изд.). Кембридж, Массачусетс: Athena Scientific. ISBN 1-886529-00-0.
  10. ^ Вапнярский, И.Б. (2001) [1994], «Множители Лагранжа», Энциклопедия математики , EMS Press.
  11. ^ Ласдон, Леон С. (2002) [1970]. Теория оптимизации для больших систем (переиздание). Минеола, Нью-Йорк, Нью-Йорк: Дувр. ISBN 0-486-41999-1. МР  1888251.
  12. ^ Хириар-Уррути, Жан-Батист; Лемарешаль, Клод (1993). «Глава XII: Абстрактная двойственность для практиков». Алгоритмы выпуклого анализа и минимизации . Grundlehren der Mathematischen Wissenschaften [Основные принципы математических наук]. Том. 306. Берлин, Германия: Springer-Verlag. стр. 136–193 (и библиографические комментарии, стр. 334–335). ISBN 3-540-56852-2. MR  1295240. Том II: Расширенная теория и пакетные методы.
  13. ^ Лемарешаль, Клод (15–19 мая 2000 г.). «Лагранжева релаксация». В Юнгере, Майкл; Наддеф, Денис (ред.). Вычислительная комбинаторная оптимизация: статьи весенней школы, проходившей в замке Дагштуль . Весенняя школа прошла в замке Дагштуль, 15–19 мая 2000 г. Конспекты лекций по информатике. Том. 2241. Берлин, Германия: Springer-Verlag (опубликовано в 2001 г.). стр. 112–156. дои : 10.1007/3-540-45586-8_4. ISBN 3-540-42877-1. MR  1900016. S2CID  9048698.
  14. ^ Лафонтен, Жак (2015). Введение в дифференциальные многообразия. Спрингер. п. 70. ИСБН 978-3-319-20735-3.
  15. ^ Диксит, Авинаш К. (1990). «Теневые цены». Оптимизация в экономической теории (2-е изд.). Нью-Йорк: Издательство Оксфордского университета. стр. 40–54. ISBN 0-19-877210-6.
  16. ^ Чан, Альфа К. (1984). Фундаментальные методы математической экономики (Третье изд.). МакГроу-Хилл. п. 386. ИСБН 0-07-010813-7.
  17. ^ Хит, Майкл Т. (2005). Научные вычисления: вводный обзор. МакГроу-Хилл. п. 203. ИСБН 978-0-07-124489-3.
  18. ^ Пурсио, Брюс Х. (1980). «Современные правила мультипликатора». Американский математический ежемесячник . 87 (6): 433–452. дои : 10.2307/2320250. JSTOR  2320250.
  19. ^ Гаутам, Мукеш; Бхусал, Нараян; Бенидрис, Мохаммед (2020). Подход, основанный на чувствительности, к адаптивному отключению нагрузки при пониженной частоте . Техасская конференция по энергетике и энергетике IEEE 2020 (TPEC). Институт инженеров электроники и электротехники . стр. 1–5. дои : 10.1109/TPEC48276.2020.9042569.
  20. ^ Альтман, Эйтан (2021). Марковские процессы принятия решений с ограничениями . Рутледж .
  21. ^ Дин, Дуншэн; Чжан, Кайцин; Йованович, Михайло; Басар, Тамер (2020). Первично-двойственный метод градиента естественной политики для марковских процессов принятия решений с ограничениями . Достижения в области нейронных систем обработки информации.

дальнейшее чтение

Внешние ссылки

Экспозиция
Дополнительный текст и интерактивные апплеты