stringtranslate.com

Линейно-квадратично-гауссово управление

В теории управления задача линейно-квадратично-гауссова ( LQG ) управления является одной из наиболее фундаментальных задач оптимального управления , и ее также можно многократно использовать для управления моделью с прогнозированием . Речь идет о линейных системах, управляемых аддитивным белым гауссовским шумом . Задача состоит в том, чтобы определить закон обратной связи по выходу, оптимальный в смысле минимизации ожидаемого значения квадратичного критерия стоимости . Предполагается, что выходные измерения искажены гауссовским шумом, а исходное состояние также считается гауссовским случайным вектором.

При этих предположениях оптимальная схема управления в классе линейных законов управления может быть получена с помощью аргумента пополнения квадратов. [1] Этот закон управления, известный как LQG- контроллер, уникален и представляет собой просто комбинацию фильтра Калмана (линейно-квадратичной оценки состояния (LQE)) вместе с линейно-квадратичным регулятором (LQR). Принцип разделения гласит, что средство оценки состояния и обратная связь по состоянию могут разрабатываться независимо. Управление LQG применяется как к линейным, не зависящим от времени системам , так и к линейным изменяющимся во времени системам и представляет собой закон управления с линейной динамической обратной связью, который легко вычисляется и реализуется: контроллер LQG сам по себе является динамической системой, подобной системе, которой он управляет. Обе системы имеют одинаковое государственное измерение.

Более глубокая формулировка принципа разделения заключается в том, что LQG-регулятор по-прежнему оптимален в более широком классе возможных нелинейных регуляторов. То есть использование нелинейной схемы управления не улучшит ожидаемое значение функции стоимости. Эта версия принципа разделения является частным случаем принципа разделения стохастического управления , который гласит, что даже когда источники шума процесса и выходного шума, возможно, являются негауссовскими мартингалами , пока динамика системы линейна, оптимальное управление разделяется на оценщик оптимального состояния (который больше не может быть фильтром Калмана) и регулятор LQR. [2] [3]

В классической настройке LQG реализация контроллера LQG может быть проблематичной, когда размерность состояния системы велика. Проблема LQG уменьшенного порядка (проблема LQG фиксированного порядка) преодолевает это за счет априорного фиксирования количества состояний контроллера LQG. Эту проблему решить труднее, поскольку она уже неразделима. Кроме того, решение больше не является уникальным. Несмотря на эти факты, доступны численные алгоритмы [4] [5] [6] [7] для решения соответствующих уравнений оптимального проецирования [8] [9] , которые составляют необходимые и достаточные условия для локально оптимального LQG-контроллера пониженного порядка. [4]

Оптимальность LQG не обеспечивает автоматически хорошие характеристики надежности. [10] Устойчивость замкнутой системы должна быть проверена отдельно после проектирования контроллера LQG. Для повышения надежности некоторые параметры системы можно считать стохастическими, а не детерминированными. Соответствующая более сложная задача управления приводит к аналогичному оптимальному регулятору, у которого различаются только параметры регулятора. [5]

Можно вычислить ожидаемое значение функции стоимости для оптимального выигрыша, а также для любого другого набора стабильных выигрышей. [11]

Контроллер LQG также используется для управления возмущенными нелинейными системами. [12]

Математическое описание задачи и решение

Непрерывное время

Рассмотрим линейную динамическую систему с непрерывным временем

где представляет собой вектор переменных состояния системы, вектор управляющих входов и вектор измеряемых выходов, доступных для обратной связи. На систему влияют как аддитивный белый гауссов шум системы , так и аддитивный белый гауссов шум измерений . В этой системе цель состоит в том, чтобы найти историю управляющих входов , которая в каждый момент времени может линейно зависеть только от прошлых измерений, так что следующая функция стоимости минимизируется:

где обозначает ожидаемое значение . Конечное время (горизонт) может быть как конечным, так и бесконечным. Если горизонт стремится к бесконечности, первый член функции стоимости становится незначительным и не имеет отношения к задаче. Кроме того, чтобы затраты были конечными, функцию стоимости необходимо принять равной .

Контроллер LQG, который решает задачу управления LQG, определяется следующими уравнениями:

Матрица называется коэффициентом усиления Калмана соответствующего фильтра Калмана, представленного первым уравнением. Каждый раз этот фильтр генерирует оценки состояния, используя прошлые измерения и входные данные. Усиление Калмана вычисляется на основе матриц : двух матриц интенсивности , связанных с белыми гауссовскими шумами , и , наконец , . Эти пять матриц определяют коэффициент усиления Калмана посредством следующего связанного матричного дифференциального уравнения Риккати:

Учитывая решение, выигрыш Калмана равен

Матрица называется матрицей усиления обратной связи . Эта матрица определяется матрицами и следующим связанным с ними матричным дифференциальным уравнением Риккати:

Учитывая решение, коэффициент обратной связи равен

Обратите внимание на сходство двух матричных дифференциальных уравнений Риккати: первое движется вперед во времени, второе — назад во времени. Это сходство называется двойственностью . Первое матричное дифференциальное уравнение Риккати решает линейно-квадратическую задачу оценивания (LQE). Второе матричное дифференциальное уравнение Риккати решает задачу линейно-квадратичного регулятора (LQR). Эти задачи двойственны и вместе они решают задачу линейно-квадратично-гауссовского управления (ЛКГ). Таким образом, проблема LQG разделяется на проблемы LQE и LQR, которые можно решить независимо. Поэтому задача ЛКГ называется сепарабельной .

Когда и матрицы интенсивности шума , не зависят от и когда стремятся к бесконечности, ЛКГ-регулятор становится стационарной динамической системой. В этом случае второе матричное дифференциальное уравнение Риккати может быть заменено соответствующим алгебраическим уравнением Риккати .

Дискретное время

Поскольку задача управления LQG в дискретном времени аналогична задаче управления в непрерывном времени, описание ниже сосредоточено на математических уравнениях.

Уравнения линейной системы с дискретным временем имеют вид

Здесь представлен индекс дискретного времени и представлены процессы гауссовского белого шума с дискретным временем с ковариационными матрицами соответственно и независимы друг от друга.

Квадратичная функция стоимости, которую необходимо минимизировать, равна

Контроллер LQG с дискретным временем

,

и соответствует прогнозной оценке .

Выигрыш Калмана равен

где определяется следующим матричным разностным уравнением Риккати, действующим во времени:

Матрица усиления обратной связи равна

где определяется следующим матричным разностным уравнением Риккати, которое работает в обратном направлении во времени:

Если все матрицы в формулировке задачи инвариантны ко времени и если горизонт стремится к бесконечности, контроллер LQG с дискретным временем становится инвариантным ко времени. В этом случае матричные разностные уравнения Риккати могут быть заменены соответствующими алгебраическими уравнениями Риккати в дискретном времени . Они определяют неизменяемый во времени линейно-квадратичный оценщик и неизменяемый во времени линейно-квадратичный регулятор в дискретном времени. В этом случае необходимо учитывать расходы, чтобы сохранить конечные затраты .

Смотрите также

Рекомендации

  1. ^ Карл Йохан Астром (1970). Введение в стохастическую теорию управления . Том. 58. Академическая пресса. ISBN 0-486-44531-3.
  2. ^ Андерс Линдквист (1973). «Об управлении линейными стохастическими системами с обратной связью». SIAM Journal по контролю . 11 (2): 323–343. дои : 10.1137/0311025..
  3. ^ Трифон Т. Георгиу и Андерс Линдквист (2013). «Принцип разделения в стохастическом управлении, Redux». Транзакции IEEE при автоматическом управлении . 58 (10): 2481–2494. arXiv : 1103.3005 . дои : 10.1109/TAC.2013.2259207. S2CID  12623187.
  4. ^ аб Ван Виллигенбург LG; Де Конинг В.Л. (2000). «Численные алгоритмы и вопросы, касающиеся уравнений оптимального проецирования в дискретном времени». Европейский журнал контроля . 6 (1): 93–100. дои : 10.1016/s0947-3580(00)70917-4.Сопутствующее программное обеспечение можно загрузить с Matlab Central.
  5. ^ аб Ван Виллигенбург LG; Де Конинг В.Л. (1999). «Оптимальные компенсаторы пониженного порядка для нестационарных дискретных систем с детерминированными параметрами и параметрами белого». Автоматика . 35 : 129–138. дои : 10.1016/S0005-1098(98)00138-1.Сопутствующее программное обеспечение можно загрузить с Matlab Central.
  6. ^ Зигич Д.; Уотсон Л.Т.; Коллинз Э.Г.; Хаддад В.М.; Ин С. (1996). «Гомотопические методы решения уравнений оптимального проецирования для задачи модели пониженного порядка H2». Международный журнал контроля . 56 (1): 173–191. дои : 10.1080/00207179208934308.
  7. ^ Коллинз-младший Э.Г.; Хаддад В.М.; Ин С. (1996). «Гомотопический алгоритм для динамической компенсации пониженного порядка с использованием уравнений оптимальной проекции Хайланда-Бернштейна». Журнал управления, контроля и динамики . 19 (2): 407–417. дои : 10.2514/3.21633.
  8. ^ Хайленд, округ Колумбия; Бернштейн Д.С. (1984). «Оптимальные уравнения проекции для динамической компенсации фиксированного порядка» (PDF) . Транзакции IEEE при автоматическом управлении . AC-29 (11): 1034–1037. дои : 10.1109/TAC.1984.1103418. hdl : 2027.42/57875 .
  9. ^ Бернштейн Д.С.; Дэвис Л.Д.; Хайленд, округ Колумбия (1986). «Оптимальные проекционные уравнения для оценки и управления моделированием в дискретном времени пониженного порядка» (PDF) . Журнал управления, контроля и динамики . 9 (3): 288–293. Бибкод : 1986JGCD....9..288B. дои : 10.2514/3.20105. hdl : 2027.42/57880 .
  10. ^ Грин, Майкл; Лаймбир, Дэвид Дж. Н. (1995). Линейное робастное управление. Энглвуд Клиффс: Прентис Холл. п. 27. ISBN 0-13-102278-4.
  11. Мацакис, Деметриос (8 марта 2019 г.). «Влияние стратегий пропорционального управления на поведение управляемых часов». Метрология . 56 (2): 025007. Бибкод : 2019Метро..56b5007M. дои : 10.1088/1681-7575/ab0614 .
  12. ^ Атанс М. (1971). «Роль и использование стохастической линейно-квадратично-гауссовой задачи при проектировании систем управления». Транзакции IEEE при автоматическом управлении . AC-16 (6): 529–552. дои : 10.1109/TAC.1971.1099818.

дальнейшее чтение