stringtranslate.com

Линейно-квадратично-гауссовское управление

В теории управления линейно -квадратично-гауссовская ( LQG ) задача управления является одной из самых фундаментальных задач оптимального управления , и она также может многократно использоваться для управления с прогнозированием модели . Она касается линейных систем, управляемых аддитивным белым гауссовым шумом . Задача состоит в определении закона обратной связи на выходе, который является оптимальным в смысле минимизации ожидаемого значения квадратичного критерия стоимости . Предполагается, что выходные измерения искажены гауссовым шумом, а начальное состояние также предполагается гауссовым случайным вектором.

При этих предположениях оптимальная схема управления в классе линейных законов управления может быть получена с помощью аргумента дополнения квадратов. [1] Этот закон управления, который известен как контроллер LQG , уникален и представляет собой просто комбинацию фильтра Калмана (линейно-квадратичного оценщика состояния (LQE)) вместе с линейно-квадратическим регулятором (LQR). Принцип разделения гласит, что оценщик состояния и обратная связь по состоянию могут быть разработаны независимо. Управление LQG применяется как к линейным системам, не зависящим от времени, так и к линейным системам, изменяющимся во времени , и представляет собой линейный динамический закон управления с обратной связью, который легко вычисляется и реализуется: сам контроллер LQG является динамической системой, подобной системе, которую он контролирует. Обе системы имеют одинаковую размерность состояния.

Более глубокое утверждение принципа разделения заключается в том, что контроллер LQG по-прежнему оптимален в более широком классе возможно нелинейных контроллеров. То есть использование нелинейной схемы управления не улучшит ожидаемое значение функции стоимости. Эта версия принципа разделения является частным случаем принципа разделения стохастического управления , который гласит, что даже когда источники шума процесса и выходного сигнала, возможно, являются негауссовыми мартингалами , пока динамика системы линейна, оптимальное управление разделяется на оптимальную оценку состояния (которая может больше не быть фильтром Калмана) и регулятор LQR. [2] [3]

В классической LQG-установке реализация LQG-контроллера может быть проблематичной, когда размерность состояния системы велика. Проблема LQG пониженного порядка (проблема LQG фиксированного порядка) преодолевает это, фиксируя априори количество состояний LQG-контроллера. Эту проблему сложнее решить, поскольку она больше не является разделимой. Кроме того, решение больше не является единственным. Несмотря на эти факты, доступны численные алгоритмы [4] [5] [6] [7] для решения связанных оптимальных проекционных уравнений [8] [9], которые составляют необходимые и достаточные условия для локально оптимального LQG-контроллера пониженного порядка. [4]

Оптимальность LQG не гарантирует автоматически хорошие свойства надежности. [10] [11] Надежная устойчивость замкнутой системы должна быть проверена отдельно после того, как контроллер LQG был разработан. Для повышения надежности некоторые параметры системы могут быть приняты стохастическими, а не детерминированными. Сопутствующая более сложная проблема управления приводит к аналогичному оптимальному контроллеру, в котором отличаются только параметры контроллера. [5]

Можно вычислить ожидаемое значение функции стоимости для оптимального прироста, а также для любого другого набора стабильных приростов. [12]

Контроллер LQG также используется для управления возмущенными нелинейными системами. [13]

Математическое описание задачи и решения

Непрерывное время

Рассмотрим линейную динамическую систему с непрерывным временем

где представляет собой вектор переменных состояния системы, вектор входов управления и вектор измеренных выходов, доступных для обратной связи. Как аддитивный белый гауссовский системный шум , так и аддитивный белый гауссовский измерительный шум влияют на систему. При наличии этой системы цель состоит в том, чтобы найти историю входов управления , которая в каждый момент времени может линейно зависеть только от прошлых измерений, так что следующая функция стоимости минимизируется:

где обозначает ожидаемое значение . Конечное время (горизонт) может быть как конечным, так и бесконечным. Если горизонт стремится к бесконечности, первый член функции стоимости становится пренебрежимо малым и нерелевантным для проблемы. Также, чтобы сохранить конечные затраты, следует принять функцию стоимости равной .

Контроллер LQG, решающий задачу управления LQG, определяется следующими уравнениями:

Матрица называется усилением Калмана соответствующего фильтра Калмана, представленного первым уравнением. В каждый момент времени этот фильтр генерирует оценки состояния, используя прошлые измерения и входные данные. Усиление Калмана вычисляется из матриц , двух матриц интенсивности, связанных с белыми гауссовыми шумами и и, наконец , . Эти пять матриц определяют усиление Калмана с помощью следующего связанного матричного дифференциального уравнения Риккати:

Учитывая решение, коэффициент усиления Калмана равен

Матрица называется матрицей коэффициента усиления обратной связи . Эта матрица определяется матрицами и через следующее связанное с ней матричное дифференциальное уравнение Риккати:

При данном решении коэффициент обратной связи равен

Обратите внимание на сходство двух матричных дифференциальных уравнений Риккати, первое из которых работает вперед во времени, второе — назад во времени. Это сходство называется дуальностью . Первое матричное дифференциальное уравнение Риккати решает линейно-квадратичную задачу оценки (LQE). Второе матричное дифференциальное уравнение Риккати решает линейно-квадратичную задачу регулятора (LQR). Эти задачи являются двойственными и вместе они решают линейно-квадратичную задачу управления Гаусса (LQG). Таким образом, задача LQG разделяется на задачу LQE и задачу LQR, которые могут быть решены независимо. Поэтому задача LQG называется разделимой .

Когда и матрицы интенсивности шума , не зависят от и когда стремится к бесконечности, контроллер LQG становится динамической системой, инвариантной во времени. В этом случае второе матричное дифференциальное уравнение Риккати может быть заменено связанным алгебраическим уравнением Риккати .

Дискретное время

Поскольку задача управления LQG в дискретном времени аналогична задаче в непрерывном времени, приведенное ниже описание сосредоточено на математических уравнениях.

Уравнения линейной системы с дискретным временем имеют вид

Здесь представляет собой дискретный временной индекс и представляет собой дискретные по времени гауссовские процессы белого шума с ковариационными матрицами , соответственно, и независимы друг от друга.

Квадратичная функция стоимости, которую необходимо минимизировать, имеет вид

Дискретный контроллер LQG — это

,

и соответствует прогнозной оценке .

Коэффициент усиления Калмана равен

где определяется следующим матричным разностным уравнением Риккати, которое выполняется вперед во времени:

Матрица усиления обратной связи равна

где определяется следующим матричным разностным уравнением Риккати, которое выполняется в обратном направлении во времени:

Если все матрицы в формулировке задачи инвариантны по времени и если горизонт стремится к бесконечности, то дискретно-временной контроллер LQG становится инвариантным по времени. В этом случае матричные уравнения разности Риккати можно заменить связанными с ними дискретно-временными алгебраическими уравнениями Риккати . Они определяют инвариантную по времени линейно-квадратичную оценку и инвариантный по времени линейно-квадратичную оценку в дискретном времени. Чтобы сохранить конечные затраты вместо нужно рассмотреть в этом случае.

Смотрите также

Ссылки

  1. ^ Карл Йохан Астром (1970). Введение в теорию стохастического управления . Том 58. Academic Press. ISBN 0-486-44531-3.
  2. ^ Андерс Линдквист (1973). «Об управлении с обратной связью линейных стохастических систем». Журнал SIAM по управлению . 11 (2): 323–343. doi :10.1137/0311025..
  3. ^ Трифон Т. Георгиу и Андерс Линдквист (2013). «Принцип разделения в стохастическом управлении, Redux». Труды IEEE по автоматическому управлению . 58 (10): 2481–2494. arXiv : 1103.3005 . doi : 10.1109/TAC.2013.2259207. S2CID  12623187.
  4. ^ ab Van Willigenburg LG; De Koning WL (2000). «Численные алгоритмы и вопросы, касающиеся оптимальных проекционных уравнений в дискретном времени». European Journal of Control . 6 (1): 93–100. doi :10.1016/s0947-3580(00)70917-4.Сопутствующее программное обеспечение можно загрузить с Matlab Central.
  5. ^ ab Van Willigenburg LG; De Koning WL (1999). "Оптимальные компенсаторы пониженного порядка для изменяющихся во времени дискретных систем с детерминированными и белыми параметрами". Automatica . 35 : 129–138. doi :10.1016/S0005-1098(98)00138-1.Сопутствующее программное обеспечение можно загрузить с Matlab Central.
  6. ^ Zigic D.; Watson LT; Collins EG; Haddad WM; Ying S. (1996). «Гомотопические методы решения оптимальных проекционных уравнений для задачи модели пониженного порядка H2». International Journal of Control . 56 (1): 173–191. doi :10.1080/00207179208934308.
  7. ^ Коллинз-младший EG; Хаддад WM; Ин С. (1996). «Алгоритм гомотопии для динамической компенсации пониженного порядка с использованием оптимальных проекционных уравнений Хайленда-Бернштейна». Журнал руководства, управления и динамики . 19 (2): 407–417. doi :10.2514/3.21633.
  8. ^ Хайленд Д.К.; Бернстайн Д.С. (1984). «Оптимальные проекционные уравнения для динамической компенсации фиксированного порядка» (PDF) . IEEE Transactions on Automatic Control . AC-29 (11): 1034–1037. doi :10.1109/TAC.1984.1103418. hdl : 2027.42/57875 .
  9. ^ Bernstein DS; Davis LD; Hyland DC (1986). "Оптимальные проекционные уравнения для оценки и управления дискретным моделированием пониженного порядка" (PDF) . Journal of Guidance, Control, and Dynamics . 9 (3): 288–293. Bibcode :1986JGCD....9..288B. doi :10.2514/3.20105. hdl : 2027.42/57880 .
  10. ^ Дойл, Джон К. (1978). «Гарантированные маржи для регуляторов LQG» (PDF) . IEEE Transactions on Automatic Control . 23 (4): 756–757. doi :10.1109/TAC.1978.1101812. ISSN  0018-9286.
  11. ^ Грин, Майкл; Лаймбир, Дэвид Дж. Н. (1995). Линейное надежное управление. Englewood Cliffs: Prentice Hall. стр. 27. ISBN 0-13-102278-4.
  12. ^ Мацакис, Деметриос (8 марта 2019 г.). «Влияние стратегий пропорционального управления на поведение контролируемых часов». Metrologia . 56 (2): 025007. Bibcode :2019Metro..56b5007M. doi : 10.1088/1681-7575/ab0614 .
  13. ^ Атанс М. (1971). «Роль и использование стохастической линейно-квадратично-гауссовой задачи в проектировании систем управления». Труды IEEE по автоматическому управлению . AC-16 (6): 529–552. doi :10.1109/TAC.1971.1099818.

Дальнейшее чтение