Метод линейного оптимального управления
В теории управления линейно -квадратично-гауссовская ( LQG ) задача управления является одной из самых фундаментальных задач оптимального управления , и она также может многократно использоваться для управления с прогнозированием модели . Она касается линейных систем, управляемых аддитивным белым гауссовым шумом . Задача состоит в определении закона обратной связи на выходе, который является оптимальным в смысле минимизации ожидаемого значения квадратичного критерия стоимости . Предполагается, что выходные измерения искажены гауссовым шумом, а начальное состояние также предполагается гауссовым случайным вектором.
При этих предположениях оптимальная схема управления в классе линейных законов управления может быть получена с помощью аргумента дополнения квадратов. [1] Этот закон управления, который известен как контроллер LQG , уникален и представляет собой просто комбинацию фильтра Калмана (линейно-квадратичного оценщика состояния (LQE)) вместе с линейно-квадратическим регулятором (LQR). Принцип разделения гласит, что оценщик состояния и обратная связь по состоянию могут быть разработаны независимо. Управление LQG применяется как к линейным системам, не зависящим от времени, так и к линейным системам, изменяющимся во времени , и представляет собой линейный динамический закон управления с обратной связью, который легко вычисляется и реализуется: сам контроллер LQG является динамической системой, подобной системе, которую он контролирует. Обе системы имеют одинаковую размерность состояния.
Более глубокое утверждение принципа разделения заключается в том, что контроллер LQG по-прежнему оптимален в более широком классе возможно нелинейных контроллеров. То есть использование нелинейной схемы управления не улучшит ожидаемое значение функции стоимости. Эта версия принципа разделения является частным случаем принципа разделения стохастического управления , который гласит, что даже когда источники шума процесса и выходного сигнала, возможно, являются негауссовыми мартингалами , пока динамика системы линейна, оптимальное управление разделяется на оптимальную оценку состояния (которая может больше не быть фильтром Калмана) и регулятор LQR. [2] [3]
В классической LQG-установке реализация LQG-контроллера может быть проблематичной, когда размерность состояния системы велика. Проблема LQG пониженного порядка (проблема LQG фиксированного порядка) преодолевает это, фиксируя априори количество состояний LQG-контроллера. Эту проблему сложнее решить, поскольку она больше не является разделимой. Кроме того, решение больше не является единственным. Несмотря на эти факты, доступны численные алгоритмы [4] [5] [6] [7] для решения связанных оптимальных проекционных уравнений [8] [9], которые составляют необходимые и достаточные условия для локально оптимального LQG-контроллера пониженного порядка. [4]
Оптимальность LQG не гарантирует автоматически хорошие свойства надежности. [10] [11] Надежная устойчивость замкнутой системы должна быть проверена отдельно после того, как контроллер LQG был разработан. Для повышения надежности некоторые параметры системы могут быть приняты стохастическими, а не детерминированными. Сопутствующая более сложная проблема управления приводит к аналогичному оптимальному контроллеру, в котором отличаются только параметры контроллера. [5]
Можно вычислить ожидаемое значение функции стоимости для оптимального прироста, а также для любого другого набора стабильных приростов. [12]
Контроллер LQG также используется для управления возмущенными нелинейными системами. [13]
Математическое описание задачи и решения
Непрерывное время
Рассмотрим линейную динамическую систему с непрерывным временем
где представляет собой вектор переменных состояния системы, вектор входов управления и вектор измеренных выходов, доступных для обратной связи. Как аддитивный белый гауссовский системный шум , так и аддитивный белый гауссовский измерительный шум влияют на систему. При наличии этой системы цель состоит в том, чтобы найти историю входов управления , которая в каждый момент времени может линейно зависеть только от прошлых измерений, так что следующая функция стоимости минимизируется:
где обозначает ожидаемое значение . Конечное время (горизонт) может быть как конечным, так и бесконечным. Если горизонт стремится к бесконечности, первый член функции стоимости становится пренебрежимо малым и нерелевантным для проблемы. Также, чтобы сохранить конечные затраты, следует принять функцию стоимости равной .
Контроллер LQG, решающий задачу управления LQG, определяется следующими уравнениями:
Матрица называется усилением Калмана соответствующего фильтра Калмана, представленного первым уравнением. В каждый момент времени этот фильтр генерирует оценки состояния, используя прошлые измерения и входные данные. Усиление Калмана вычисляется из матриц , двух матриц интенсивности, связанных с белыми гауссовыми шумами и и, наконец , . Эти пять матриц определяют усиление Калмана с помощью следующего связанного матричного дифференциального уравнения Риккати:
Учитывая решение, коэффициент усиления Калмана равен
Матрица называется матрицей коэффициента усиления обратной связи . Эта матрица определяется матрицами и через следующее связанное с ней матричное дифференциальное уравнение Риккати:
При данном решении коэффициент обратной связи равен
Обратите внимание на сходство двух матричных дифференциальных уравнений Риккати, первое из которых работает вперед во времени, второе — назад во времени. Это сходство называется дуальностью . Первое матричное дифференциальное уравнение Риккати решает линейно-квадратичную задачу оценки (LQE). Второе матричное дифференциальное уравнение Риккати решает линейно-квадратичную задачу регулятора (LQR). Эти задачи являются двойственными и вместе они решают линейно-квадратичную задачу управления Гаусса (LQG). Таким образом, задача LQG разделяется на задачу LQE и задачу LQR, которые могут быть решены независимо. Поэтому задача LQG называется разделимой .
Когда и матрицы интенсивности шума , не зависят от и когда стремится к бесконечности, контроллер LQG становится динамической системой, инвариантной во времени. В этом случае второе матричное дифференциальное уравнение Риккати может быть заменено связанным алгебраическим уравнением Риккати .
Дискретное время
Поскольку задача управления LQG в дискретном времени аналогична задаче в непрерывном времени, приведенное ниже описание сосредоточено на математических уравнениях.
Уравнения линейной системы с дискретным временем имеют вид
Здесь представляет собой дискретный временной индекс и представляет собой дискретные по времени гауссовские процессы белого шума с ковариационными матрицами , соответственно, и независимы друг от друга.
Квадратичная функция стоимости, которую необходимо минимизировать, имеет вид
Дискретный контроллер LQG — это
- ,
и соответствует прогнозной оценке .
Коэффициент усиления Калмана равен
где определяется следующим матричным разностным уравнением Риккати, которое выполняется вперед во времени:
Матрица усиления обратной связи равна
где определяется следующим матричным разностным уравнением Риккати, которое выполняется в обратном направлении во времени:
Если все матрицы в формулировке задачи инвариантны по времени и если горизонт стремится к бесконечности, то дискретно-временной контроллер LQG становится инвариантным по времени. В этом случае матричные уравнения разности Риккати можно заменить связанными с ними дискретно-временными алгебраическими уравнениями Риккати . Они определяют инвариантную по времени линейно-квадратичную оценку и инвариантный по времени линейно-квадратичную оценку в дискретном времени. Чтобы сохранить конечные затраты вместо нужно рассмотреть в этом случае.
Смотрите также
Ссылки
- ^ Карл Йохан Астром (1970). Введение в теорию стохастического управления . Том 58. Academic Press. ISBN 0-486-44531-3.
- ^ Андерс Линдквист (1973). «Об управлении с обратной связью линейных стохастических систем». Журнал SIAM по управлению . 11 (2): 323–343. doi :10.1137/0311025..
- ^ Трифон Т. Георгиу и Андерс Линдквист (2013). «Принцип разделения в стохастическом управлении, Redux». Труды IEEE по автоматическому управлению . 58 (10): 2481–2494. arXiv : 1103.3005 . doi : 10.1109/TAC.2013.2259207. S2CID 12623187.
- ^ ab Van Willigenburg LG; De Koning WL (2000). «Численные алгоритмы и вопросы, касающиеся оптимальных проекционных уравнений в дискретном времени». European Journal of Control . 6 (1): 93–100. doi :10.1016/s0947-3580(00)70917-4.Сопутствующее программное обеспечение можно загрузить с Matlab Central.
- ^ ab Van Willigenburg LG; De Koning WL (1999). "Оптимальные компенсаторы пониженного порядка для изменяющихся во времени дискретных систем с детерминированными и белыми параметрами". Automatica . 35 : 129–138. doi :10.1016/S0005-1098(98)00138-1.Сопутствующее программное обеспечение можно загрузить с Matlab Central.
- ^ Zigic D.; Watson LT; Collins EG; Haddad WM; Ying S. (1996). «Гомотопические методы решения оптимальных проекционных уравнений для задачи модели пониженного порядка H2». International Journal of Control . 56 (1): 173–191. doi :10.1080/00207179208934308.
- ^ Коллинз-младший EG; Хаддад WM; Ин С. (1996). «Алгоритм гомотопии для динамической компенсации пониженного порядка с использованием оптимальных проекционных уравнений Хайленда-Бернштейна». Журнал руководства, управления и динамики . 19 (2): 407–417. doi :10.2514/3.21633.
- ^ Хайленд Д.К.; Бернстайн Д.С. (1984). «Оптимальные проекционные уравнения для динамической компенсации фиксированного порядка» (PDF) . IEEE Transactions on Automatic Control . AC-29 (11): 1034–1037. doi :10.1109/TAC.1984.1103418. hdl : 2027.42/57875 .
- ^ Bernstein DS; Davis LD; Hyland DC (1986). "Оптимальные проекционные уравнения для оценки и управления дискретным моделированием пониженного порядка" (PDF) . Journal of Guidance, Control, and Dynamics . 9 (3): 288–293. Bibcode :1986JGCD....9..288B. doi :10.2514/3.20105. hdl : 2027.42/57880 .
- ^ Дойл, Джон К. (1978). «Гарантированные маржи для регуляторов LQG» (PDF) . IEEE Transactions on Automatic Control . 23 (4): 756–757. doi :10.1109/TAC.1978.1101812. ISSN 0018-9286.
- ^ Грин, Майкл; Лаймбир, Дэвид Дж. Н. (1995). Линейное надежное управление. Englewood Cliffs: Prentice Hall. стр. 27. ISBN 0-13-102278-4.
- ^ Мацакис, Деметриос (8 марта 2019 г.). «Влияние стратегий пропорционального управления на поведение контролируемых часов». Metrologia . 56 (2): 025007. Bibcode :2019Metro..56b5007M. doi : 10.1088/1681-7575/ab0614 .
- ^ Атанс М. (1971). «Роль и использование стохастической линейно-квадратично-гауссовой задачи в проектировании систем управления». Труды IEEE по автоматическому управлению . AC-16 (6): 529–552. doi :10.1109/TAC.1971.1099818.
Дальнейшее чтение
- Стенгель, Роберт Ф. (1994). Оптимальное управление и оценка. Нью-Йорк: Довер. ISBN 0-486-68200-5.