stringtranslate.com

Линейно-квадратичный регулятор

Теория оптимального управления занимается управлением динамической системой с минимальными затратами. Случай, когда динамика системы описывается набором линейных дифференциальных уравнений , а затраты описываются квадратичной функцией , называется проблемой LQ. Одним из основных результатов теории является то, что решение обеспечивается линейно-квадратичным регулятором ( LQR ), регулятором с обратной связью, уравнения которого приведены ниже.

Контроллеры LQR обладают внутренней надежностью с гарантированным усилением и запасом по фазе , [1] и они также являются частью решения проблемы LQG (линейно-квадратично-гауссовской) . Как и сама проблема LQR, проблема LQG является одной из самых фундаментальных проблем в теории управления . [2]

Общее описание

Настройки (регулирующего) контроллера, управляющего машиной или процессом (например, самолетом или химическим реактором), находятся с помощью математического алгоритма, который минимизирует функцию стоимости с весовыми коэффициентами, предоставленными человеком (инженером). Функция стоимости часто определяется как сумма отклонений ключевых измерений, таких как высота или температура процесса, от их желаемых значений. Таким образом, алгоритм находит те настройки контроллера, которые минимизируют нежелательные отклонения. Величина самого управляющего воздействия также может быть включена в функцию стоимости.

Алгоритм LQR сокращает объем работы, выполняемой инженером систем управления для оптимизации контроллера. Однако инженеру все еще необходимо указать параметры функции стоимости и сравнить результаты с указанными целями проектирования. Часто это означает, что построение контроллера будет итеративным процессом, в котором инженер оценивает «оптимальные» контроллеры, полученные путем моделирования, а затем корректирует параметры для создания контроллера, более соответствующего целям проектирования.

Алгоритм LQR по сути является автоматизированным способом поиска подходящего контроллера с обратной связью по состоянию . Таким образом, инженеры по управлению нередко предпочитают альтернативные методы, такие как полная обратная связь по состоянию , также известная как размещение полюсов, в которой существует более четкая связь между параметрами контроллера и его поведением. Сложность поиска правильных весовых коэффициентов ограничивает применение синтеза контроллера на основе LQR.

Версии

Конечный горизонт, непрерывное время

Для непрерывной во времени линейной системы, определенной на , описываемой формулой:

где (то есть, -мерный вектор вещественных значений) - состояние системы, а - управляющий вход. Дана квадратичная функция стоимости для системы, определяемая как:


где — начальная матрица затрат, — матрица затрат состояния, — матрица затрат управления, — перекрестная матрица затрат (управления и состояния), закон управления с обратной связью, который минимизирует значение затрат, имеет вид:

где дается выражением:

и находится путем решения дифференциального уравнения Риккати с непрерывным временем :

с граничным условием:

Условия первого порядка для J min следующие:

1) Уравнение состояния

2) Уравнение сопутствующего состояния

3) Стационарное уравнение

4) Граничные условия

и

Бесконечный горизонт, непрерывное время

Для непрерывной во времени линейной системы, описываемой следующим образом:

с функцией стоимости, определяемой как:

Закон управления с обратной связью, минимизирующий значение стоимости, имеет вид:

где дается выражением:

и находится путем решения непрерывного во времени алгебраического уравнения Риккати :

Это можно также записать так:

с

Конечный горизонт, дискретное время

Для дискретной линейной системы, описываемой формулой: [3]

с индексом производительности, определяемым как:

, где находится временной горизонт

оптимальная последовательность управления, минимизирующая индекс производительности, определяется по формуле:

где:

и находится итеративно назад во времени с помощью динамического уравнения Риккати:

из конечного состояния . [4] Обратите внимание, что не определено, так как приводится в свое конечное состояние с помощью .

Бесконечный горизонт, дискретное время

Для дискретной линейной системы, описываемой формулой:

с индексом производительности, определяемым как:

оптимальная последовательность управления, минимизирующая индекс производительности, определяется по формуле:

где:

и является единственным положительно определенным решением дискретного алгебраического уравнения Риккати (DARE):

.

Это можно также записать так:

с:

.

Обратите внимание, что одним из способов решения алгебраического уравнения Риккати является итерация динамического уравнения Риккати для случая конечного горизонта до тех пор, пока оно не сойдется.

Ограничения

На практике не все значения могут быть разрешены. Одним из распространенных ограничений является линейное:

Версия с конечным горизонтом — это выпуклая задача оптимизации , и поэтому проблема часто решается повторно с удаляющимся горизонтом. Это форма управления прогнозированием модели . [5] [6]

Связанные контроллеры

Квадратично-квадратичный регулятор

Если уравнение состояния квадратичное, то проблема известна как квадратично-квадратичный регулятор (QQR). Алгоритм Аль-Брехта может быть применен для сведения этой проблемы к той, которая может быть эффективно решена с использованием линейных решателей на основе тензора. [7]

Полиномиально-квадратичный регулятор

Если уравнение состояния является полиномиальным , то проблема известна как полиномиально-квадратичный регулятор (PQR). Опять же, алгоритм Аль-Брехта может быть применен для сведения этой проблемы к большой линейной, которая может быть решена с помощью обобщения алгоритма Бартельса-Стюарта ; это осуществимо при условии, что степень полинома не слишком высока. [8]

Модельно-прогностический контроль

Модель предиктивного управления и линейно-квадратичные регуляторы — это два типа методов оптимального управления, которые имеют различные подходы к установке затрат на оптимизацию. В частности, когда LQR запускается повторно с уменьшающимся горизонтом, он становится формой модели предиктивного управления (MPC). Однако в целом MPC не полагается ни на какие предположения относительно линейности системы.

Ссылки

  1. ^ Lehtomaki, N.; Sandell, N.; Athans, M. (1981). «Результаты надежности в линейно-квадратических гауссовых многомерных схемах управления». IEEE Transactions on Automatic Control . 26 (1): 75–93. doi :10.1109/TAC.1981.1102565. ISSN  0018-9286.
  2. ^ Дойл, Джон К. (1978). «Гарантированные маржи для регуляторов LQG» (PDF) . IEEE Transactions on Automatic Control . 23 (4): 756–757. doi :10.1109/TAC.1978.1101812. ISSN  0018-9286.
  3. ^ Чоу, Грегори К. (1986). Анализ и управление динамическими экономическими системами . Krieger Publ. Co. ISBN 0-89874-969-7.
  4. ^ Шайджу, А. Дж., Петерсен, Ян Р. (2008). «Формулы для задач оптимального управления LQR, LQG, LEQG и минимакс LQG в дискретном времени». Труды IFAC, тома . 41 (2). Elsevier: 8773–8778. doi :10.3182/20080706-5-KR-1001.01483.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  5. ^ "Гл. 8 - Линейные квадратичные регуляторы". underactuated.mit.edu . Получено 20 августа 2022 г. .
  6. ^ Scokaert, Pierre OM; Rawlings, James B. (август 1998 г.). «Ограниченное линейно-квадратичное регулирование» (PDF) . IEEE Transactions on Automatic Control . 43 (8): 1163–1169. doi :10.1109/9.704994. hdl :1793/10888 . Получено 20 августа 2022 г. .
  7. ^ Борггаард, Джефф; Зитсман, Лизетт (июль 2020 г.). «Проблема квадратичного-квадратичного регулятора: аппроксимация управления с обратной связью для квадратичных нелинейных систем с постоянным состоянием». Американская конференция по управлению (ACC) 2020 г. стр. 818–823. arXiv : 1910.03396 . doi : 10.23919/ACC45564.2020.9147286. ISBN 978-1-5386-8266-1. S2CID  203904925 . Получено 20 августа 2022 г. .
  8. ^ Борггаард, Джефф; Цицман, Лизетт (1 января 2021 г.). «Об аппроксимации задач полиномиально-квадратичного регулятора». IFAC-PapersOnLine . 54 (9): 329–334. arXiv : 2009.11068 . doi : 10.1016/j.ifacol.2021.06.090 . S2CID  221856517.

Внешние ссылки