stringtranslate.com

Представление пространства состояний

В области управления и идентификации систем представление пространства состояний — это математическая модель физической системы, заданная как набор входных, выходных и переменных, связанных дифференциальными уравнениями первого порядка или разностными уравнениями . Такие переменные, называемые переменными состояния , со временем изменяются в зависимости от значений, которые они имеют в любой данный момент, и от внешних значений входных переменных. Значения выходных переменных зависят от значений переменных состояния и могут также зависеть от значений входных переменных.

Пространство состояний или фазовое пространство — это геометрическое пространство , в котором оси являются переменными состояния. Состояние системы можно представить в виде вектора , вектора состояния .

Если динамическая система линейна, инвариантна во времени и конечномерна, то дифференциальные и алгебраические уравнения могут быть записаны в матричной форме. [1] [2] Метод пространства состояний характеризуется алгебраизацией общей теории систем , что позволяет использовать векторно-матричные структуры Кронекера . Возможности этих структур могут быть эффективно применены для исследования систем с модуляцией или без нее. [3] Представление пространства состояний (также известное как « подход во временной области ») обеспечивает удобный и компактный способ моделирования и анализа систем с несколькими входами и выходами. При наличии входов и выходов нам в противном случае пришлось бы записывать преобразования Лапласа для кодирования всей информации о системе. В отличие от подхода в частотной области , использование представления пространства состояний не ограничивается системами с линейными компонентами и нулевыми начальными условиями.

Модель пространства состояний может применяться в таких предметах, как экономика, [4] статистика, [5] компьютерные науки и электротехника, [6] и нейронаука. [7] Например, в эконометрике модели пространства состояний могут использоваться для разложения временного ряда на тренд и цикл, объединения отдельных показателей в составной индекс, [8] определения поворотных точек делового цикла и оценки ВВП с использованием скрытых и ненаблюдаемых временных рядов. [9] [10] Многие приложения полагаются на фильтр Калмана или наблюдателя состояний для получения оценок текущих неизвестных переменных состояния с использованием их предыдущих наблюдений. [11] [12]

Переменные состояния

Внутренние переменные состояния являются наименьшим возможным подмножеством системных переменных, которые могут представлять все состояние системы в любой момент времени. [13] Минимальное количество переменных состояния, необходимое для представления данной системы, обычно равно порядку определяющего дифференциального уравнения системы, но не обязательно. Если система представлена ​​в форме передаточной функции, минимальное количество переменных состояния равно порядку знаменателя передаточной функции после того, как она была приведена к правильной дроби. Важно понимать, что преобразование реализации пространства состояний в форму передаточной функции может привести к потере некоторой внутренней информации о системе и может предоставить описание системы, которая является стабильной, когда реализация пространства состояний нестабильна в определенных точках. В электрических цепях количество переменных состояния часто, хотя и не всегда, совпадает с количеством элементов хранения энергии в цепи, таких как конденсаторы и катушки индуктивности . Определенные переменные состояния должны быть линейно независимыми, т. е. никакая переменная состояния не может быть записана как линейная комбинация других переменных состояния, иначе система не может быть решена.

Линейные системы

Блок-схема, иллюстрирующая линейные уравнения пространства состояний

Наиболее общее представление пространства состояний линейной системы с входами, выходами и переменными состояния записывается в следующем виде: [14]

где:

называется «вектором состояния»,  ;
называется «выходным вектором»,  ;
называется «входным (или управляющим) вектором»,  ;
это «матрица состояния (или системы)»  ,
это «входная матрица»,  ,
это «выходная матрица»,  ,
- «матрица прямой связи» (в случаях, когда в модели системы нет прямой связи, это нулевая матрица)  ,
.

В этой общей формулировке все матрицы могут быть изменчивыми во времени (т. е. их элементы могут зависеть от времени); однако в общем случае LTI матрицы будут инвариантными во времени. Переменная времени может быть непрерывной (например, ) или дискретной (например, ). В последнем случае переменная времени обычно используется вместо . Гибридные системы допускают временные домены, которые имеют как непрерывные, так и дискретные части. В зависимости от сделанных предположений представление модели пространства состояний может принимать следующие формы:

Пример: случай непрерывной потери трудоспособности

Устойчивость и естественные характеристики отклика непрерывной во времени системы LTI (т. е. линейной с матрицами, постоянными во времени) можно изучить из собственных значений матрицы . Устойчивость модели пространства состояний, инвариантной во времени, можно определить, посмотрев на передаточную функцию системы в факторизованной форме. Тогда она будет выглядеть примерно так:

Знаменатель передаточной функции равен характеристическому полиному, найденному путем взятия определителя ,

Корни этого полинома ( собственные значения ) являются полюсами передаточной функции системы (т. е. сингулярностями , где величина передаточной функции неограничена). Эти полюса можно использовать для анализа того, является ли система асимптотически устойчивой или маргинально устойчивой . Альтернативный подход к определению устойчивости, не включающий вычисление собственных значений, заключается в анализе устойчивости системы по Ляпунову .

Нули, находящиеся в числителе, можно аналогичным образом использовать для определения того, является ли система минимально-фазовой .

Система может быть по-прежнему стабильной по входу-выходу (см. BIBO stable ), даже если она внутренне нестабильна. Это может быть в случае, если нестабильные полюса компенсируются нулями (т. е. если эти сингулярности в передаточной функции являются устранимыми ).

Управляемость

Условие управляемости состояния подразумевает, что возможно — допустимыми входами — направлять состояния от любого начального значения к любому конечному значению в пределах некоторого конечного временного окна. Непрерывная инвариантная во времени линейная модель пространства состояний управляема тогда и только тогда, когда

где ранг — число линейно независимых строк в матрице, а n — число переменных состояния.

Наблюдаемость

Наблюдаемость — это мера того, насколько хорошо внутренние состояния системы могут быть выведены из знания ее внешних выходов. Наблюдаемость и управляемость системы являются математическими дуалами (т. е., как управляемость обеспечивает наличие входных данных, которые переводят любое начальное состояние в любое желаемое конечное состояние, наблюдаемость обеспечивает, что знание выходной траектории дает достаточно информации для прогнозирования начального состояния системы).

Непрерывная инвариантная во времени линейная модель пространства состояний наблюдаема тогда и только тогда, когда

Передаточная функция

« Передаточная функция » непрерывной, инвариантной во времени линейной модели пространства состояний может быть получена следующим образом:

Во-первых, примем преобразование Лапласа

урожайность

Далее мы упрощаем для , давая

и таким образом

Подставим в выходное уравнение

давая

Предполагая нулевые начальные условия и систему с одним входом и одним выходом (SISO) , передаточная функция определяется как отношение выхода к входу . Однако для системы с несколькими входами и несколькими выходами (MIMO) это отношение не определено. Поэтому, предполагая нулевые начальные условия, матрица передаточной функции выводится из

используя метод уравнивания коэффициентов, который дает

.

Следовательно, является матрицей с размерностью , которая содержит передаточные функции для каждой комбинации вход-выход. Благодаря простоте этой матричной записи представление пространства состояний обычно используется для систем с несколькими входами и несколькими выходами. Матрица системы Розенброка обеспечивает мост между представлением пространства состояний и его передаточной функцией .

Канонические реализации

Любая заданная передаточная функция, которая является строго правильной, может быть легко перенесена в пространство состояний с помощью следующего подхода (этот пример приведен для четырехмерной системы с одним входом и одним выходом):

Дана передаточная функция, разверните ее, чтобы выявить все коэффициенты как в числителе, так и в знаменателе. Это должно привести к следующей форме:

Теперь коэффициенты можно вставить непосредственно в модель пространства состояний с помощью следующего подхода:

Такая реализация пространства состояний называется управляемой канонической формой , поскольку полученная модель гарантированно является управляемой (т. е. поскольку управление входит в цепочку интеграторов, оно имеет возможность перемещать каждое состояние).

Коэффициенты передаточной функции также могут быть использованы для построения другого типа канонической формы.

Эта реализация пространства состояний называется наблюдаемой канонической формой , поскольку полученная модель гарантированно является наблюдаемой (т. е. поскольку выходной сигнал выходит из цепочки интеграторов, каждое состояние оказывает влияние на выходной сигнал).

Правильные передаточные функции

Передаточные функции, которые являются только правильными (а не строго правильными ), также могут быть реализованы довольно легко. Хитрость здесь в том, чтобы разделить передаточную функцию на две части: строго правильную часть и константу.

Строго правильная передаточная функция может быть затем преобразована в каноническую реализацию пространства состояний с использованием методов, показанных выше. Реализация пространства состояний константы тривиальна . Вместе мы получаем реализацию пространства состояний с матрицами A , B и C, определяемыми строго правильной частью, и матрицей D , определяемой константой.

Вот пример, который немного прояснит ситуацию:

что дает следующую контролируемую реализацию

Обратите внимание, что выход также напрямую зависит от входа. Это происходит из-за константы в передаточной функции.

Обратная связь

Типичная модель пространства состояний с обратной связью

Распространенным методом обратной связи является умножение выходных данных на матрицу K и установка этого в качестве входных данных для системы: . Поскольку значения K не ограничены, значения можно легко заменить на отрицательные для отрицательной обратной связи . Наличие отрицательного знака (общепринятое обозначение) является просто обозначением, и его отсутствие не влияет на конечные результаты.

становится

решение выходного уравнения для и подстановка в уравнение состояния приводит к

Преимущество этого заключается в том, что собственные значения A можно контролировать, задавая K соответствующим образом с помощью разложения собственных значений . Это предполагает , что замкнутая система управляема или что нестабильные собственные значения A можно сделать стабильными с помощью соответствующего выбора K .

Пример

Для строго правильной системы D равен нулю. Другая довольно распространенная ситуация — когда все состояния являются выходами, т.е. y = x , что дает C = I , матрицу тождественности . Это тогда приведет к более простым уравнениям

Это сводит необходимое собственное разложение всего к .

Обратная связь с входом заданного значения (эталона)

Выходная обратная связь с заданным значением

В дополнение к обратной связи можно добавить вход, , таким образом, что .

становится

решение выходного уравнения для и подстановка в уравнение состояния приводит к

Одним из довольно распространенных упрощений этой системы является удаление D , что сводит уравнения к следующему виду:

Пример движущегося объекта

Классическая линейная система — это система одномерного движения объекта (например, тележки). Законы движения Ньютона для объекта, движущегося горизонтально на плоскости и прикрепленного к стене с помощью пружины:

где

Тогда уравнение состояния будет иметь вид

где

Затем проводится тест на управляемость .

которая имеет полный ранг для всех и . Это означает, что если начальное состояние системы известно ( , , ), и если и являются константами, то существует сила , которая может переместить тележку в любое другое положение в системе.

Тест на наблюдаемость тогда

которая также имеет полный ранг. Следовательно, эта система является как контролируемой, так и наблюдаемой.

Нелинейные системы

Более общую форму модели пространства состояний можно записать в виде двух функций.

Первое — это уравнение состояния, а второе — уравнение выхода. Если функция является линейной комбинацией состояний и входов, то уравнения можно записать в матричной записи, как указано выше. Аргумент функций можно опустить, если система не имеет принудительных воздействий (т. е. у нее нет входов).

Пример маятника

Классическая нелинейная система — это простой несиловой маятник.

где

Уравнения состояния тогда будут такими:

где

Вместо этого уравнение состояния можно записать в общем виде

Точки равновесия / стационарности системы наступают тогда, когда и, следовательно, точки равновесия маятника наступают тогда, когда удовлетворяют условию

для целых чисел n .

Смотрите также

Ссылки

  1. ^ Каталин М. Хангос ; Р. Лакнер и М. Герцсон (2001). Интеллектуальные системы управления: Введение с примерами. Springer. стр. 254. ISBN 978-1-4020-0134-5.
  2. ^ Каталин М. Хангос; Йожеф Бокор и Габор Седеркени (2004). Анализ и управление нелинейными технологическими системами. Спрингер. п. 25. ISBN 978-1-85233-600-4.
  3. ^ Васильев А.С.; Ушаков А.В. (2015). «Моделирование динамических систем с модуляцией с помощью векторно-матричного представления Кронекера». Научно-технический вестник информационных технологий, механики и оптики . 15 (5): 839–848. doi : 10.17586/2226-1494-2015-15-5-839-848 .
  4. ^ Сток, Дж. Х.; Уотсон, М. В. (2016), «Динамические факторные модели, векторные авторегрессии с дополнениями по факторам и структурные векторные авторегрессии в макроэкономике», Справочник по макроэкономике , т. 2, Elsevier, стр. 415–525, doi : 10.1016/bs.hesmac.2016.04.002, ISBN 978-0-444-59487-7
  5. ^ Дурбин, Джеймс; Купман, Сием Джан (2012). Анализ временных рядов методами пространства состояний . Oxford University Press. ISBN 978-0-19-964117-8. OCLC  794591362.
  6. ^ Россер, Р. (1975). «Дискретная модель пространства состояний для линейной обработки изображений». IEEE Transactions on Automatic Control . 20 (1): 1–10. doi :10.1109/tac.1975.1100844. ISSN  0018-9286.
  7. ^ Смит, Энн К.; Браун, Эмери Н. (2003). «Оценка модели пространства состояний по наблюдениям точечных процессов». Neural Computation . 15 (5): 965–991. doi :10.1162/089976603765202622. ISSN  0899-7667. PMID  12803953. S2CID  10020032.
  8. Джеймс Х. Сток и Марк У. Уотсон, 1989. «Новые индексы совпадающих и опережающих экономических индикаторов», Главы NBER, в: NBER Macroeconomics Annual 1989, том 4, страницы 351-409, Национальное бюро экономических исследований, Inc.
  9. ^ Банбура, Марта; Модуньо, Мишель (2012-11-12). «Оценка максимального правдоподобия факторных моделей на наборах данных с произвольным шаблоном пропущенных данных». Журнал прикладной эконометрики . 29 (1): 133–160. doi : 10.1002/jae.2306. hdl : 10419/153623 . ISSN  0883-7252. S2CID  14231301.
  10. ^ «Модели пространства состояний с переключением Маркова и выборкой Гиббса», Модели пространства состояний с переключением режимов , MIT Press, стр. 237–274, 2017, doi :10.7551/mitpress/6444.003.0013, ISBN 978-0-262-27711-2
  11. ^ Калман, Р. Э. (1960-03-01). «Новый подход к проблемам линейной фильтрации и прогнозирования». Журнал базовой инженерии . 82 (1): 35–45. doi :10.1115/1.3662552. ISSN  0021-9223. S2CID  259115248.
  12. ^ Харви, Эндрю К. (1990). Прогнозирование, структурные модели временных рядов и фильтр Калмана . Кембридж: Cambridge University Press. doi:10.1017/CBO9781107049994
  13. ^ Nise, Norman S. (2010). Control Systems Engineering (6-е изд.). John Wiley & Sons, Inc. ISBN 978-0-470-54756-4.
  14. ^ Броган, Уильям Л. (1974). Современная теория управления (1-е изд.). Quantum Publishers, Inc. стр. 172.

Дальнейшее чтение

  • Анцаклис, П.Дж.; Мишель, АН (2007). Букварь по линейным системам . Биркгаузер. ISBN 978-0-8176-4460-4.
  • Чэнь, Чи-Цонг (1999). Теория и проектирование линейных систем (3-е изд.). Oxford University Press. ISBN 0-19-511777-8.
  • Халил, Хассан К. (2001). Нелинейные системы (3-е изд.). Prentice Hall. ISBN 0-13-067389-7.
  • Hinrichsen, Diederich; Pritchard, Anthony J. (2005). Теория математических систем I, Моделирование, Анализ пространства состояний, Устойчивость и надежность . Springer. ISBN 978-3-540-44125-0.
  • Зонтаг, Эдуардо Д. (1999). Математическая теория управления: детерминированные конечномерные системы (PDF) (2-е изд.). Springer. ISBN 0-387-98489-5. Получено 28 июня 2012 г. .
  • Фридланд, Бернард (2005). Проектирование систем управления: Введение в методы пространства состояний . Довер. ISBN 0-486-44278-0.
  • Заде, Лотфи А.; Десоер, Чарльз А. (1979). Линейная теория систем . Krieger Pub Co. ISBN 978-0-88275-809-1.
О применении моделей пространства состояний в эконометрике
  • Дурбин, Дж.; Купман, С. (2001). Анализ временных рядов методами пространства состояний . Оксфорд, Великобритания: Oxford University Press. ISBN 978-0-19-852354-3.

Внешние ссылки