В теории управления наблюдатель состояния или оценщик состояния — это система, которая обеспечивает оценку внутреннего состояния данной реальной системы на основе измерений входа и выхода реальной системы. Обычно она реализуется на компьютере и обеспечивает основу для многих практических приложений.
Знание состояния системы необходимо для решения многих задач теории управления ; например, стабилизация системы с использованием обратной связи по состоянию . В большинстве практических случаев физическое состояние системы не может быть определено прямым наблюдением. Вместо этого косвенные эффекты внутреннего состояния наблюдаются посредством выходов системы. Простым примером являются транспортные средства в туннеле: скорости и скорости, с которыми транспортные средства въезжают и выезжают из туннеля, можно наблюдать напрямую, но точное состояние внутри туннеля можно только оценить. Если система наблюдаема , можно полностью реконструировать состояние системы из ее выходных измерений с помощью наблюдателя состояния.
Типичная модель наблюдателя
Линейные, задержанные, скользящие, с высоким коэффициентом усиления, Тау, основанные на однородности, расширенные и кубические наблюдатели являются одними из нескольких структур наблюдателей, используемых для оценки состояния линейных и нелинейных систем. Линейная структура наблюдателя описывается в следующих разделах.
Дискретный случай времени
Предполагается, что состояние линейной, инвариантной во времени дискретной системы удовлетворяет
где, в момент времени , — состояние установки; — ее входы; и — ее выходы. Эти уравнения просто говорят, что текущие выходы установки и ее будущее состояние определяются исключительно ее текущими состояниями и текущими входами. (Хотя эти уравнения выражены в терминах дискретных временных шагов, очень похожие уравнения справедливы для непрерывных систем). Если эта система наблюдаема , то выход установки, , может использоваться для управления состоянием наблюдателя состояния.
Модель наблюдателя физической системы затем обычно выводится из приведенных выше уравнений. Дополнительные члены могут быть включены для того, чтобы гарантировать, что при получении последовательных измеренных значений входов и выходов установки состояние модели сходится к состоянию установки. В частности, выход наблюдателя может быть вычтен из выхода установки, а затем умножен на матрицу ; затем это добавляется к уравнениям для состояния наблюдателя, чтобы получить так называемого наблюдателя Люенбергера , определяемого приведенными ниже уравнениями. Обратите внимание, что переменные наблюдателя состояния обычно обозначаются «шляпкой»: и для того, чтобы отличать их от переменных уравнений, которым удовлетворяет физическая система.
Наблюдатель называется асимптотически устойчивым, если ошибка наблюдателя стремится к нулю при . Для наблюдателя Люенбергера ошибка наблюдателя удовлетворяет . Таким образом, наблюдатель Люенбергера для этой дискретной системы асимптотически устойчив, когда матрица имеет все собственные значения внутри единичной окружности.
В целях управления выходной сигнал системы наблюдателя подается обратно на вход как наблюдателя, так и объекта через матрицу коэффициентов усиления .
Уравнения наблюдателя тогда принимают вид:
или, проще говоря,
Благодаря принципу разделения мы знаем, что можем выбирать и независимо без ущерба для общей стабильности систем. Как правило, полюса наблюдателя обычно выбираются так, чтобы они сходились в 10 раз быстрее, чем полюса системы .
Случай непрерывного времени
Предыдущий пример был для наблюдателя, реализованного в системе LTI с дискретным временем. Однако процесс аналогичен для случая с непрерывным временем; коэффициенты усиления наблюдателя выбираются так, чтобы динамика ошибок с непрерывным временем асимптотически сходилась к нулю (т. е. когда — матрица Гурвица ).
Для линейной системы с непрерывным временем
где наблюдатель выглядит аналогично случаю дискретного времени, описанному выше:
.
Ошибка наблюдателя удовлетворяет уравнению
.
Собственные значения матрицы могут быть выбраны произвольно путем соответствующего выбора коэффициента усиления наблюдателя , когда пара наблюдаема, т.е. выполняется условие наблюдаемости . В частности, она может быть сделана Гурвицевой, поэтому ошибка наблюдателя , когда .
Пикинг и другие методы наблюдения
Когда усиление наблюдателя велико, линейный наблюдатель Люенбергера очень быстро сходится к состояниям системы. Однако высокое усиление наблюдателя приводит к явлению пика, при котором начальная ошибка оценщика может быть недопустимо большой (т. е. непрактичной или небезопасной для использования). [1] Как следствие, доступны нелинейные методы наблюдения с высоким усилением, которые быстро сходятся без явления пика. Например, управление скользящим режимом может использоваться для разработки наблюдателя, который сводит ошибку одного оцененного состояния к нулю за конечное время даже при наличии ошибки измерения; другие состояния имеют ошибку, которая ведет себя аналогично ошибке в наблюдателе Люенбергера после того, как пик спадает. Наблюдатели скользящего режима также обладают привлекательными свойствами устойчивости к шуму, которые похожи на фильтр Калмана . [2] [3]
Другой подход заключается в применении нескольких наблюдателей, что значительно улучшает переходные процессы и уменьшает выбросы наблюдателя. Несколько наблюдателей можно адаптировать к любой системе, где применим наблюдатель с высоким усилением. [4]
Наблюдатели состояния для нелинейных систем
High gain, slide mode и extended observers являются наиболее распространенными наблюдателями для нелинейных систем. Чтобы проиллюстрировать применение скользящих наблюдателей для нелинейных систем, сначала рассмотрим нелинейную систему без входа:
где . Также предположим, что существует измеримый выход, заданный как
Существует несколько не-приближенных подходов к проектированию наблюдателя. Два наблюдателя, приведенные ниже, также применимы к случаю, когда система имеет вход. То есть,
Линеаризуемая динамика ошибок
Одно из предложений Кренера и Исидори [5] и Кренера и Респондека [6] может быть применено в ситуации, когда существует линеаризующее преобразование (т. е. диффеоморфизм , подобный тому, который используется в линеаризации с обратной связью ), такое, что в новых переменных уравнения системы имеют вид
Наблюдатель Люенбергера затем проектируется как
.
Ошибка наблюдателя для преобразованной переменной удовлетворяет тому же уравнению, что и в классическом линейном случае.
.
Как показали Готье, Хаммури и Отман [7],
а также Хаммури и Киннаерт [8], если существует преобразование , такое, что система может быть преобразована в форму
тогда наблюдатель спроектирован как
,
где - изменяющийся во времени коэффициент усиления наблюдателя.
Чиккарелла, Далла Мора и Джермани [9] получили более продвинутые и общие результаты, устранив необходимость в нелинейном преобразовании и доказав глобальную асимптотическую сходимость оценочного состояния к истинному состоянию, используя только простые предположения о регулярности.
Поменял наблюдателей
Как обсуждалось выше для линейного случая, явление пика, присутствующее в наблюдателях Люенбергера, оправдывает использование переключаемых наблюдателей. Переключаемый наблюдатель охватывает реле или двоичный переключатель, который действует при обнаружении мельчайших изменений в измеренном выходе. Некоторые распространенные типы переключаемых наблюдателей включают наблюдателя скользящего режима, нелинейного расширенного наблюдателя состояния, [10] наблюдателя с фиксированным временем, [11] переключаемого наблюдателя с высоким коэффициентом усиления [12] и объединяющего наблюдателя. [13] Наблюдатель скользящего режима использует нелинейную обратную связь с высоким коэффициентом усиления для перевода оценочных состояний на гиперповерхность , где нет никакой разницы между оценочным выходом и измеренным выходом. Нелинейное усиление, используемое в наблюдателе, обычно реализуется с помощью масштабированной функции переключения, такой как сигнум ( т. е. sgn) оценочной – измеренной ошибки выхода. Следовательно, из-за этой обратной связи с высоким коэффициентом усиления векторное поле наблюдателя имеет складку, так что траектории наблюдателя скользят вдоль кривой, где оценочный выход точно соответствует измеренному выходу. Таким образом, если система наблюдаема из своего выхода, все состояния наблюдателя будут переведены в фактические состояния системы. Кроме того, используя знак ошибки для управления наблюдателем скользящего режима, траектории наблюдателя становятся нечувствительными ко многим формам шума. Следовательно, некоторые наблюдатели скользящего режима имеют привлекательные свойства, похожие на фильтр Калмана , но с более простой реализацией. [2] [3]
Как предположил Дракунов [14] , наблюдатель скользящего режима может быть также разработан для класса нелинейных систем. Такой наблюдатель может быть записан в терминах оценки исходной переменной и имеет вид
где:
Вектор расширяет скалярную функцию signum до измерений. То есть,
для вектора .
Вектор имеет компоненты, которые являются выходной функцией и ее повторными производными Ли. В частности,
где — i -я производная Ли выходной функции вдоль векторного поля (т.е. вдоль траекторий нелинейной системы). В особом случае, когда система не имеет входа или имеет относительную степень n , — это совокупность выхода и его производных. Поскольку для корректного определения этого наблюдателя должна существовать обратная функция якобианской линеаризации , преобразование гарантированно является локальным диффеоморфизмом .
где для каждого элемента и достаточно большим, чтобы обеспечить достижимость скользящего режима.
Вектор наблюдателя таков, что
где здесь — нормальная знаковая функция, определенная для скаляров, а обозначает «оператор эквивалентного значения» разрывной функции в скользящем режиме.
Идею можно кратко объяснить следующим образом. Согласно теории скользящих режимов, для описания поведения системы, как только начинается скользящий режим, функция должна быть заменена эквивалентными значениями (см. эквивалентное управление в теории скользящих режимов ). На практике она переключается (вибрирует) с высокой частотой, причем медленная составляющая равна эквивалентному значению. Применив соответствующий фильтр нижних частот, чтобы избавиться от высокочастотной составляющей, можно получить значение эквивалентного управления, которое содержит больше информации о состоянии оцениваемой системы. Описанный выше наблюдатель использует этот метод несколько раз, чтобы получить состояние нелинейной системы в идеале за конечное время.
Модифицированную ошибку наблюдения можно записать в преобразованных состояниях . В частности,
и так
Так:
До тех пор пока , первая строка динамики ошибки, , будет удовлетворять достаточным условиям для входа в скользящий режим за конечное время.
Вдоль поверхности соответствующее эквивалентное управление будет равно , и поэтому . Следовательно, пока , вторая строка динамики ошибки , войдет в скользящий режим за конечное время.
Вдоль поверхности соответствующее эквивалентное управление будет равно . Следовательно, пока , -я строка динамики ошибки, , войдет в скользящий режим за конечное время.
Итак, для достаточно больших коэффициентов усиления все оцененные наблюдателем состояния достигают фактических состояний за конечное время. Фактически, увеличение допускает сходимость за любое желаемое конечное время, пока каждая функция может быть ограничена с уверенностью. Следовательно, требование, чтобы отображение было диффеоморфизмом ( т. е. чтобы его якобианская линеаризация была обратимой), утверждает, что сходимость оцененного выхода подразумевает сходимость оцененного состояния. То есть, требование является условием наблюдаемости.
В случае наблюдателя скользящего режима для системы с входом необходимы дополнительные условия, чтобы ошибка наблюдения не зависела от входа. Например, что
не зависит от времени. Наблюдатель тогда
Мультинаблюдатель
Multi-observer расширяет структуру наблюдателя с высоким коэффициентом усиления с одного до нескольких наблюдателей, при этом многие модели работают одновременно. Это имеет два слоя: первый состоит из нескольких наблюдателей с высоким коэффициентом усиления с различными состояниями оценки, а второй определяет веса важности наблюдателей первого слоя. Алгоритм прост в реализации и не содержит никаких рискованных операций, таких как дифференциация. [4] Идея множественных моделей ранее применялась для получения информации в адаптивном управлении. [15]
Схема с несколькими наблюдателями
Предполагая, что число наблюдателей с высоким коэффициентом усиления равно ,
где индекс наблюдателя. Первый слой наблюдателей состоит из того же усиления , но они отличаются начальным состоянием . Во втором слое все из наблюдателей объединяются в один для получения единой оценки вектора состояния
где — весовые коэффициенты. Эти коэффициенты изменяются для обеспечения оценки на втором уровне и улучшения процесса наблюдения.
Предположим, что
и
где — некоторый вектор, зависящий от ошибки наблюдателя .
Некоторые преобразования приводят к проблеме линейной регрессии
Эта формула дает возможность оценить . Для построения многообразия нам нужно отображение между и обеспечение, которое вычисляется на основе измеримых сигналов. Первое, что нужно сделать, это исключить явление парковки из ошибки наблюдателя
.
Вычислите производную по времени , чтобы найти отображение m, приводящее к определяемому как
где — некоторая постоянная времени. Обратите внимание, что реле на обоих и его интегралы, следовательно, легко доступны в системе управления. Далее определяется законом оценки; и таким образом, это доказывает, что многообразие измеримо. Во втором слое для вводится как оценки коэффициентов. Ошибка отображения определяется как
где . Если коэффициенты равны , то ошибка отображения Теперь можно рассчитать из приведенного выше уравнения и, следовательно, явление пика уменьшается благодаря свойствам многообразия. Созданное отображение дает большую гибкость в процессе оценки. Даже можно оценить значение во втором слое и вычислить состояние . [4]
Ограничивающие наблюдатели
Ограничивающие [16] или интервальные наблюдатели [17] [18] составляют класс наблюдателей, которые одновременно предоставляют две оценки состояния: одна из оценок предоставляет верхнюю границу реального значения состояния, тогда как вторая предоставляет нижнюю границу. Тогда известно, что реальное значение состояния всегда находится в пределах этих двух оценок.
Эти границы очень важны в практических приложениях, [19] [20], поскольку они позволяют в каждый момент времени узнать точность оценки.
Математически можно использовать двух наблюдателей Люенбергера, если их правильно выбрать, используя, например, положительные системные свойства: [21] один для верхней границы (который гарантирует, что сходится к нулю сверху, когда , в отсутствие шума и неопределенности ), и нижнюю границу (который гарантирует, что сходится к нулю снизу). То есть, всегда
^ ab Уткин, Вадим; Гулднер, Юрген; Ши, Цзинсинь (1999), Управление скользящим режимом в электромеханических системах , Филадельфия, Пенсильвания: Taylor & Francis, Inc., ISBN978-0-7484-0116-1
^ ab Дракунов, С.В. (1983), «Адаптивный квазиоптимальный фильтр с разрывными параметрами», Автоматика и телемеханика , 44 (9): 1167–1175
^ abc Бернат, Дж.; Степьен, С. (2015), «Мультимоделирование как новая схема оценки для наблюдателей с высоким коэффициентом усиления», Международный журнал управления , 88 (6): 1209–1222, Bibcode : 2015IJC....88.1209B, doi : 10.1080/00207179.2014.1000380, S2CID 8599596
^ Кренер, А. Дж.; Исидори, Альберто (1983), «Линеаризация с помощью инжекции выходного сигнала и нелинейных наблюдателей», System and Control Letters , 3 : 47–52, doi : 10.1016/0167-6911(83)90037-3
^ Кренер, А. Дж.; Респондек, В. (1985), «Нелинейные наблюдатели с линеаризуемой динамикой ошибок», SIAM Journal on Control and Optimization , 23 (2): 197–216, doi : 10.1137/0323016
^ Готье, Дж. П.; Хаммури, Х.; Отман, С. (1992), «Простой наблюдатель для нелинейных систем, применяемых в биореакторах», IEEE Transactions on Automatic Control , 37 (6): 875–880, doi : 10.1109/9.256352
^ Хаммури, Х.; Киннаерт, М. (1996), «Новая процедура для изменяющейся во времени линеаризации вплоть до инжекции выходного сигнала», System and Control Letters , 28 (3): 151–157, doi :10.1016/0167-6911(96)00022-9
^ Чиккарелла, Г.; Далла Мора, М.; Германи, А. (1993), «Наблюдатель нелинейных систем, подобный Люенбергеру», International Journal of Control , 57 (3): 537–556, doi : 10.1080/00207179308934406
^ Го, Бао-Чжу; Чжао, Чжи-Лян (январь 2011 г.). «Расширенный наблюдатель состояний для нелинейных систем с неопределенностью». Труды IFAC, тома . 44 (1). Международная федерация автоматического управления : 1855–1860. doi :10.3182/20110828-6-IT-1002.00399 . Получено 8 августа 2023 г.
^ "Wayback Machine не заархивировала этот URL" . Получено 8 августа 2023 г.[ мертвая ссылка ]
^ Кумар, Сунил; Кумар Пал, Анил; Камал, Шьям; Сюн, Сяоган (19 мая 2023 г.). «Проектирование переключаемого наблюдателя с высоким коэффициентом усиления для нелинейных систем» . Международный журнал системной науки . 54 (7). Science Publishing Group : 1471–1483. Bibcode : 2023IJSS...54.1471K. doi : 10.1080/00207721.2023.2178863. S2CID 257145897. Получено 8 августа 2023 г.
^ "Регистрация" . IEEE Xplore . Получено 8 августа 2023 г.
^ Дракунов, С.В. (1992). «Наблюдатели скользящего режима на основе метода эквивалентного управления». [1992] Труды 31-й конференции IEEE по принятию решений и управлению. С. 2368–2370. doi :10.1109/CDC.1992.371368. ISBN978-0-7803-0872-5. S2CID 120072463.
^ Нарендра, К. С.; Хан, З. (август 2012 г.). «Новый подход к адаптивному управлению с использованием нескольких моделей». Международный журнал адаптивного управления и обработки сигналов . 26 (8): 778–799. doi :10.1002/acs.2269. ISSN 1099-1115. S2CID 60482210.
^ Комбастель, К. (2003). «Наблюдатель, ограничивающий государство, на основе зонотопов» (PDF) . Европейская конференция по контролю (ECC) 2003 г. стр. 2589–2594. doi :10.23919/ECC.2003.7085991. ISBN978-3-9524173-7-9. S2CID 13790057.
^ Рами, М. Айт; Ченг, К. Х.; Де Прада, К. (2008). «Жесткие надежные интервальные наблюдатели: подход LP» (PDF) . 2008 47-я конференция IEEE по принятию решений и управлению . стр. 2967–2972. doi :10.1109/CDC.2008.4739280. ISBN978-1-4244-3123-6. S2CID 288928.
^ Ефимов, Д.; Раисси, Т. (2016). «Проектирование интервальных наблюдателей для неопределенных динамических систем». Автоматизация и телеуправление . 77 (2): 191–225. doi :10.1134/S0005117916020016. hdl : 20.500.12210/25069 . S2CID 49322177.
^ http://www.iaeng.org/publication/WCE2010/WCE2010_pp656-661.pdf [ пустой URL-адрес PDF ]
^ Хадж-Садок, МЗ; Гузе, Дж. Л. (2001). «Оценка неопределенных моделей процессов активированного ила с интервальными наблюдателями». Журнал управления процессами . 11 (3): 299–310. doi :10.1016/S0959-1524(99)00074-8.
^ Рами, Мустафа Айт; Тадео, Фернандо; Хельмке, Уве (2011). «Положительные наблюдатели для линейных положительных систем и их последствия». International Journal of Control . 84 (4): 716–725. Bibcode : 2011IJC....84..716A. doi : 10.1080/00207179.2011.573000. S2CID 21211012.
Общие ссылки
Зонтаг, Эдуардо (1998), Математическая теория управления: детерминированные конечномерные системы. Второе издание , Springer, ISBN 978-0-387-98489-6
Внешние ссылки
Фильтр Калмана. Простое объяснение. Пошаговое руководство по фильтру Калмана с уравнениями.