stringtranslate.com

Государственный наблюдатель

В теории управления наблюдатель состояния или оценщик состояния — это система, которая обеспечивает оценку внутреннего состояния данной реальной системы на основе измерений входных и выходных данных реальной системы. Обычно он реализуется на компьютере и обеспечивает основу для многих практических приложений.

Знание состояния системы необходимо для решения многих задач теории управления ; например, стабилизация системы с помощью обратной связи по состоянию . В большинстве практических случаев физическое состояние системы не может быть определено прямым наблюдением. Вместо этого косвенные эффекты внутреннего состояния наблюдаются через выходные данные системы. Простой пример — транспортные средства в туннеле: скорости и скорости, с которыми транспортные средства въезжают и покидают туннель, можно наблюдать непосредственно, но точное состояние внутри туннеля можно только оценить. Если система наблюдаема , можно полностью восстановить состояние системы на основе ее выходных измерений с помощью наблюдателя состояния.

Типичная модель наблюдателя

Блок-схема Luenberger Observer. Ввод усиления наблюдателя L равен .

Линейные, с задержкой, скользящий режим, с высоким коэффициентом усиления, тау, основанные на однородности, расширенные и кубические наблюдатели входят в число нескольких структур наблюдателей, используемых для оценки состояния линейных и нелинейных систем. Структура линейного наблюдателя описана в следующих разделах.

Случай дискретного времени

Предполагается, что состояние линейной, инвариантной во времени системы с дискретным временем удовлетворяет

где в момент времени находится состояние объекта; это его входы; и это его результаты. Эти уравнения просто говорят, что текущая продукция предприятия и его будущее состояние определяются исключительно его текущим состоянием и текущими затратами. (Хотя эти уравнения выражаются через дискретные шаги по времени, очень похожие уравнения справедливы и для непрерывных систем). Если эта система наблюдаема , то выходные данные объекта можно использовать для управления состоянием наблюдателя состояния.

Модель наблюдателя физической системы обычно выводится из приведенных выше уравнений. Могут быть включены дополнительные условия, чтобы гарантировать, что при получении последовательных измеренных значений входных и выходных данных объекта состояние модели сходится к состоянию объекта. В частности, выходные данные наблюдателя можно вычесть из выходных данных объекта, а затем умножить на матрицу ; затем это добавляется к уравнениям состояния наблюдателя для получения так называемого наблюдателя Люенбергера , определяемого приведенными ниже уравнениями. Обратите внимание, что переменные наблюдателя состояния обычно обозначаются «шляпой»: чтобы отличить их от переменных уравнений, которым удовлетворяет физическая система.

Наблюдатель называется асимптотически устойчивым, если ошибка наблюдателя стремится к нулю при . Для наблюдателя Люенбергера ошибка наблюдателя удовлетворяет условию . Таким образом, наблюдатель Люенбергера для этой системы с дискретным временем асимптотически устойчив, когда все собственные значения матрицы находятся внутри единичного круга.

В целях управления выходной сигнал системы наблюдения возвращается на вход как наблюдателя, так и объекта через матрицу выигрышей .

Тогда уравнения наблюдателя примут вид:

или, проще говоря,

Благодаря принципу разделения мы знаем, что можем выбирать и самостоятельно без ущерба для общей стабильности систем. Как правило, полюса наблюдателя обычно выбираются так, чтобы сходиться в 10 раз быстрее, чем полюса системы .

Случай непрерывного времени

Предыдущий пример был для наблюдателя, реализованного в системе LTI с дискретным временем. Однако для случая непрерывного времени процесс аналогичен; коэффициенты усиления наблюдателя выбираются так, чтобы динамика ошибок в непрерывном времени асимптотически сходилась к нулю (т. е. когда – матрица Гурвица ).

Для линейной системы с непрерывным временем

где наблюдатель выглядит аналогично описанному выше случаю дискретного времени:

.

Ошибка наблюдателя удовлетворяет уравнению

.

Собственные значения матрицы могут выбираться произвольно путем соответствующего выбора коэффициента усиления наблюдателя, когда пара наблюдаема, т.е. условие наблюдаемости выполняется. В частности, это можно сделать по Гурвицу, поэтому ошибка наблюдателя при .

Пик и другие методы наблюдения

Когда коэффициент усиления наблюдателя высок, линейный наблюдатель Люенбергера очень быстро сходится к состояниям системы. Однако высокий коэффициент усиления наблюдателя приводит к явлению пика, при котором начальная ошибка оценки может быть непомерно большой (т. е. непрактичной или небезопасной в использовании). [1] Как следствие, доступны нелинейные методы наблюдения с высоким коэффициентом усиления, которые быстро сходятся без явления обострения. Например, управление скользящим режимом можно использовать для создания наблюдателя, который сводит ошибку одного оцененного состояния к нулю за конечное время даже при наличии ошибки измерения; в других состояниях есть ошибка, которая ведет себя аналогично ошибке наблюдателя Люенбергера после исчезновения пика. Наблюдатели скользящего режима также обладают привлекательными свойствами устойчивости к шуму, которые аналогичны фильтру Калмана . [2] [3] Другой подход заключается в применении нескольких наблюдателей, что значительно улучшает переходные процессы и уменьшает выбросы наблюдателей. Мультинаблюдатель можно адаптировать к любой системе, где применим наблюдатель с высоким коэффициентом усиления. [4]

Государственные наблюдатели нелинейных систем

Высокий коэффициент усиления, скользящий режим и расширенные наблюдатели являются наиболее распространенными наблюдателями для нелинейных систем. Чтобы проиллюстрировать применение наблюдателей скользящего режима для нелинейных систем, сначала рассмотрим нелинейную систему без входных данных:

где . Также предположим, что существует измеримый результат, определяемый формулой

Существует несколько неаппроксимированных подходов к проектированию наблюдателя. Два наблюдателя, приведенные ниже, также применимы к случаю, когда у системы есть вход. То есть,

Линеаризуемая динамика ошибок

Одно из предложений Кренера и Исидори [5] и Кренера и Респондека [6] может быть применено в ситуации, когда существует линеаризующее преобразование (т. е. диффеоморфизм , подобный тому, который используется при линеаризации с обратной связью ), такое, что в новых переменных уравнения системы читать

Наблюдатель Люенбергера тогда спроектирован как

.

Ошибка наблюдателя для преобразованной переменной удовлетворяет тому же уравнению, что и в классическом линейном случае.

.

Как показали Готье, Хаммури и Отман [7] и Хаммури и Киннэрт, [8], если существует преобразование такое, что систему можно преобразовать к виду

тогда наблюдатель спроектирован как

,

где – изменяющийся во времени выигрыш наблюдателя.

Чиккарелла, Далла Мора и Джермани [9] получили более продвинутые и общие результаты, устранив необходимость в нелинейном преобразовании и доказав глобальную асимптотическую сходимость оцениваемого состояния к истинному состоянию, используя только простые предположения о регулярности.

Переключенные наблюдатели

Как обсуждалось выше для линейного случая, явление пика, присутствующее у наблюдателей Люенбергера, оправдывает использование переключаемых наблюдателей. Переключаемый наблюдатель включает в себя реле или двоичный переключатель, который действует при обнаружении мельчайших изменений измеряемого выходного сигнала. Некоторые распространенные типы переключаемых наблюдателей включают наблюдатель в скользящем режиме, нелинейный наблюдатель с расширенным состоянием, [10] наблюдатель с фиксированным временем, [11] переключаемый наблюдатель с высоким коэффициентом усиления [12] и объединяющий наблюдатель. [13] Наблюдатель скользящего режима использует нелинейную обратную связь с высоким коэффициентом усиления для передачи оцененных состояний на гиперповерхность , где нет разницы между расчетным выходным сигналом и измеренным выходным сигналом. Нелинейный коэффициент усиления, используемый в наблюдателе, обычно реализуется с помощью масштабированной функции переключения, такой как знак (т. е. знак) расчетно-измеренной выходной ошибки. Следовательно, из-за этой обратной связи с высоким коэффициентом усиления векторное поле наблюдателя имеет складку, так что траектории наблюдателя скользят по кривой, где расчетный выходной сигнал точно соответствует измеренному выходному сигналу. Таким образом, если система наблюдаема по ее выходным данным, все состояния наблюдателя будут приведены к фактическим состояниям системы. Кроме того, используя знак ошибки для управления наблюдателем в скользящем режиме, траектории наблюдателя становятся нечувствительными ко многим формам шума. Следовательно, некоторые наблюдатели скользящего режима имеют привлекательные свойства, аналогичные фильтру Калмана, но с более простой реализацией. [2] [3]

Как предположил Дракунов [14] , наблюдатель скользящего режима может быть спроектирован и для класса нелинейных систем. Такой наблюдатель может быть записан в терминах исходной оценки переменной и имеет вид

где:

Кратко эту идею можно объяснить следующим образом. Согласно теории скользящих режимов, для описания поведения системы после запуска скользящего режима функцию следует заменить эквивалентными значениями (см. эквивалентное управление в теории скользящих режимов ). На практике он переключается (вибрирует) с высокой частотой, при этом медленная составляющая равна эквивалентному значению. Применяя соответствующий фильтр нижних частот для избавления от высокочастотной составляющей, можно получить значение эквивалентного управления, которое содержит больше информации о состоянии оцениваемой системы. Описанный выше наблюдатель использует этот метод несколько раз, чтобы получить состояние нелинейной системы в идеале за конечное время.

Модифицированная ошибка наблюдения может быть записана в преобразованных состояниях . В частности,

и так

Так:

  1. Пока , первая строка динамики ошибок будет удовлетворять достаточным условиям для входа в скользящий режим за конечное время.
  2. Вдоль поверхности соответствующее эквивалентное управление будет равно , и так . Следовательно, пока , вторая строка динамики ошибок, , перейдет в скользящий режим за конечное время.
  3. Вдоль поверхности соответствующее эквивалентное управление будет равно . Следовательно, до тех пор, пока , -я строка динамики ошибок , перейдет в скользящий режим за конечное время.

Таким образом, при достаточно больших выигрышах все оцененные состояния наблюдателя достигают фактических состояний за конечное время. Фактически, увеличение позволяет добиться сходимости в любое желаемое конечное время, если каждая функция может быть ограничена с уверенностью. Следовательно, требование, чтобы отображение было диффеоморфизмом (т. е. чтобы его якобианская линеаризация была обратимой), утверждает, что сходимость оцениваемого вывода влечет за собой сходимость оцениваемого состояния. То есть требование является условием наблюдаемости.

В случае наблюдателя скользящего режима для системы со входом необходимы дополнительные условия, чтобы ошибка наблюдения не зависела от входа. Например, это

не зависит от времени. Тогда наблюдатель

Мульти-наблюдатель

Функция нескольких наблюдателей расширяет структуру наблюдателей с высоким коэффициентом усиления от одного до нескольких наблюдателей, при этом множество моделей работают одновременно. Он имеет два уровня: первый состоит из нескольких наблюдателей с высоким коэффициентом усиления с разными состояниями оценки, а второй определяет веса важности наблюдателей первого уровня. Алгоритм прост в реализации и не содержит рискованных операций типа дифференцирования. [4] Идея множественных моделей ранее применялась для получения информации в адаптивном управлении. [15]

Предполагая, что количество наблюдателей с высоким коэффициентом усиления равно ,

где индекс наблюдателя. Наблюдатели первого уровня состоят из одного и того же усиления, но различаются начальным состоянием . Во втором слое все наблюдатели объединяются в одного для получения единой оценки вектора состояния.

где весовые коэффициенты. Эти факторы изменяются, чтобы обеспечить оценку на втором уровне и улучшить процесс наблюдения.

Предположим, что

и

где – некоторый вектор, зависящий от ошибки наблюдателя .

Некоторые преобразования приводят к задаче линейной регрессии

Эта формула дает возможность оценить . Чтобы построить многообразие, нам нужно сопоставление и гарантия, которую можно вычислить на основе измеримых сигналов. Прежде всего необходимо устранить явление парковки из- за ошибки наблюдателя.

.

Вычислите производную по времени, чтобы найти отображение m, которое будет определено как

где - некоторая постоянная времени. Обратите внимание, что реле реле и его интегралы, следовательно, легко доступны в системе управления. Дальнейшее определяется законом оценки; и таким образом доказывается, что многообразие измеримо. Во втором слое for вводится как оценки коэффициентов. Ошибка отображения определяется как

где . Если коэффициенты равны , то ошибка отображения. Теперь можно вычислить уравнение, приведенное выше, и, следовательно, явление обострения уменьшается благодаря свойствам многообразия. Созданное отображение дает большую гибкость в процессе оценки. Даже можно оценить значение во втором слое и вычислить состояние . [4]

Ограничивающие наблюдатели

Ограничивающие [16] или интервальные наблюдатели [17] [18] представляют собой класс наблюдателей, которые обеспечивают две оценки состояния одновременно: одна из оценок дает верхнюю границу реального значения состояния, тогда как вторая дает нижнюю. граница. Тогда известно, что реальная стоимость государства всегда находится в пределах этих двух оценок.

Эти границы очень важны в практических приложениях, [19] [20], поскольку они позволяют в любой момент времени узнать точность оценки.

Математически можно использовать два наблюдателя Люенбергера, если они правильно выбраны, используя, например, положительные свойства системы : [21] один для верхней границы (который обеспечивает сходимость к нулю сверху при , в отсутствие шума и неопределенности ) и нижнюю границу (гарантирующую сходимость к нулю снизу). То есть всегда

Смотрите также

Рекомендации

Встроенные ссылки
  1. ^ Халил, Гонконг (2002), Нелинейные системы (3-е изд.), Аппер-Седл-Ривер, Нью-Джерси: Прентис-Холл , ISBN 978-0-13-067389-3
  2. ^ аб Уткин, Вадим; Гульднер, Юрген; Ши, Цзинсинь (1999), Управление скользящим режимом в электромеханических системах , Филадельфия, Пенсильвания: Taylor & Francisco, Inc., ISBN 978-0-7484-0116-1
  3. ^ аб Дракунов, С.В. (1983), «Адаптивный квазиоптимальный фильтр с разрывными параметрами», Автоматика и телемеханика , 44 (9): 1167–1175.
  4. ^ abc Бернат, Дж.; Степьен, С. (2015), «Мульти-моделирование как новая схема оценки для наблюдателей с высоким коэффициентом усиления», International Journal of Control , 88 (6): 1209–1222, Bibcode : 2015IJC....88.1209B, doi : 10.1080/00207179.2014 .1000380, S2CID  8599596
  5. ^ Кренер, AJ; Исидори, Альберто (1983), «Линеаризация путем ввода выходного сигнала и нелинейных наблюдателей», System and Control Letters , 3 : 47–52, doi : 10.1016/0167-6911(83)90037-3
  6. ^ Кренер, AJ; Респондек, В. (1985), «Нелинейные наблюдатели с линеаризуемой динамикой ошибок», SIAM Journal on Control and Optimization , 23 (2): 197–216, doi : 10.1137/0323016
  7. ^ Готье, JP; Хаммури, Х.; Отман, С. (1992), «Простой наблюдатель для приложений нелинейных систем в биореакторах», IEEE Transactions on Auto Control , 37 (6): 875–880, doi : 10.1109/9.256352
  8. ^ Хаммори, Х.; Киннарт, М. (1996), «Новая процедура изменяющейся во времени линеаризации вплоть до ввода вывода», System and Control Letters , 28 (3): 151–157, doi : 10.1016/0167-6911(96)00022-9
  9. ^ Чиккарелла, Г.; Далла Мора, М.; Джермани, А. (1993), «Наблюдатель нелинейных систем, подобный Люенбергеру», International Journal of Control , 57 (3): 537–556, doi : 10.1080/00207179308934406
  10. ^ Го, Бао-Чжу; Чжао, Чжи-Лян (январь 2011 г.). «Расширенный государственный наблюдатель для нелинейных систем с неопределенностью». Тома трудов МФБ . 44 (1). Международная федерация автоматического управления : 1855–1860 гг. дои : 10.3182/20110828-6-IT-1002.00399 . Проверено 8 августа 2023 г.
  11. ^ «Wayback Machine не заархивировала этот URL» . Проверено 8 августа 2023 г.[ мертвая ссылка ]
  12. ^ Кумар, Сунил; Кумар Пал, Анил; Камаль, Шьям; Сюн, Сяоган (19 мая 2023 г.). «Проектирование переключаемого наблюдателя с высоким коэффициентом усиления для нелинейных систем» . Международный журнал системных наук . 54 (7). Научно-издательская группа : 1471–1483. Бибкод : 2023IJSS...54.1471K. дои : 10.1080/00207721.2023.2178863. S2CID  257145897 . Проверено 8 августа 2023 г.
  13. ^ "Регистрация" . IEEE Эксплор . Проверено 8 августа 2023 г.
  14. ^ Дракунов, СВ (1992). «Скользящие наблюдатели на основе эквивалентного метода управления». [1992] Материалы 31-й конференции IEEE по принятию решений и управлению. стр. 2368–2370. дои : 10.1109/CDC.1992.371368. ISBN 978-0-7803-0872-5. S2CID  120072463.
  15. ^ Нарендра, Канзас; Хан, З. (август 2012 г.). «Новый подход к адаптивному управлению с использованием нескольких моделей». Международный журнал адаптивного управления и обработки сигналов . 26 (8): 778–799. дои : 10.1002/acs.2269. ISSN  1099-1115. S2CID  60482210.
  16. ^ Комбастель, К. (2003). «Наблюдатель за границей штата на основе зонотопов» (PDF) . Европейская конференция по контролю (ECC) , 2003 г. стр. 2589–2594. дои : 10.23919/ECC.2003.7085991. ISBN 978-3-9524173-7-9. S2CID  13790057.
  17. ^ Рами, М. Айт; Ченг, Швейцария; Де Прада, К. (2008). «Наблюдатели с жесткими устойчивыми интервалами: подход LP» (PDF) . 2008 г. 47-я конференция IEEE по принятию решений и управлению . стр. 2967–2972. дои : 10.1109/CDC.2008.4739280. ISBN 978-1-4244-3123-6. S2CID  288928.
  18. ^ Ефимов, Д.; Раисси, Т. (2016). «Проектирование интервальных наблюдателей для неопределенных динамических систем». Автоматизация и дистанционное управление . 77 (2): 191–225. дои : 10.1134/S0005117916020016. hdl : 20.500.12210/25069 . S2CID  49322177.
  19. ^ http://www.iaeng.org/publication/WCE2010/WCE2010_pp656-661.pdf [ пустой URL-адрес PDF ]
  20. ^ Хадж-Садок, МЗ; Гузе, JL (2001). «Оценка неопределенных моделей процессов в активном иле с помощью интервальных наблюдателей». Журнал управления процессами . 11 (3): 299–310. дои : 10.1016/S0959-1524(99)00074-8.
  21. ^ Рами, Мустафа Айт; Тадео, Фернандо; Хельмке, Уве (2011). «Позитивные наблюдатели линейных положительных систем и их последствия». Международный журнал контроля . 84 (4): 716–725. Бибкод : 2011IJC....84..716A. дои : 10.1080/00207179.2011.573000. S2CID  21211012.
Общие ссылки

Внешние ссылки