Теория управления — это область инженерии управления и прикладной математики , которая занимается управлением динамическими системами в инженерных процессах и машинах. Цель состоит в том, чтобы разработать модель или алгоритм, управляющий применением системных входов для приведения системы в желаемое состояние, минимизируя любые задержки , перерегулирования или ошибки установившегося состояния и обеспечивая уровень стабильности управления ; часто с целью достижения степени оптимальности .
Для этого требуется контроллер с необходимым корректирующим поведением. Этот контроллер контролирует контролируемую переменную процесса (PV) и сравнивает ее с опорным или заданным значением (SP). Разница между фактическим и желаемым значением переменной процесса, называемая сигналом ошибки , или ошибкой SP-PV, применяется в качестве обратной связи для генерации управляющего воздействия, чтобы привести контролируемую переменную процесса к тому же значению, что и заданное значение. Другими аспектами, которые также изучаются, являются управляемость и наблюдаемость . Теория управления используется в проектировании систем управления для проектирования автоматизации, которая произвела революцию в производстве, авиации, связи и других отраслях промышленности, а также создала новые области, такие как робототехника .
Обычно широко используется диаграммный стиль, известный как блок-схема . В ней передаточная функция , также известная как системная функция или сетевая функция, представляет собой математическую модель связи между входом и выходом, основанную на дифференциальных уравнениях, описывающих систему.
Теория управления берет свое начало в 19 веке, когда Джеймс Клерк Максвелл впервые описал теоретическую основу работы регуляторов . [1] Теория управления была далее развита Эдвардом Раутом в 1874 году, Чарльзом Штурмом и в 1895 году Адольфом Гурвицем , которые внесли свой вклад в установление критериев устойчивости управления; и с 1922 года, разработка теории ПИД-регулирования Николасом Минорским . [ 2] Хотя основное применение математической теории управления заключается в проектировании систем управления , которое занимается проектированием систем управления процессами для промышленности, другие приложения простираются далеко за пределы этого. Как общая теория систем обратной связи, теория управления полезна везде, где возникает обратная связь - таким образом, теория управления также имеет приложения в науках о жизни, компьютерной инженерии, социологии и исследовании операций . [3]
Хотя системы управления различных типов восходят к античности, более формальный анализ этой области начался с динамического анализа центробежного регулятора , проведенного физиком Джеймсом Клерком Максвеллом в 1868 году под названием «О регуляторах» . [4] Центробежный регулятор уже использовался для регулирования скорости ветряных мельниц. [5] Максвелл описал и проанализировал явление автоколебаний , при котором запаздывания в системе могут приводить к сверхкомпенсации и нестабильному поведению. Это вызвало всплеск интереса к теме, в ходе которого одноклассник Максвелла, Эдвард Джон Раут , абстрагировал результаты Максвелла для общего класса линейных систем. [6] Независимо от этого, Адольф Гурвиц проанализировал устойчивость системы с помощью дифференциальных уравнений в 1877 году, что привело к тому, что сейчас известно как теорема Рауса–Гурвица . [7] [8]
Заметное применение динамического управления было в области пилотируемых полетов. Братья Райт совершили свои первые успешные испытательные полеты 17 декабря 1903 года и отличались своей способностью управлять своими полетами в течение значительных периодов времени (больше, чем способность создавать подъемную силу с помощью аэродинамического профиля, которая была известна). Непрерывное, надежное управление самолетом было необходимо для полетов, длящихся дольше нескольких секунд.
К началу Второй мировой войны теория управления стала важной областью исследований. Ирмгард Флюгге-Лотц разработала теорию прерывистых систем автоматического управления и применила принцип реверберации к разработке автоматического оборудования управления полетом для самолетов. [9] [10] Другие области применения прерывистого управления включали системы управления огнем , системы наведения и электронику .
Иногда для повышения устойчивости систем используются механические методы. Например, корабельные стабилизаторы — это плавники, установленные под ватерлинией и выступающие сбоку. На современных судах это могут быть активные плавники с гироскопическим управлением, которые способны изменять угол атаки для противодействия качке, вызванной ветром или волнами, действующими на судно.
Космическая гонка также зависела от точного управления космическими аппаратами, и теория управления также находит все большее применение в таких областях, как экономика и искусственный интеллект. Здесь можно сказать, что цель состоит в том, чтобы найти внутреннюю модель , которая подчиняется теореме о хорошем регуляторе . Так, например, в экономике, чем точнее торговая модель (акций или товаров) представляет действия рынка, тем легче она может контролировать этот рынок (и извлекать из него «полезную работу» (прибыль)). В ИИ примером может служить чат-бот, моделирующий состояние дискурса людей: чем точнее он может моделировать состояние человека (например, на горячей линии голосовой поддержки по телефону), тем лучше он может манипулировать человеком (например, выполняя корректирующие действия для решения проблемы, вызвавшей телефонный звонок на линию помощи). Эти последние два примера берут узкую историческую интерпретацию теории управления как набора дифференциальных уравнений, моделирующих и регулирующих кинетическое движение, и расширяют ее до обширного обобщения регулятора, взаимодействующего с растением .
По сути, существует два типа контура управления: управление с разомкнутым контуром (прямая связь) и управление с замкнутым контуром (обратная связь).
При управлении с открытым контуром управляющее воздействие контроллера не зависит от «выходного сигнала процесса» (или «регулируемой переменной процесса»). Хорошим примером этого является котел центрального отопления, управляемый только таймером, так что тепло подается в течение постоянного времени, независимо от температуры здания. Управляющим воздействием является включение/выключение котла, но управляемой переменной должна быть температура здания, но это не так, поскольку это управление котлом с открытым контуром, которое не дает замкнутого контура управления температурой.
В управлении с замкнутым контуром управляющее воздействие контроллера зависит от выходного сигнала процесса. В случае аналогии с котлом это будет включать термостат для контроля температуры здания и, таким образом, обратной связи сигнала, чтобы гарантировать, что контроллер поддерживает температуру здания на уровне, установленном на термостате. Таким образом, контроллер с замкнутым контуром имеет контур обратной связи, который гарантирует, что контроллер применяет управляющее воздействие для выдачи выходного сигнала процесса, такого же, как «опорный вход» или «заданное значение». По этой причине контроллеры с замкнутым контуром также называются контроллерами с обратной связью. [11]
Определение замкнутой системы управления согласно Британскому институту стандартов : «система управления, имеющая контрольную обратную связь, причем сигнал отклонения, сформированный в результате этой обратной связи, используется для управления действием конечного элемента управления таким образом, чтобы стремиться свести отклонение к нулю». [12]
Аналогично; « Система управления с обратной связью — это система, которая стремится поддерживать заданное соотношение одной системной переменной к другой путем сравнения функций этих переменных и использования разницы в качестве средства управления». [13]Контроллер с замкнутым контуром или контроллер с обратной связью — это контур управления , который включает обратную связь , в отличие от контроллера с разомкнутым контуром или контроллера без обратной связи . Контроллер с замкнутым контуром использует обратную связь для управления состояниями или выходами динамической системы . Его название происходит от информационного пути в системе: входы процесса (например, напряжение, подаваемое на электродвигатель ) оказывают влияние на выходы процесса (например, скорость или крутящий момент двигателя), которые измеряются датчиками и обрабатываются контроллером; результат (сигнал управления) «возвращается обратно» в качестве входа в процесс, замыкая контур. [14]
В случае линейных систем обратной связи контур управления , включающий датчики , алгоритмы управления и исполнительные механизмы, организован в попытке регулировать переменную в заданном значении (SP). Повседневным примером является круиз-контроль на дорожном транспортном средстве; где внешние воздействия, такие как холмы, могут вызвать изменение скорости, и водитель имеет возможность изменить желаемую заданную скорость. Алгоритм ПИД в контроллере восстанавливает фактическую скорость до желаемой скорости оптимальным образом, с минимальной задержкой или перерегулированием , управляя выходной мощностью двигателя транспортного средства. Системы управления, которые включают некоторое восприятие результатов, которых они пытаются достичь, используют обратную связь и могут в некоторой степени адаптироваться к изменяющимся обстоятельствам. Системы управления с разомкнутым контуром не используют обратную связь и работают только заранее заданными способами.
Контроллеры с замкнутым контуром имеют следующие преимущества по сравнению с контроллерами с разомкнутым контуром:
В некоторых системах замкнутый и разомкнутый контуры управления используются одновременно. В таких системах разомкнутый контур управления называется прямой связью и служит для дальнейшего улучшения характеристик отслеживания опорных сигналов.
Распространенной архитектурой регулятора замкнутого контура является ПИД-регулятор .
Область теории управления можно разделить на две ветви:
Математические методы анализа и проектирования систем управления делятся на две категории:
В отличие от анализа частотной области классической теории управления, современная теория управления использует представление пространства состояний во временной области, [ требуется ссылка ] математическую модель физической системы как набора входных, выходных и переменных состояния, связанных дифференциальными уравнениями первого порядка. Чтобы абстрагироваться от количества входов, выходов и состояний, переменные выражаются как векторы, а дифференциальные и алгебраические уравнения записываются в матричной форме (последнее возможно только тогда, когда динамическая система линейна). Представление пространства состояний (также известное как «подход во временной области») обеспечивает удобный и компактный способ моделирования и анализа систем с несколькими входами и выходами. При наличии входов и выходов нам в противном случае пришлось бы записывать преобразования Лапласа для кодирования всей информации о системе. В отличие от подхода частотной области, использование представления пространства состояний не ограничивается системами с линейными компонентами и нулевыми начальными условиями. «Пространство состояний» относится к пространству, оси которого являются переменными состояния. Состояние системы может быть представлено как точка внутри этого пространства. [17] [18]
Системы управления можно разделить на различные категории в зависимости от количества входов и выходов.
Область применения классической теории управления ограничена проектированием систем с одним входом и одним выходом (SISO), за исключением случаев анализа подавления помех с использованием второго входа. Анализ системы выполняется во временной области с использованием дифференциальных уравнений , в комплексной области s с помощью преобразования Лапласа или в частотной области путем преобразования из комплексной области s. Можно предположить, что многие системы имеют второй порядок и реакцию системы с одной переменной во временной области. Контроллер, разработанный с использованием классической теории, часто требует настройки на месте из-за неверных приближений проектирования. Тем не менее, из-за более простой физической реализации классических конструкций контроллеров по сравнению с системами, разработанными с использованием современной теории управления, эти контроллеры являются предпочтительными в большинстве промышленных приложений. Наиболее распространенными контроллерами, разработанными с использованием классической теории управления, являются ПИД-регуляторы . Менее распространенная реализация может включать в себя либо опережающий, либо запаздывающий фильтр, либо оба фильтра. Конечной конечной целью является удовлетворение требований, обычно предъявляемых во временной области, называемой откликом на скачок, или иногда в частотной области, называемой откликом разомкнутого контура. Характеристики реакции на скачок, применяемые в спецификации, обычно представляют собой процент перерегулирования, время установления и т. д. Характеристики реакции разомкнутого контура, применяемые в спецификации, обычно представляют собой запас усиления и фазы и полосу пропускания. Эти характеристики можно оценить с помощью моделирования, включая динамическую модель контролируемой системы в сочетании с моделью компенсации.
Современная теория управления выполняется в пространстве состояний и может иметь дело с системами с несколькими входами и несколькими выходами (MIMO). Это преодолевает ограничения классической теории управления в более сложных задачах проектирования, таких как управление истребителем, с тем ограничением, что анализ в частотной области невозможен. В современном проектировании система представляется с наибольшим преимуществом в виде набора разъединенных дифференциальных уравнений первого порядка, определенных с использованием переменных состояния . Нелинейные , многомерные, адаптивные и надежные теории управления попадают в это разделение. Матричные методы существенно ограничены для систем MIMO, где линейная независимость не может быть обеспечена во взаимосвязи между входами и выходами. [ необходима цитата ] Будучи довольно новой, современная теория управления имеет много областей, которые еще предстоит изучить. Такие ученые, как Рудольф Э. Кальман и Александр Ляпунов, хорошо известны среди людей, которые сформировали современную теорию управления.
Устойчивость общей динамической системы при отсутствии входных данных можно описать с помощью критериев устойчивости Ляпунова .
Для простоты в следующих описаниях основное внимание уделяется непрерывным и дискретным линейным системам .
Математически это означает, что для того, чтобы причинная линейная система была устойчивой, все полюса ее передаточной функции должны иметь отрицательные действительные значения, т.е. действительная часть каждого полюса должна быть меньше нуля. Практически говоря, устойчивость требует, чтобы комплексные полюса передаточной функции находились
Разница между двумя случаями обусловлена просто традиционным методом построения графиков функций передачи непрерывного времени и дискретного времени. Непрерывное преобразование Лапласа выполняется в декартовых координатах , где ось является действительной осью, а дискретное Z-преобразование выполняется в круговых координатах , где ось является действительной осью.
Когда выполняются соответствующие условия, указанные выше, система называется асимптотически устойчивой ; переменные асимптотически устойчивой системы управления всегда уменьшаются от своего начального значения и не показывают перманентных колебаний. Перманентные колебания возникают, когда полюс имеет действительную часть, точно равную нулю (в случае непрерывного времени), или модуль, равный единице (в случае дискретного времени). Если просто устойчивая реакция системы не затухает и не растет со временем и не имеет колебаний, она является предельно устойчивой ; в этом случае передаточная функция системы имеет неповторяющиеся полюса в начале комплексной плоскости (т. е. их действительная и комплексная компоненты равны нулю в случае непрерывного времени). Колебания присутствуют, когда полюса с действительной частью, равной нулю, имеют мнимую часть, не равную нулю.
Если рассматриваемая система имеет импульсную характеристику
тогда Z-преобразование (см. этот пример ) задается как
которая имеет полюс в (нулевая мнимая часть ). Эта система BIBO (асимптотически) устойчива, поскольку полюс находится внутри единичной окружности.
Однако, если импульсный отклик был
тогда Z-преобразование равно
которая имеет полюс в точке и не является BIBO-устойчивой, поскольку полюс имеет модуль строго больше единицы.
Существует множество инструментов для анализа полюсов системы. Они включают графические системы, такие как корневой годограф , графики Боде или графики Найквиста .
Механические изменения могут сделать оборудование (и системы управления) более устойчивыми. Моряки добавляют балласт, чтобы улучшить устойчивость судов. Круизные суда используют стабилизаторы качки , которые простираются поперечно от борта судна примерно на 30 футов (10 м) и непрерывно вращаются вокруг своих осей, чтобы создавать силы, противодействующие качке.
Управляемость и наблюдаемость являются основными проблемами при анализе системы перед принятием решения о наилучшей стратегии управления, которую следует применить, или о том, возможно ли вообще контролировать или стабилизировать систему. Управляемость связана с возможностью принудительного перевода системы в определенное состояние с помощью соответствующего управляющего сигнала. Если состояние неуправляемо, то никакой сигнал никогда не сможет контролировать состояние. Если состояние неуправляемо, но его динамика стабильна, то состояние называется стабилизируемым . Наблюдаемость, напротив, связана с возможностью наблюдения за состоянием системы посредством выходных измерений. Если состояние ненаблюдаемо, контроллер никогда не сможет определить поведение ненаблюдаемого состояния и, следовательно, не может использовать его для стабилизации системы. Однако, подобно условию стабилизируемости выше, если состояние не может наблюдаться, оно все равно может быть обнаруживаемым.
С геометрической точки зрения, если рассматривать состояния каждой переменной системы, которая должна контролироваться, каждое «плохое» состояние этих переменных должно быть контролируемым и наблюдаемым, чтобы обеспечить хорошее поведение в замкнутой системе. То есть, если одно из собственных значений системы не является одновременно контролируемым и наблюдаемым, эта часть динамики останется нетронутой в замкнутой системе. Если такое собственное значение не является стабильным, динамика этого собственного значения будет присутствовать в замкнутой системе, которая, следовательно, будет нестабильной. Ненаблюдаемые полюса отсутствуют в реализации передаточной функции представления пространства состояний, поэтому иногда последнее предпочтительнее в анализе динамических систем.
Решения проблем неконтролируемой или ненаблюдаемой системы включают добавление исполнительных механизмов и датчиков.
За последние годы было разработано несколько различных стратегий управления. Они варьируются от крайне общих (ПИД-регулятор) до других, посвященных очень конкретным классам систем (особенно робототехнике или круиз-контролю самолетов).
Проблема управления может иметь несколько спецификаций. Устойчивость, конечно, всегда присутствует. Контроллер должен гарантировать, что замкнутая система устойчива, независимо от устойчивости разомкнутой системы. Неудачный выбор контроллера может даже ухудшить устойчивость разомкнутой системы, чего обычно следует избегать. Иногда желательно получить определенную динамику в замкнутой системе: т. е. чтобы полюса имели , где — фиксированное значение, строго большее нуля, вместо того, чтобы просто спросить, что .
Другой типичной спецификацией является отклонение ступенчатого возмущения; включение интегратора в цепь разомкнутого контура (т.е. непосредственно перед контролируемой системой) легко достигает этого. Другие классы возмущений требуют включения других типов подсистем.
Другие спецификации "классической" теории управления касаются времени отклика замкнутой системы. К ним относятся время нарастания (время, необходимое системе управления для достижения желаемого значения после возмущения), пиковый выброс (наивысшее значение, достигнутое откликом до достижения желаемого значения) и другие ( время установления , четверть спада). Спецификации частотной области обычно связаны с надежностью (см. далее).
Современные оценки эффективности используют некоторые вариации интегрированной ошибки отслеживания (IAE, ISA, CQI).
Система управления всегда должна обладать некоторым свойством надежности. Надежный контроллер таков, что его свойства не сильно меняются, если его применить к системе, немного отличающейся от математической, использованной для его синтеза. Это требование важно, поскольку ни одна реальная физическая система не ведет себя так, как ряд дифференциальных уравнений, используемых для ее математического представления. Обычно выбирается более простая математическая модель для упрощения вычислений, в противном случае истинная динамика системы может быть настолько сложной, что полная модель невозможна.
Процесс определения уравнений, управляющих динамикой модели, называется идентификацией системы . Это можно сделать в автономном режиме: например, выполнив ряд мер, из которых можно вычислить приближенную математическую модель, обычно ее передаточную функцию или матрицу. Однако такая идентификация из выходных данных не может учитывать ненаблюдаемую динамику. Иногда модель строится непосредственно, исходя из известных физических уравнений, например, в случае системы масса-пружина-демпфер мы знаем, что . Даже если предположить, что при проектировании контроллера используется «полная» модель, все параметры, включенные в эти уравнения (называемые «номинальными параметрами»), никогда не известны с абсолютной точностью; система управления должна будет вести себя правильно даже при подключении к физической системе с истинными значениями параметров, далекими от номинальных.
Некоторые передовые методы управления включают в себя процесс идентификации «онлайн» (см. далее). Параметры модели вычисляются («идентифицируются») во время работы самого контроллера. Таким образом, если происходит резкое изменение параметров, например, если рука робота отпускает груз, контроллер автоматически подстраивается, чтобы обеспечить правильную работу.
Анализ надежности системы управления SISO (один вход один выход) может быть выполнен в частотной области, учитывая передаточную функцию системы и используя диаграммы Найквиста и Боде . Темы включают запас по усилению и фазе и запас по амплитуде. Для MIMO (много входов и много выходов) и, в целом, более сложных систем управления необходимо рассмотреть теоретические результаты, разработанные для каждого метода управления (см. следующий раздел). То есть, если требуются особые качества надежности, инженер должен переключить свое внимание на метод управления, включив эти качества в его свойства.
Особая проблема надежности — это требование к системе управления работать должным образом при наличии ограничений на вход и состояние. В физическом мире каждый сигнал ограничен. Может случиться, что контроллер будет посылать сигналы управления, которые не могут быть отслежены физической системой, например, пытаясь вращать клапан с чрезмерной скоростью. Это может привести к нежелательному поведению замкнутой системы или даже повредить или сломать приводы или другие подсистемы. Для решения этой проблемы доступны специальные методы управления: управление с прогнозированием модели (см. ниже) и системы защиты от срабатывания . Последняя состоит из дополнительного блока управления, который гарантирует, что сигнал управления никогда не превысит заданный порог.
Для систем MIMO размещение полюсов может быть выполнено математически с использованием представления пространства состояний системы с открытым контуром и вычисления матрицы обратной связи, назначающей полюса в желаемых позициях. В сложных системах это может потребовать возможностей компьютерного расчета и не всегда может гарантировать надежность. Кроме того, все состояния системы в общем случае не измеряются, поэтому наблюдатели должны быть включены и включены в проект размещения полюсов.
Процессы в таких отраслях, как робототехника и аэрокосмическая промышленность, обычно имеют сильную нелинейную динамику. В теории управления иногда возможно линеаризировать такие классы систем и применять линейные методы, но во многих случаях может быть необходимо разработать с нуля теории, позволяющие управлять нелинейными системами. Такие, например, как линеаризация обратной связи , бэкстепинг , управление скользящим режимом , управление линеаризацией траектории, обычно используют результаты, основанные на теории Ляпунова . Дифференциальная геометрия широко использовалась в качестве инструмента для обобщения известных концепций линейного управления на нелинейный случай, а также для демонстрации тонкостей, которые делают его более сложной проблемой. Теория управления также использовалась для расшифровки нейронного механизма, который управляет когнитивными состояниями. [19]
Когда система управляется несколькими контроллерами, проблема заключается в децентрализованном управлении. Децентрализация полезна во многих отношениях, например, она помогает системам управления работать на большей географической территории. Агенты в децентрализованных системах управления могут взаимодействовать, используя каналы связи, и координировать свои действия.
Стохастическая задача управления — это задача, в которой эволюция переменных состояния подвергается случайным шокам извне системы. Детерминированная задача управления не подвержена внешним случайным шокам.
Каждая система управления должна гарантировать в первую очередь устойчивость поведения замкнутого контура. Для линейных систем это может быть достигнуто путем прямого размещения полюсов. Нелинейные системы управления используют специальные теории (обычно основанные на теории Александра Ляпунова ) для обеспечения устойчивости без учета внутренней динамики системы. Возможность выполнения различных спецификаций зависит от рассматриваемой модели и выбранной стратегии управления.
Многие активные и исторические деятели внесли значительный вклад в теорию управления, в том числе:
Здесь мы используем инструменты из теорий управления и сетей, чтобы предложить механистическое объяснение того, как мозг перемещается между когнитивными состояниями, взятое из сетевой организации микроструктуры белого вещества