stringtranslate.com

Оптимизация траектории

Оптимизация траектории — это процесс проектирования траектории , которая минимизирует (или максимизирует) некоторую меру производительности, удовлетворяя при этом набору ограничений. Вообще говоря, оптимизация траектории — это метод вычисления решения с открытым контуром для задачи оптимального управления . Он часто используется для систем, где вычисление полного решения с закрытым контуром не требуется, непрактично или невозможно. Если задача оптимизации траектории может быть решена со скоростью, заданной обратной константой Липшица , то ее можно использовать итеративно для генерации решения с закрытым контуром в смысле Каратеодори . Если для задачи с бесконечным горизонтом выполняется только первый шаг траектории, то это известно как управление с прогнозированием модели (MPC) .

Хотя идея оптимизации траектории существует уже сотни лет ( вариационное исчисление , задача брахистохроны ), она стала практической для решения реальных задач только с появлением компьютера. Многие из первоначальных приложений оптимизации траектории были в аэрокосмической промышленности, вычисляя траектории запуска ракет и снарядов. В последнее время оптимизация траектории также использовалась в самых разных промышленных процессах и робототехнике. [1]

История

Оптимизация траектории впервые появилась в 1697 году с введением задачи о брахистохроне: найти форму проволоки, такую, чтобы скользящая по ней бусина перемещалась между двумя точками за минимальное время. [2] Интересно в этой задаче то, что она оптимизируется по кривой (форме проволоки), а не по одному числу. Самое известное из решений было вычислено с использованием вариационного исчисления .

В 1950-х годах цифровые компьютеры начали делать оптимизацию траектории практической для решения реальных задач. Первые подходы к оптимальному управлению выросли из вариационного исчисления , основанного на исследованиях Гилберта Эймса Блисса и Брайсона [3] в Америке и Понтрягина [4] в России. Особо следует отметить принцип максимума Понтрягина . Эти ранние исследователи создали основу того, что мы сейчас называем косвенными методами оптимизации траектории.

Большая часть ранних работ по оптимизации траектории была сосредоточена на вычислении профилей тяги ракеты, как в вакууме, так и в атмосфере. Это раннее исследование открыло множество основных принципов, которые используются и сегодня. Другим успешным применением были траектории набора высоты для ранних реактивных самолетов. Из-за высокого сопротивления, связанного с областью трансзвукового сопротивления, и низкой тяги ранних реактивных самолетов, оптимизация траектории была ключом к максимизации характеристик набора высоты. Оптимальные траектории на основе управления были ответственны за некоторые мировые рекорды. В этих ситуациях пилот следовал графику Маха в зависимости от высоты, основанному на оптимальных решениях управления.

Одной из важных ранних проблем оптимизации траектории была проблема особой дуги , где принцип максимума Понтрягина не дает полного решения. Примером проблемы с особым управлением является оптимизация тяги ракеты, летящей на постоянной высоте и запущенной на низкой скорости. Здесь проблема заключается в реверберационном управлении с максимально возможной тягой до достижения особой дуги. Затем решение особого управления обеспечивает более низкую переменную тягу до выгорания. В этой точке реверберационное управление обеспечивает, чтобы управление или тяга достигли своего минимального значения, равного нулю. Это решение является основой профиля ракетного двигателя с ускорителем и поддержкой, широко используемого сегодня для максимизации характеристик ракеты.

Приложения

Существует широкий спектр приложений для оптимизации траектории, в первую очередь в робототехнике: промышленность, манипуляция, ходьба, планирование пути и аэрокосмическая промышленность. Его также можно использовать для моделирования и оценки.

Роботизированные манипуляторы

В зависимости от конфигурации, роботизированные манипуляторы с открытой цепью требуют определенной степени оптимизации траектории. Например, роботизированная рука с 7 сочленениями и 7 звеньями (7-DOF) является избыточной системой, в которой одно декартово положение конечного эффектора может соответствовать бесконечному числу положений углов сочленений, таким образом, эта избыточность может использоваться для оптимизации траектории, чтобы, например, избегать любых препятствий в рабочем пространстве или минимизировать крутящий момент в сочленениях. [5]

Квадрокоптеры

Оптимизация траектории часто используется для вычисления траекторий для вертолетов с квадрокоптерами . Эти приложения обычно используют узкоспециализированные алгоритмы. [6] [7] Одно интересное приложение, показанное U.Penn GRASP Lab, вычисляет траекторию, которая позволяет квадрокоптеру пролетать через обруч, когда его бросают. Другое, на этот раз от ETH Zurich Flying Machine Arena, включает два квадрокоптера, бросающих шест вперед и назад между собой, при этом он уравновешивается как перевернутый маятник. Проблема вычисления траекторий с минимальной энергией для квадрокоптера также недавно была изучена. [8]

Производство

Оптимизация траектории используется в производстве, в частности, для управления химическими процессами [9] или вычисления желаемого пути для роботизированных манипуляторов. [10]

Ходячие роботы

Существует множество различных приложений для оптимизации траектории в области шагающей робототехники. Например, в одной из статей использовалась оптимизация траектории двуногих походок на простой модели, чтобы показать, что ходьба энергетически выгодна для движения с низкой скоростью, а бег энергетически выгоден для движения с высокой скоростью. [11] Как и во многих других приложениях, оптимизация траектории может использоваться для вычисления номинальной траектории, вокруг которой строится стабилизирующий контроллер. [12] Оптимизация траектории может применяться в детальном планировании движения сложных гуманоидных роботов, таких как Atlas . [13] Наконец, оптимизация траектории может использоваться для планирования пути роботов со сложными динамическими ограничениями, используя модели с уменьшенной сложностью. [14]

Аэрокосмическая промышленность

Для тактических ракет профили полета определяются историями тяги и подъемной силы . Эти истории могут контролироваться рядом средств, включая такие методы, как использование истории команды угла атаки или графика высоты/снижения, которому должна следовать ракета. Каждая комбинация факторов конструкции ракеты, желаемых характеристик ракеты и ограничений системы приводит к новому набору оптимальных параметров управления. [15]

Терминология

Переменные решения
Набор неизвестных, которые необходимо найти с помощью оптимизации.
Задача оптимизации траектории
Особый тип задачи оптимизации, в которой переменными решения являются функции, а не действительные числа.
Оптимизация параметров
Любая задача оптимизации, где переменными решения являются действительные числа.
Нелинейная программа
Класс оптимизации с ограниченными параметрами, в котором либо целевая функция, либо ограничения являются нелинейными.
Косвенный метод
Косвенный метод решения задачи оптимизации траектории состоит из трех этапов: 1) Аналитически построить необходимые и достаточные условия оптимальности, 2) Дискретизировать эти условия, построив задачу оптимизации с ограниченными параметрами, 3) Решить эту задачу оптимизации. [16]
Прямой метод
Прямой метод решения задачи оптимизации траектории состоит из двух шагов: 1) Непосредственно дискретизировать задачу оптимизации траектории, преобразуя ее в задачу оптимизации с ограниченными параметрами, 2) Решить эту задачу оптимизации. [16]
Транскрипция
Процесс, посредством которого задача оптимизации траектории преобразуется в задачу оптимизации параметров. Иногда это называют дискретизацией. Методы транскрипции обычно делятся на две категории: методы стрельбы и методы коллокации.
Метод стрельбы
Метод транскрипции, основанный на моделировании, обычно с использованием явных схем Рунге-Кутты.
Метод коллокации (одновременный метод)
Метод транскрипции, основанный на аппроксимации функций, обычно с использованием неявных схем Рунге-Кутты.
Псевдоспектральный метод (глобальная коллокация)
Метод транскрипции, представляющий всю траекторию в виде одного ортогонального полинома высокого порядка.
Сетка (сетка)
После транскрипции ранее непрерывная траектория теперь представлена ​​дискретным набором точек, известных как точки сетки или узлы сетки.
Уточнение сетки
Процесс, посредством которого сетка дискретизации улучшается путем решения последовательности задач оптимизации траектории. Уточнение сетки выполняется либо путем деления сегмента траектории, либо путем увеличения порядка полинома, представляющего этот сегмент. [17]
Задача оптимизации многофазной траектории
Оптимизация траектории в системе с гибридной динамикой может быть достигнута путем ее постановки в качестве многофазной задачи оптимизации траектории. Это делается путем составления последовательности стандартных задач оптимизации траектории, которые связаны с помощью ограничений. [18]

Методы оптимизации траектории

Методы решения любых задач оптимизации можно разделить на две категории: косвенные и прямые. Косвенный метод работает путем аналитического построения необходимых и достаточных условий оптимальности, которые затем решаются численно. Прямой метод пытается получить прямое численное решение путем построения последовательности постоянно улучшающихся приближений к оптимальному решению. [16]

Задача оптимального управления — это бесконечномерная задача оптимизации, поскольку переменные решения — это функции, а не действительные числа. Все методы решения выполняют транскрипцию, процесс, посредством которого задача оптимизации траектории (оптимизация по функциям) преобразуется в задачу оптимизации с ограниченными параметрами (оптимизация по действительным числам). Как правило, эта задача оптимизации с ограниченными параметрами представляет собой нелинейную программу, хотя в особых случаях ее можно свести к квадратичной программе или линейной программе .

Одиночная стрельба

Одиночная стрельба — это простейший тип метода оптимизации траектории. Основная идея похожа на то, как вы нацеливаете пушку: выбираете набор параметров для траектории, моделируете все это, а затем проверяете, попали ли вы в цель. Вся траектория представлена ​​как один сегмент с одним ограничением, известным как ограничение дефекта, требующим, чтобы конечное состояние моделирования соответствовало желаемому конечному состоянию системы. Одиночная стрельба эффективна для задач, которые либо просты, либо имеют чрезвычайно хорошую инициализацию. В противном случае как косвенная, так и прямая формулировки, как правило, имеют трудности. [16] [19] [20]

Многократная стрельба

Множественная стрельба — это простое расширение одиночной стрельбы, которое делает ее гораздо более эффективной. Вместо того, чтобы представлять всю траекторию как одну симуляцию (сегмент), алгоритм разбивает траекторию на множество более коротких сегментов, и между каждым добавляется ограничение дефекта. Результатом является большая разреженная нелинейная программа, которую, как правило, легче решить, чем небольшие плотные программы, полученные одиночной стрельбой. [19] [20]

Прямое словосочетание

Методы прямой коллокации работают путем аппроксимации состояния и управления траекториями с использованием полиномиальных сплайнов . Эти методы иногда называют прямой транскрипцией. Трапециевидная коллокация является широко используемым методом прямой коллокации низкого порядка. Динамика, цель пути и управление представлены с использованием линейных сплайнов, а динамика удовлетворяется с использованием трапециевидной квадратуры . Коллокация Эрмита-Симпсона является распространенным методом прямой коллокации среднего порядка. Состояние представлено кубическим сплайном Эрмита , а динамика удовлетворяется с использованием квадратуры Симпсона . [16] [20]

Ортогональное словосочетание

Ортогональная коллокация технически является подмножеством прямой коллокации, но детали реализации настолько отличаются, что ее можно обоснованно считать отдельным набором методов. Ортогональная коллокация отличается от прямой коллокации тем, что она обычно использует сплайны высокого порядка, и каждый сегмент траектории может быть представлен сплайном другого порядка. Название происходит от использования ортогональных полиномов в сплайнах состояния и управления. [20] [21]

Псевдоспектральная дискретизация

В псевдоспектральной дискретизации вся траектория представлена ​​набором базисных функций во временной области (независимая переменная). Базисные функции не обязательно должны быть полиномами. Псевдоспектральная дискретизация также известна как спектральная коллокация. [22] [23] [24] При использовании для решения задачи оптимизации траектории, решение которой является гладким, псевдоспектральный метод достигает спектральной (экспоненциальной) сходимости. [25] Если траектория не является гладкой, сходимость все равно очень быстрая, быстрее, чем у методов Рунге-Кутты. [26] [27]

Временные конечные элементы

В 1990 году Дьюи Х. Ходжес и Роберт Р. Блесс [28] предложили слабый гамильтонов метод конечных элементов для задач оптимального управления. Идея состояла в том, чтобы вывести слабую вариационную форму необходимых условий первого порядка для оптимальности, дискретизировать временную область на конечных интервалах и использовать простое полиномиальное представление нулевого порядка состояний, управлений и сопряженных элементов на каждом интервале.

Дифференциальное динамическое программирование

Дифференциальное динамическое программирование немного отличается от других методов, описанных здесь. В частности, оно не разделяет транскрипцию и оптимизацию. Вместо этого оно выполняет последовательность итеративных прямых и обратных проходов вдоль траектории. Каждый прямой проход удовлетворяет динамике системы, а каждый обратный проход удовлетворяет условиям оптимальности для управления. В конце концов, эта итерация сходится к траектории, которая является как осуществимой, так и оптимальной. [29]

Сравнение методов

Существует множество методов, из которых можно выбирать при решении задачи оптимизации траектории. Лучшего метода не существует, но некоторые методы могут лучше справляться с определенными задачами. В этом разделе дается приблизительное понимание компромиссов между методами.

Косвенные и прямые методы

При решении задачи оптимизации траектории косвенным методом необходимо явно построить сопряженные уравнения и их градиенты. Это часто бывает трудно сделать, но это дает превосходную метрику точности для решения. Прямые методы гораздо проще в настройке и решении, но они не имеют встроенной метрики точности. [16] В результате прямые методы используются более широко, особенно в некритических приложениях. Косвенные методы все еще имеют место в специализированных приложениях, особенно в аэрокосмической отрасли, где точность имеет решающее значение.

Одно из мест, где косвенные методы имеют особую сложность, — это проблемы с ограничениями неравенства путей. Эти проблемы, как правило, имеют решения, для которых ограничение частично активно. При построении сопряженных уравнений для косвенного метода пользователь должен явно записать, когда ограничение активно в решении, что трудно узнать априори. Одним из решений является использование прямого метода для вычисления начального предположения, которое затем используется для построения многофазной задачи, где ограничение предписано. Полученная задача затем может быть точно решена с помощью косвенного метода. [16]

Стрельба против словосочетания

Методы одиночной стрельбы лучше всего использовать для задач, где управление очень простое (или есть очень хорошее начальное предположение). Например, задача планирования миссии спутника, где единственным управлением является величина и направление начального импульса от двигателей. [19]

Множественная стрельба, как правило, хороша для задач с относительно простым управлением, но сложной динамикой. Хотя ограничения пути могут быть использованы, они делают полученную нелинейную программу относительно сложной для решения.

Методы прямой коллокации хороши для задач, где точность управления и состояния схожа. Эти методы, как правило, менее точны, чем другие (из-за их низкого порядка), но особенно надежны для задач со сложными ограничениями пути.

Методы ортогональной коллокации лучше всего подходят для получения высокоточных решений задач, где важна точность траектории управления. Некоторые реализации имеют проблемы с ограничениями пути. Эти методы особенно хороши, когда решение гладкое.

Смотрите также

Ссылки

  1. ^ Qi Gong; Wei Kang; Bedrossian, NS; Fahroo, F.; Pooya Sekhavat; Bollino, K. (декабрь 2007 г.). «Псевдоспектральное оптимальное управление для военных и промышленных приложений». 2007 г. 46-я конференция IEEE по принятию решений и управлению . стр. 4128–4142. doi :10.1109/CDC.2007.4435052. ISBN 978-1-4244-1497-0. S2CID  2935682.
  2. ^ 300 лет оптимального управления: от брахистохроны до принципа максимума , Гектор Дж. Сассманн и Ян К. Виллемс. Журнал IEEE Control Systems, 1997.
  3. ^ Брайсон, Хо, Прикладное оптимальное управление, Blaisdell Publishing Company, 1969, стр. 246.
  4. ^ Л.С. Понтырягин, Математическая теория оптимальных процессов, Нью-Йорк, Intersciences, 1962
  5. ^ Малик, Арыслан; Хендерсон, Трой; Празеница, Ричард (январь 2021 г.). «Генерация траектории для многотельной роботизированной системы с использованием формулы произведения экспонент». Форум AIAA Scitech 2021 : 2016. doi :10.2514/6.2021-2016. ISBN 978-1-62410-609-5. S2CID  234251587.
  6. ^ Дэниел Меллингер и Виджай Кумар, «Генерация минимальной траектории и управление для квадрокоптеров», Международная конференция по робототехнике и автоматизации, IEEE 2011.
  7. ^ Маркус Хен и Раффаэлло Д'Андреа, «Генерация траектории в реальном времени для квадрокоптеров», IEEE Transactions on Robotics, 2015.
  8. ^ Фабио Морбиди, Роэль Кано, Дэвид Лара, «Создание пути с минимальной энергией для квадрокоптерного БПЛА» в Трудах Международной конференции IEEE по робототехнике и автоматизации, стр. 1492-1498, 2016.
  9. ^ Джон В. Итон и Джеймс Б. Роулингс. «Модельно-прогностическое управление химическими процессами» Химическая инженерная наука, том 47, № 4. 1992.
  10. ^ Т. Четтиби, Х. Лехтихет, М. Хаддад, С. Ханчи, «Планирование траектории минимальной стоимости для промышленных роботов», Европейский журнал механики, 2004.
  11. ^ Манодж Шринивасан и Энди Руина. «Компьютерная оптимизация минимальной модели двуногого существа открывает ходьбу и бег» Nature, 2006.
  12. ^ ER Westervelt, JW Grizzle и DE Koditschek. «Гибридная нулевая динамика плоских двуногих шагающих устройств» IEEE Transactions on Automatic Control, 2003.
  13. ^ Майкл Поза, Скотт Куиндерсма и Расс Тедрейк. «Оптимизация и стабилизация траекторий для ограниченных динамических систем». Международная конференция по робототехнике и автоматизации, IEEE 2016.
  14. ^ Хонгкай Дай, Андрес Валенсуэла и Расс Тедрейк. «Планирование движения всего тела с использованием центроидальной динамики и полной кинематики» Международная конференция по гуманоидным роботам, IEEE 2014.
  15. ^ Филлипс, Калифорния, «Управление энергией для многоимпульсной ракеты», статья AIAA 88-0334, январь 1988 г.
  16. ^ abcdefg Джон Т. Беттс «Практические методы оптимального управления и оценки с использованием нелинейного программирования» SIAM Advances in Design and Control, 2010.
  17. ^ Кристофер Л. Дарби, Уильям В. Хагер и Анил В. Рао. «Адаптивный псевдоспектральный метод решения задач оптимального управления с использованием HP». Оптимальное управление: приложения и методы, 2010.
  18. ^ Паттерсон, Майкл А.; Рао, Анил В. (2014-10-01). "GPOPS-II: программное обеспечение MATLAB для решения многофазных задач оптимального управления с использованием адаптивных методов коллокации Гаусса и разреженного нелинейного программирования". ACM Trans. Math. Softw . 41 (1): 1:1–1:37. doi : 10.1145/2558904 . ISSN  0098-3500.
  19. ^ abc Обзор численных методов оптимизации траектории; Джон Т. Беттс Журнал руководства, управления и динамики 1998; 0731-5090 т.21 №2 (193-207)
  20. ^ abcd Анил В. Рао «Обзор численных методов оптимального управления» Успехи астронавтики, 2009.
  21. ^ Камила К. Франколин, Дэвид А. Бенсон, Уильям В. Хагер, Анил В. Рао. «Оценка состояния в оптимальном управлении с использованием методов ортогональной коллокации интегральных гауссовых квадратур» Оптимальное управление: приложения и методы, 2014.
  22. ^ Р., Малик, Муджиб (1984). Метод спектральной коллокации для уравнений Навье-Стокса . Национальное управление по аэронавтике и исследованию космического пространства, Исследовательский центр Лэнгли. OCLC  11642811.{{cite book}}: CS1 maint: несколько имен: список авторов ( ссылка )
  23. ^ "Спектральные методы и псевдоспектральные методы", Спектральные методы и их применение , WORLD SCIENTIFIC, стр. 100–187, май 1998 г., doi :10.1142/9789812816641_0004, ISBN 978-981-02-3333-4, получено 2021-04-23
  24. ^ Гун, Ци. Спектральное и псевдоспектральное оптимальное управление произвольными сетками . OCLC  1185648645.
  25. ^ Ллойд Н. Трефетен. «Теория и практика аппроксимации», SIAM 2013
  26. ^ Кан, Вэй (ноябрь 2010 г.). «Скорость сходимости для псевдоспектрального оптимального управления Лежандра линеаризуемыми системами с обратной связью». Журнал теории управления и приложений . 8 (4): 391–405. doi :10.1007/s11768-010-9104-0. ISSN  1672-6340. S2CID  122945121.
  27. ^ Трефетен, Ллойд Н. (Ллойд Николас) (январь 2019). Теория приближения и практика приближения . ISBN 978-1-61197-594-9. OCLC  1119061092.
  28. ^ DH Hodges и RR Bless, «Слабый гамильтонов метод конечных элементов для задач оптимального управления», Журнал руководства, управления и динамики, 1990. https://arc.aiaa.org/doi/10.2514/3.20616
  29. ^ Дэвид Х. Якобсон, Дэвид К. Мейн. «Дифференциальное динамическое программирование» Elsevier, 1970.

Внешние ссылки