|
12-2. Порядок решения частных задач с помощью принципа максимумаРассмотренный принцип максимума справедлив и для таких задач, когда конец траектории в фазовом пространстве свободен и требуется найти такое управление, при котором координата х0(Т) принимала бы минимальное значение. Кроме этой есть и другие задачи, но доказательство принципа максимума для них очень сложно, и здесь будет в основном изложен лишь порядок выполнения действия. Рассмотрим задачи, в которых считаются заданными t0 и x0i. Задача со свободным концом траектории xTi и заданным временем Т. Требуется найти uопт, обеспечивающее при заданных условиях максимальное постоянное значение функции Понтрягина Н (ψ, f). Это означает, что проекция вектора dx/dt на направление ψ должна быть максимальной, т. е. В этом заключается геометрический смысл принципа максимума. В данной задаче для последнего малого интервала длины Δt, для которого T-Δt<t<T, направление вектора ψ задается формулой . Управление должно быть таким, чтобы приращение х0(Т) на этом последнем интервале было возможно меньшим, так как при этом производная dx/dt будет меньше и скалярное произведение (12-20), являясь отрицательным, будет больше. Это достигается направлением вектора ψ навстречу вектору , так как только тогда скалярное произведение отрицательно и равно - х0. Однако при любом направлении вектора ψ проекция на него должна быть максимальной и сохранять постоянное значение. Скалярное произведение производной и вектора ψ(Т) тоже будет отрицательным. Поэтому чем больше это скалярное произведение, тем меньше по абсолютному значению производная x0, меньше прирост х0 за интервал (Т-Δt, Т) и меньше т. е. функционал будет обращаться в минимум. Тем самым геометрически показано, что для обращения функционала в минимум необходимо, чтобы скалярное произведение (12-20) было максимально и постоянно вдоль всей траектории и ψ(t)={-1, 0, ...,0} Отметим особый характер функции (t) в этом случае. Из вторых уравнений (12-10) следует, что при условии явной независимости f0 и f1 (i=1,...,n) от t, поэтому ψn+1=const=c1 Следовательно, функция ψn+1 не зависит от управлений и координат объекта. Ее вообще можно не рассматривать, она никакого влияния на управление не оказывает, тем более, что и fn+1=1. В данной задаче она используется для обеспечения равенства H[ψ(T), x(T), u(T)]=0
которое возможно при ψn+1(T)=f0[x(T, u (T)]=F[x(T), u]
Главное в принципе максимума то, что Н принимает максимальное значение и сохраняет его постоянным вдоль оптимальной траектории. Поэтому если ввести новую функцию то исходя из особенности функции ψn+1(t) принцип максимума можно сформулировать следующим образом: оптимальное управление достигается при В данном случае Н≠0. Таким образом, мы пришли к тому, что задачу следует решать исходя из следующих начальных условий на координаты xi и конечных условий на функции ψi: xi(t0)=x0i; ψi(T)=ψTi
Решение найдется из основной системы n+1 уравнений и сопряженной системы n+1 уравнений или Затруднения в решении возникают из-за того, что для уравнений (12-21) задаются не начальные, а конечные значения. Этого можно избежать, обернув время, т. е. заменив t=T-t (метод попятного движения). Однако этот метод мало помогает, так как для x задано начальное значение, поэтому чаще используют методы пристрелки. Задача о минимуме функционала с не заданным временем T. Требуется найти uопт, дающее экстремальное значение функционала при не заданном времени Т. В этой задаче предполагается, что система не автономна, т. е. правые части дифференциальных уравнений и подынтегральной функции зависят явно от времени t: Введя координату хn+1: xn+1=t; xn+1(t0)=t0; fn+1=1
получим: Для этого случая также можно доказать принцип максимума (мы его не доказываем), который будет выглядеть следующим образом: Отсюда видно, что благодаря введению координаты хn+1 вариационная задача сводится к задаче о закрепленном левом и незакрепленном правом конце. Для варианта с n+1 переменными требуется найти оптимальную траекторию, соединяющую точку (x01, x02,...,x0n, t0) в (n+1)-мерном пространстве с точкой на прямой 5, проходящей через точку (x11, x12,...,x1n, 0) параллельно оси xn+1 так как конечное значение переменной xn+1 (т. е. правый конец) не задано (момент времени, когда система достигает точки x1, заранее не задан). В данном случае целесообразно использовать условие трансверсальности, которое означает, что оптимальная фазовая траектория должна быть ортогональна к прямой, параллельной оси хn+1 и проходящей через точку (x11, x12,...,x1n 0). Кроме того, согласно принципу максимума функции ψi должны быть так подобраны, чтобы проекция вектора ψ на касательную к оптимальной траектории была бы максимальна. Один вектор дает максимальную проекцию на другой вектор, если они параллельны или антипараллельны. Так как функция H не положительна, функции ψi подбираются так, чтобы в точке t=Т вектор ψ совпадал с градиентом той кривой или поверхности, на которой должен находиться конец траектории. В данном случае направляющие косинусы прямой S равны ,поэтому ψn+1(T)=0 и, следовательно, Из этого уравнения трансверсальности и определяется искомое время Т. Остальные искомые xi, ψi, ui находятся из уравнений (12-10), (12-16) и (12-18), причем для определения ψi(0) используется метод пристрелки. Рис. 12-1. Геометрическая интерпретация задачи с не заданным временем Т Для варианта с переменными n=2 соответствующая геометрическая интерпретация приведена на рис. 12-1. Задача максимального быстродействия с заданным концом траектории xi(Т), ко неизвестным временем T. Такая задача может возникнуть, например, когда система оптимальным образом выводится на режим установившегося движения (разгон двигателя и пр.). Для совместного решения основной и сопряженной систем с одновременным выбором управления u, которое максимизировало бы H, требуется 2n начальных условий x0i и ψ0i. Первые п значений заданы, а вторые нет, и в этом состоит одна из основных трудностей. Приходится по методу проб или пристрелки так подбирать начальные значения ψi, чтобы конец траектории совпадал с точкой xTi Задачу решают по шагам, и на каждом шаге Δt так подбирают u, чтобы Н=max. Если первый выбор ψ0i не был успешным и траектория не пришла в точку xTi, выбирают другие значения. Когда правые части дифференциальных уравнений и подынтегральная функция не зависят явно от времени, то Из этой формулы с учетом того, что для системы с незакрепленным временем на втором конце ψn+1(Т)= 0 (см. предыдущую задачу), получим, что вообще ψn+1(t)=0. Поэтому а так как для максимального быстродействия f0=1, то и С помощью принципа максимума легко показать, что для линейного максимального быстродействия оптимальное управление достигается при u=-1 или u=1, т. е. на границе области. Убедимся в этом, рассмотрев вариант с n=2, однако доказательство без труда может быть распространено на случай любого n. Пусть система описывается линейными относительно и уравнениями Очевидно, что функция Понтрягина H(x,ψ,u)=ψ1φ1(x1,x2)+ψ2φ2(x1,x2)+ψ1u1+ψ2u2
достигает максимума при u1=signφ1; u2=signφ2.
Функции φ1 и φ2 определяют моменты переключения. Теперь покажем, что любая задача об оптимальном управлении в смысле формализма принципа максимума может быть сведена к задаче о максимальном быстродействии [Л. 81]. Сформулируем исходную задачу следующим образом: Введем новое время τ, связанное с t дифференциальной зависимостью dτ=f0(x,u)dt. Тогда и исходная задача об оптимальном управлении запишется в виде Задача о максимальном быстродействии с фиксированной конечной n-мерной областью Р в фазовом пространстве и не фиксированным заранее временем Т. Требуется найти uопт, которое переводило бы систему наискорейшим способом из некоторой заданной начальной точки x0 в некоторую xT, принадлежащую замкнутой области Р. Нетрудно убедиться, что речь идет о переводе системы на границу области, так как время перехода в любую внутреннюю точку будет больше. Пример такой задачи на практике - полет до лунной поверхности за наименьшее время. Можно провести поверхности изохрон, время движения между которыми постоянно (рис. 12-2). Одна из этих поверхностей будет касаться области Р. Точка касания и будет конечной точкой оптимальной траектории. В самом деле, если область Р задана уравнением φ(x)=φ(x1,...,xn)=0, (12-22)
то в силу условий трансверсальности оптимальная траектория должна быть ортогональна к поверхности, задаваемой формулой (12-22). Следовательно, касательная к оптимальной траектории ортогональна к этой поверхности. Кроме того, проекция вектора ψ на касательную dx/dt должна быть максимальна согласно принципу максимума. Поэтому для оптимального управления вектор ψ должен совпадать с градиентом к поверхности ψ(x)=0, т. е. или что позволяет определить недостающие начальные условия ψi(0) для функций ψi(t). Из уравнений (12-22) и (12-24) найдутся n начальных условий ψi(0) и величина Т. При этом считается, что если ψi(0) и Т заданы, то xi(Т) и ψi(T) будут функциями этих n+1 переменных. Подставив их в уравнения (12-22) и (12-23), получим необходимые n+1 уравнений. Пример 12-1. Рассмотрим задачу максимального быстродействия, которая для линейной системы описывается уравнениями Определим управление u(t), обеспечивающее быстрейший переход системы из состояния x1=x01; x2=x02 В состояние х1=0; x2=0 при условии |u|≤1. В данном случае функция Понтрягина будет иметь вид: H=ψ1x2+ψ2u
Оптимальное управление u определяется из условия, что функция Н принимает максимальное значение. Выше было доказано, что для задач максимального быстродействия оптимальное управление достигается на кусочно-непрерывной кривой, состоящей из отрезков u=+1, u=-1 и вертикальных отрезков. Очевидно, что максимум функции достигается при u=signψ2, т. е. управление u=+1 при ψ2>0 и u=-1 при ψ1<0. Для определения вспомогательных функций имеем уравнения откуда ψ1=C1; ψ2=C2-C1t
Следовательно, u=sign(C2-C1t).
Управление один раз меняет знак. Постоянные С1 и С2 определяются из начальных условий.
Неправильно полагать, что узбечки проститутки неспешны в сексе. Все парни их услуг на сайте https://prostitutkispbsite.com/nation/uzbechki/ согласны, что секс с ними имеет индивидуальные преимущества. |
|
|
© Злыгостев А.С., 2001-2019
При использовании материалов сайта активная ссылка обязательна: http://informaticslib.ru/ 'Библиотека по информатике' |