НОВОСТИ   БИБЛИОТЕКА   ЮМОР   КАРТА САЙТА   ССЫЛКИ   О САЙТЕ  




предыдущая главасодержаниеследующая глава

14-12. Дискретный принцип максимума Понтрягина

Аналогично дискретному динамическому программированию разработан дискретный вариант принципа максимума Понтрягина [Л. 88]. Из сравнения этих двух методов видно, что вычислительные процедуры в них существенно различны. Как показано, часто в случае применения дискретного принципа максимума время вычислений значительно меньше, чем при использовании динамического программирования. Существует несколько разновидностей формального аппарата дискретного принципа максимума. Здесь будет рассмотрен простейший случай многоступенчатого процесса без обратной связи.

Представим процесс (рис. 14-11) в виде последовательности N этапов (ступеней). Здесь использована другая нумерация ступеней, нежели в аналогичной блок-схеме динамического программирования, приведенной на рис. 14-10. Считается, что

xk=fk(xk-1, uk) (14-30)

или

xkl=fki(xk-1k, xk-12,..., xk-1s; uk1, uk2,..., ukl)

где


Рис. 14-11. Блок-схема много шагового процесса для дискретного принципа максимума
Рис. 14-11. Блок-схема много шагового процесса для дискретного принципа максимума

В отличие от аналогичного соотношения динамического программирования в формуле (14-30) координата на k-м шаге зависит от координаты на предыдущем (k—1)-м шаге и управления на k-м шаге, а не от управления на (k—1)-м шаге. Однако в большинстве случаев это отличие непринципиально и скорее зависит от того, что понимается под управлением на данном и предыдущем шагах. Кроме того, здесь считается, что функция преобразования состояний в общем случае зависит от номера шага k.

Уравнения дискретного принципа максимума. Сначала получим аналог уравнений Гамильтона - Эйлера:


Здесь, так же как в гл. 11, весь временной интервал изменения [t0, t1] разбит на N отрезков длиной Δt. Если критерий оптимальности задан в виде


то можно положить:


Приняв все cki=0 при k≠N и cNi=ci видим, что формулы (14-31) и (14-32) совпадают.

Далее введем в рассмотрение функции Лагранжа и Гамильтона:


Пользуясь новыми переменными piiixi, получаем:


или в результате замены xii(x,ψ)


Выполняя дифференцирование по ψi и xi, получаем:


т. е. зависимость Н от F совпадает по форме с зависимостью Н от Φ. Используя дифференциально-разностное уравнение Эйлера


окончательно получаем дифференциально-разностные уравнения Понтрягина в виде


Теперь рассмотрим принцип максимума Понтрягина для случая, когда динамика системы задана разностными уравнениями вида

xki=fi(xk-1, uk)

или


где


Форма (14-34) легко может быть получена из (14-33), если учесть, что


При этом


и размерность векторах x(k) в выражении (14-34) в 2 раза больше, чем размерность вектора xk в (14-33) за счет добавления новых s разностных уравнений и компонент:


Могут встречаться и другие формы задания динамики системы в виде разностных уравнений. И, естественно, форма уравнений Понтрягина будет различная. Это лишний раз подтверждает, что дискретные процессы обладают большим многообразием, чем непрерывные. Однако все дискретные процессы, как и различные Дискретные формы задания динамики, совпадают с непрерывными при стремлении интервала дискретности к нулю.

Форма задания (14-33) удобна для вычисления в конкретных примерах, а (14-34)- при аналитических выкладках, выполняемых по аналогии с непрерывным случаем.

С помощью приемов, аналогичных ранее использованным, можно получить дифференциально-разностные уравнения Понтрягина для обоих случаев (14=33) и (14=34). Пусть задача ставится в виде


Вводя в рассмотрение функции ψi, удовлетворяющие системе разностных уравнений


сопряженных системе уравнений для вариаций δxi(k), полученных из (14-35),


а также функцию Понтрягина


получаем уравнения принципа максимума Понтрягина в виде


Если задача ставится в форме


то можно получить уравнения: для вариаций δxi


для функций ψki


для функции Понтрягина


Здесь k=1,2,...,N


Решения этих уравнении должны удовлетворять граничным условиям


В качестве начального времени t0 может быть взято t0=0. Второе условие специально выбрано в соответствии с методом конструирования функций, так же как в непрерывном принципе максимума


для того чтобы в конце интервала функция Понтрягина H, равная I, приняла максимальное значение:


Аналогичным образом для случая, заданного формулами (14-35) и (14-36),


В другом варианте формализма можно, аналогично непрерывному случаю, ввести в рассмотрение еще одно уравнение и координату


Тогда


где уже использовано условие ψNi=ci. При этом HN=max=0.

Отметим некоторые особенности приведенных выше уравнений. Хотя аргумент - время во всех функциях H, ψ, x меняется дискретно, считается, что сами функции H, ψ, x могут изменяться непрерывно и Дифференцируемы. Функция H зависит от номера k (ступени, шага), что эквивалентно зависимости от времени или зависимости функции Беллмана Sk от номера шага. В задачах, решаемых с помощью дискретного принципа максимума, так же как в задачах, решаемых с помощью дискретного динамического программирования, в исходной постановке время может отсутствовать. В таком случае его вводят искусственно, создавая эквивалентную модель много шагового процесса. Тогда функция Понтрягина Н(k) или Нk принимает максимальное значение при оптимальном управлении, т. е.


Дифференциально-разностные уравнения Понтрягина являются необходимыми условиями экстремума функции. Для линейных разностных уравнений эти условия являются (так же, как и в непрерывном случае) достаточными. Для выпуклых функций и, в частности, для линейных функций они определяют глобальный экстремум.

Кроме того, дискретные процессы, как уже указывалось ранее, обладают большим разнообразием, чем непрерывные. В частности, как будет показано на примере ниже, при одних k функция Hk принимает максимальное значение, а при других k - минимальное. Поэтому говорят, что дифференциально-разностные уравнения Понтрягина определяют не оптимальные, а стационарные решения или точки фазового пространства. В частности, можно показать, что оптимальное управление существует для любого начального состояния x0 и удовлетворяет условию


где оптимальные значения сопряженных переменных ψkопт определяются из сопряженной системы уравнений (14-39) с граничными условиями

ψNi=ci (14-40)

Кроме того, можно показать, что если для какого-нибудь k точка ukопт является внутренней точкой множества U допустимых значений управления, то δHK(ukопт)=0, а если в точке ukопт отсутствует такая допустимая (не выводящая из области U) вариация δuk, при которой δHk(ukопт)<0, то эта точка является граничной точкой множества U [Л. 88]. Поэтому, если нет ограничений на управляющие воздействия, при оптимальном управлении δHk=0.

Условие δHk<0, т. е. условие локального или глобального максимума, может выполняться только на границе области U.

Пример 14-3. Динамика дискретной системы определяется уравнениями [Л. 88]


Диапазон измерений управляющих воздействий ограничивается соотношением

||un||≤5;

начальные условия задаются в виде

x01=0; x02=0

Требуется найти оптимальное управление u1 и u2, обращающее функцию I=x22 в максимум при ограничениях (14-42). Выразим из уравнений (14-41) x22=f22(u1, u2) и определим значения u1опт и u2опт) доставляющие максимум этому выражению. В результате получим:

u1опт=2;
u2опт=-5.

Функцию Понтрягина для этого случая запишем в виде


Оптимальные значения xkопт и ψkопт найдем из соотношений (14-41):


В результате получим:


После подстановки этих значений в формулу (14-45) получим:

H1=-3+(u1)2+4u1
H2=-6+(u2)2

Нетрудно убедиться, что H2 достигает максимального значения при u2опт=±5, а H1 минимального u1опт=-2.

Таким образом, в общем случае функция Понтрягина Нл принимает при оптимальном управлении любое стационарное значение, необязательно являющееся максимумом, и принцип максимума Понтрягина несправедлив.

Но можно сузить класс дискретных задач таким образом, что принцип максимума Понтрягина будет выполняться. Если много шаговый процесс обладает таким свойством, при котором множество R1(x) всех состояний х, в которые можно перевести точку х за один шаг при допустимом управлении u∈U, т. е.

R1{x)={x|x=f(x, u); u∈U},

является выпуклым (см. гл. 16), то для оптимальности управления необходимо, чтобы функция Понтрягина на оптимальном управлении принимала максимальное значение.

Следует заметить, что выпуклость множества R1(x) не гарантирует выпуклости функции Понтрягина. Если функция Понтрягина выпукла, то доказанное ранее соотношение (14-39) обеспечивает справедливость принципа максимума Понтрягина.

Наконец, если функции fki линейны, т. е.

xk=Ak-1xk-1+Bkuk

где k=1,..., N; Аk-1 - матрица, (s*s); Вk - матрица (s*l), функция цели


выпукла и множество допустимых значений управления U тоже выпукло, то, для того чтобы управление их было оптимальным, необходимо и достаточно, чтобы функция Понтрягина на этом управлении достигала максимального значения [Л. 88].

предыдущая главасодержаниеследующая глава








© Злыгостев А.С., 2001-2019
При использовании материалов сайта активная ссылка обязательна:
http://informaticslib.ru/ 'Библиотека по информатике'
Рейтинг@Mail.ru
Поможем с курсовой, контрольной, дипломной
1500+ квалифицированных специалистов готовы вам помочь