в) Минимаксная трактовка задачи на условный экстремум функции
Предположим, что функция F (х) имеет в точке хопт максимум при ограничивающих условиях φi (х) = bi (i = 1,..., m). Соответствующий этой точке множитель Лагранжа обозначим через λопт = ||λ1опт,...,λmопт ||. Если исключить особые случаи, то можно считать, что функция Лагранжа Φ (х, λопт) имеет в точке хопт безусловный максимум, т. е.
Φ (x, λопт) ≤ Φ (xопт, λопт)
для всех х из некоторой малой ε-окрестности точки хопт. Опять, исключая из рассмотрения особые случаи, считаем, что для некоторой окрестности δ точки λопт функция Φ (x, λ) имеет безусловный максимум по х и удовлетворяет условиям
Будем считать, что эти уравнения имеют единственное решение х при любом к из δ-окрестности λопт. Тогда точку максимума хопт можно рассматривать как функцию к и для δ-окрестности λопт можно записать:
т. е. максимум по х будет функцией кλ. Очевидно, что
h(λопт) = Φ (xопт, λопт) = F (xопт)
так как при λ = λопт и х = хоптφi (х) = bi и
Φ(х, λ) = F (х).
Обозначим допустимую область значений х, ограничениям b - φ (х) = 0, через G. Тогда
Область G в соотношении (17-12) составляет часть от общей области изменений х, по которой ищется максимум в соотношении (17-11). Поэтому
h(λ)≥h(λопт). (17-13)
Эта запись означает, что h(λ) имеет минимум в точке λопт. Но так как для х и λ, удовлетворяющих условию (17-22), h(λ) = Φ (х, λ), то выражение (17-13) утверждает, что Φ (x, λ) имеет минимум по к в точке xопт при условии выполнения (17-10).
Задача минимизации Φ (х, λ) по к при ограничениях (17-10), которые для каждого к определяют соответствующее х, называется задачей, двойственной к задаче отыскания максимума F (х) при ограничениях φi (х) = bi (i = 1, ..., m):
Двойственные задачи обладают тем свойством, что в окрестности хопт в соответствующих ограничениях
Но в соответствии с равенством (17-11)
и поэтому
Это важнейшее соотношение означает, что задача оптимизации функции при ограничениях сводится к решению задачи на минимакс. Оно смыкается с теорией игр и утверждает, что задачи на условный
экстремум сводятся к игровым задачам, в частности отысканию, седловой точки. Последнему утверждению можно придать более четкую форму. Если рассматривать малую окрестность точки [хопт, λопт] в (n + m)-мерном пространстве, то в силу того, что Φ (х, λ) имеет максимум по х, для любого к из этой окрестности можно написать:
Φ (х, λопт) ≤ Φ (xопт, λопт) = F (хопт). (17-14)
Рис. 17-7. Вырожденная седловая точка
Далее, Φ (хопт, λ) = F (хопт), так как хопт ∈ G. Поэтому Φ (хопт, λ) = F (хопт, λ). С учетом этого и соотношения (17-14) можем написать:
Φ (х, λопт)≤ Φ (xопт, λопт) = Ф (хопт, λ)
Тем самым доказано, что функция Лагранжа имеет в оптимальной точке (хопт, λопт) седловую точку, правда, вырожденного типа, так как справа стоит знак строгого равенства (рис. 17-7).
Точка (хопт, λопт) функции двух векторных переменных Ψ (х, λ) называется седловой, если удовлетворяются соотношения
Ψ (x, λопт) ≤ Ψ (xoпт, λопт) ≤ Ψ(xoпт, λ)
Заметим, что знак "=" можно заменить более широким знаком "≤".
Классические методы оптимизации функции при наличии ограничений, так же как и классическое вариационное исчисление, в принципе позволяют определять экстремум функции при ограничениях в виде нестрогих равенств, и, в частности, при требовании не отрицательности переменных. Однако это сопряжено с возрастанием трудоемкости вычислений. Рассмотрим вначале случай не отрицательности переменных. Пусть имеется задача оптимизации вида
max{z=F(x)|x≥0, φi=bi, i=1,...,m; m<n
Допустим, что максимум достигается в точке хопт, которая лежит внутри или на границе области допустимых значений. Первоначально исследуют все внутренние точки положительного октанта n-мерного пространства и в них вычисляют значения функции цели z. Затем исследуют границу положительного октанта, причем на первом этапе приравнивают нулю одну переменную, решают задачу на оптимум с оставшимися n — 1 переменными, и m ограничениями и вычисляют значение функции цели для каждого решения. Так как переменных n, то на первом этапе необходимо решить n задач с n — 1 переменными и m ограничениями. На втором этапе приравнивают нулю каждые две координаты и решают задачу с n — 2 переменными и m ограничениями. Можно показать, что число таких задач будет n!/2! (n — 2)!. В последующих задачах нулю приравниваются три, четыре и т. д. координаты. Отсюда сразу видна трудоемкость такого вычислительного процесса. Если не все переменные подчинены условию не отрицательности, то нулю приравниваются только те, для которых это требование имеет место.
Теперь рассмотрим случай, когда нет условий не отрицательности, но некоторые из ограничений имеют форму неравенств. Пусть
т. е. v ограничений имеют форму неравенств, остальные m — v — форму равенств. Добавим v переменных xφi≥0 которые сводят неравенства (17-15) к равенствам вида
Теперь задача свелась к ранее рассмотренной: ограничения заданы в виде строгих равенств, но имеется требование не отрицательности u + v переменных xφi. Заметим, что условие gi(x) ≥ bi эквивалентно xφi≥0 (i = 1, ..., v), а условие gi (х) ≥ bi эквивалентно xφi≥0 (i = u + 1, ...., vi). Экстремум может достигаться внутри неотрицательного октанта u-мерного пространства, где xφi>0, и на его границах, где одно или несколько xφi=0. Рассмотрим вначале вариант с xφi>0. Функция Лагранжа для уравнений (17-16) будет иметь вид:
Для точки оптимума частные производные от этой функции по всем переменным, в том числе и по xφi, должны равняться нулю. Поэтому
Эти соотношения означают, что если в точке экстремума xφi>0, то соответствующие λi = 0, т. е. ограничения, которые в точке экстремума имеют вид строгих неравенств, можно не учитывать. При движении по границе, где некоторые xφi = 0, соответствующие ограничения следует учитывать и для них λi ≠ 0. По существу доказано очень важное соотношение, что в точке оптимума или вспомогательные переменные xφi = 0, или соответствующие множители Лагранжа λi = 0, т. е.
λiоптxφiопт = 0 (17-18)
или
Таким образом, вначале просматривают внутреннюю часть области положительного октанта v-мерного пространства xφi, т. е. по существу отбрасывают все ограничения в форме неравенств (v штук), ищут решение и вычисляют значение z. Затем поочередно подключают одно соотношение, эквивалентное xφi = 0, далее по два соотношения и т. д. и каждый раз вычисляют значения z. Наибольшее из этих z соответствует точке экстремума.