Глава пятая. Поиск экстремума в условиях неопределенности. Простейшая задача
5.1. Роль эксперимента в исследованиях. Принцип гарантированного результата
Методы решения задач математического программирования, рассмотренные в предыдущих главах, предполагали проведение целого ряда исследований, связанных с изучением особенностей той или иной задачи, различного рода доказательствами, построением вычислительных схем и т. п. Основой всего этого служило четкое представление о характере зависимости z = f(X).
Несмотря на большие успехи теории математического программирования, еще многие оптимизационные задачи не решены в общем виде. Примеры таких задач можно найти при исследовании систем, деятельность которых не поддается формальному описанию, при оценке наилучшего поведения человека в определенных ситуациях и т. д. Учитывая эти замечания, обратимся к изучению задач, для которых характерно следующее:
а) целевая функция не имеет аналитического выражения;
б) значения этой функции при тех или иных значениях X могут быть получены посредством проведения некоторой операции, которая в дальнейшем будет называться экспериментом (здесь имеет смысл расширить понятие "эксперимент", считая, что экспериментом являются и обращение к таблице или памяти ЭВМ, и наблюдение результата на экране моделирующей установки, и непосредственное проведение каких-либо измерений или вычислений и т. п.);
в) представляющее интерес максимальное или минимальное значение целевой функции и соответствующие точки X* могут быть получены путем проведения ряда однородных экспериментов, число которых ограничено.
Указанные действия составляют процесс поиска экстремума z = f(Х) в рассматриваемых специфических условиях. Правила, по которым ведется поиск, называются стратегиями. Поскольку в рамках одной и той же задачи можно применять различные стратегии поиска X*, z*, естественно попытаться найти ту из них, которая:
является наилучшей в смысле уменьшения объема необходимых вычислений, поэтому наряду с главным требованием- найти точку экстремума г - возникает дополнительное (но не менее важное) требование выбора стратегии поиска, обладающей нужными свойствами.
Конечно, такой подход возможен и в случаях, когда вид зависимости z = f(X) известен, но аналитические методы решения по каким-либо причинам не удается применить. Следовательно, замечание а) нужно рассматривать скорее как указание на то, что существует обширный класс задач, которые могут быть решены несмотря на препятствие, кажущееся на первый взгляд непреодолимым.
Рис. 5.1
Рис. 5.2
Чтобы лучше представить себе основные идеи, связанные с организацией поиска, обратимся к анализу детерминированных схем. Здесь в первую очередь рассматривается случай скалярного аргумента (простейшая задача поиска).
Предположим, что X = (x1) и целевая функция обладает такими особенностями:
- имеет только один максимум (относительный, он же и абсолютный) на интервале определения (свойство унимодальности, см. рис. 5.1);
- может не удовлетворять требованиям непрерывности, существования производной во всех точках и т. п.
Всегда можно считать, что x1 меняется в пределах ют 0 до 1 (любой другой интервал изменения x1 легко приводится к [0, 1]); кроме того, в дальнейшем удобно опустить индекс "1", так что х1 = х.
Чтобы иметь возможность использовать свойство унимодальности, обратимся к определению. Пусть х1 и х2 есть значения х в двух экспериментах, дающих соответственно z1 и z2, а х* - значение х, при котором достигается max z = z* (полагаем х2>х1). Функция z = f(x) является унимодальной, если из условия х1>х* следует z1>z2, а из условия х2<х*-z1<z2 (рис. 5.2). Таким образом, если точки х1 и х2 расположены по одну сторону от х*, то более близкой к х* точке отвечает большая величина z. Определение исходит из возможности найти z при данном х только путем эксперимента и поэтому не затрагивает никаких свойств функции z = f(x). Это, в свою очередь, позволяет прийти к важному выводу: результат любой пары экспериментов должен указать такой интервал значений х, который по своей величине меньше исходного интервала [0, 1] и обязательно содержит х*.
Рис. 5.3
Действительно, до проведения экспериментов было известно, что 0≤x*≤1. Если х1 и х2 выбраны из условия х1<х2 и для каждого из них получена соответствующая величина г, то возможны три варианта соотношений между z1 и z2: z1>z2, z1<z2, z1 = z2 (рис. 5.3). При z1>z2 точка х* не может лежать правее точки х2 (иначе нужно требовать z1<z2), и под интервал [х2, 1] должен быть исключен из рассмотрения. Далее, при z1<z2 точка х* не может находиться левее x1 (иначе z1>z2). Наконец, при z1 = z2 точка х* должна находиться между x1 и х2. Любой из найденных подынтервалов, содержащих х*, меньше исходного интервала [0, 1]. Таким образом, использование принятого выше определения унимодальности позволяет организовать пошаговый процесс последовательного сужения указанных подынтервалов с тем, чтобы в конце концов приблизиться к х*.
Для получения формальных зависимостей обратимся к общему случаю произвольного числа экспериментов N, находящихся в распоряжении исследователя (N>2). Схема, отражающая возможные исходы этих N экспериментов, строится по принципу: варианту с номером q(\^q^N) соответствует предположение о том, что наибольшее z найдено в точке хq (рис. 5.4). Определение интервалов, на которые должно приходиться значение х*, происходит здесь так же, как в примере с N = 2 (рис. 5.3). Соотношение величин zq-1 и zq+1, получаемых в точках, соседних с xq(q = 1,...., N), не влияет на результат (безразлично, будет ли zq-1>zq+1 или zq-1<zq+1; важно, чтобы zq было наибольшим из всех z найденных при данном N). Из рис. 5.4 видно, что длина и положение рассматриваемых интервалов меняются в зависимости от величины q, значений x1, х2, .....,xN, выбираемых при каждом q = const (т. е. стратегии поиска), и от числа N. Формально это отражено в неравенствах
xq-1<x*<xq+1, (5.1)
которые справедливы для всех названных q, если точки x = 0 и х = 1 обозначены как х0 и xN+1.
Неравенства (5.1) позволяют ввести меру эффективности поиска и определить на этой основе рациональные схемы его организации. Назовем интервал [xq-1, xq+1] интервалом неопределенности; его длина lN = xq+1-xq-1 при известном N зависит от исхода всех N экспериментов, дающего номер q, и самих х1, х2, ....,xN, выбранных из тех или иных соображений, т. е. lN = ln (k, q) (здесь символом % обозначена вся совокупность х1, х2, ...., xN).
Чтобы определить рациональную стратегию (или ее начальную фазу) заранее, не приступая к экспериментам, достаточно рассмотреть следующие условия: если x1, x2, .....,xN выбраны и тем самым задан ряд интервал лов [xq-1, xq+1] (q = 1,..., N), то какой-то из них имеет наибольшую (по сравнению с остальными) длину lN=l̄N. Приняв l̄N в качестве характеристики выбранной совокупности χ = (х1, х2,...,xN), можно быть уверенным в том, что реальный результат поиска х* при этих x1 х2, ..., xN, оцениваемый величиной lN, будет лучше (или по крайней мере не хуже) l̄N. Очевидно, lN, заданная как
является функцией только χ (принятая ориентация на худший случай дает гарантию от непредвиденных осложнений, которые могут возникнуть в ходе проведения экспериментов). Если теперь рассмотреть множество стратегий с показателями l̄N, то лучшей из них следует признать ту, которой соответствует наименьшая величина l̄N (преимущество такого выбора в том, что, во-первых, сохраняется гарантия получить реальную длину интервала неопределенности, не превышающую l̄N, и, во-вторых, эта гарантированная длина минимальна). Обозначив рассматриваемый минимум l̄N как LN, получим
(5.2)
Величина LN определяет единственную стратегию, называемую минимаксной. Всякое отклонение от нее приведет лишь к опасности ухудшения результата будущего поиска. Большое преимущество использования критерия LN заключается в возможности априорного выбора оптимальной стратегии действий, приводящих к получению х*, z*.
Существует два вида стратегий: пассивные, в которых еще до начала эксперимента назначены все x1, x2, ....., xN, и активные, в которых выбор очередных значений х зависит от результатов предшествующих экспериментов (имеет место накопление и активное использование информации о свойствах целевой функции).