Глава шестая. Экстремальные задачи с неполной информацией. Общий случай
6.1. Особенности многомерной оптимизации. Этапы поиска решений
Изучая задачи с многими переменными (случай векторного аргумента), необходимо иметь в виду замечания, сделанные в § 5.1. Вместе с тем возрастающая сложность условий поиска экстрема требует уточнения основных понятий гл. 5 и связанных с ними способов организации экспериментов.
Если по-прежнему считать, что значение z в какой- либо точке X = (x1, х2, ..., хn) определяется с помощью эксперимента, то объективно существующее (но неизвестное исследователю) соотношение z = f(X) может рассматриваться как уравнение некоторой гиперповерхности в Rn, называемой обычно поверхностью отклика. Множество точек X, удовлетворяющих ограничениям вида gi(X)≤bi (i = 1,...., m) является областью эксперимента (эти ограничения должны быть строго определены; здесь полная аналогия с условиями задач, изученных в гл. 1-4).
Методы формирования стратегий поиска X*, z* в рассматриваемом случае заметно отличаются от того, что было предложено в гл. 5. Это вызвано целым рядом причин, связанных как с конкретными свойствами задач, так и условиями, в которых проводятся эксперименты (уровень информированности исследователя об изучаемой системе, располагаемые средства и т. п.). Например, с увеличением n становится все труднее сохранять предположение об унимодальности z (хотя во многих случаях это делается, само понятие унимодальности функции многих переменных требует уточнения). Возникают осложнения с выбором меры эффективности поиска (оценка остаточной неопределенности в единицах длины, площади, объема становится либо неоднозначной, либо не соответствует смыслу задачи и т. д.).
Эти утверждения можно иллюстрировать следующим простым расчетом: пусть область эксперимента представляет собой единичный гиперкуб, заданный неравенствами 0≤xj≤1, (j = 1,....,n); пусть далее удалось так построить эксперимент, что остаточная область неопределенности тоже оказалась гиперкубом с объемом v<<1 (т. е. со стороной l = v1/n величина I принимается за показатель "линейной" неопределенности); легко видеть, что с ростом n достижение фиксированной "объемной" неопределенности v перестает что-либо значить, так как "линейная" неопределенность сохраняется почти полностью, поэтому для получения удовлетворительного результата нужно либо затратить много усилий, либо изменить тактику действий и критерии оценки качества; наконец, при n>1 нарушается один из главных выводов § 5.1 о возможности эффективного использования любой пары экспериментов в интересах решения задачи.
Теперь имеет смысл рассмотреть некоторые общие черты, присущие всякой стратегии. Постановка экспериментов преследует две цели - найти лучшее (по смыслу задачи) значение z и получить информацию о том, в какой точке провести следующее испытание. В случае n-1 эти два момента тесно связаны, но в более общих случаях (n>1) они четко разделены, и поэтому приходится различать эксперименты по их назначению.
Если оценки значений z позволяют получить и сведения о свойствах поверхности отклика в окрестности некоторой точки X (выбираемой произвольно или на основе каких-то соображений), то соответствующие эксперименты называются пробными; они как бы группируются вокруг опорного (рабочего) эксперимента, проводимого в X. Переход от одной точки X к другой означает шаг в направлении X*; он может быть сделан лишь тогда, когда проведены очередные пробные эксперименты, дающие необходимую информацию для выбора указанного направления. Таким образом, характерной чертой любой стратегии поиска X*, z* является разумное сочетание экспериментов двух видов, хотя общего ответа на вопрос о том, каким должно быть это сочетание, по-видимому, нет. Можно лишь сказать, что в начале поиска приходится исследовать некоторую опорную точку, выбранную либо случайно, либо в соответствии с теми представлениями о свойствах z = f (X), которые имеет исследователь. После проведения подготовительных операций необходимо организовать переход в новую опорную точку. Наконец, после достижения окрестности X* нужно дать оценку достоверности полученного результата, что особенно важно в случаях, когда f(X) имеет несколько локальных экстремумов.
Эти замечания позволяют дать общую схему организации поиска X*, z*, которая объединяет три основных этапа. Поиск начинается с выбора исходной точки Х0 и определения локальных свойств поверхности отклика с помощью постановки пробных экспериментов (этап I). Полученная при этом информация используется для выбора новой опорной точки (этап II), применительно к которой этап I повторяется и т. д. По истечении некоторого времени будет найдена опорная точка, претендующая на роль X*, и возникнет необходимости специального исследования ее окрестности (этап III), которое либо завершит всю процедуру поиска, либо даст информацию о том, что решение задачи необходимо продолжить.
Каждая из разработанных на сегодня схем поиска имеет особенности, находящие свое выражение исключительно в содержании этапа II. Действия, проводимые на I и III этапах, остаются неизменными, поэтому их анализ можно провести отдельно, не связывая его с изучением какой-то определенной стратегии.