6.2. Выбор начальных условий поиска. Линейная модель поверхности отклика
Здесь будут рассмотрены вопросы, касающиеся выбора исходной опорной точки Х0 и содержания исследований на этапе I поиска X*, z*. В общем случае затраты средств и времени, с которыми неизбежно связана постановка экспериментов, могут быть сокращены удачным выбором Х0. Пусть в области эксперимента (Э) указаны две точки - точка У, которую достаточно обоснованно можно назвать центром области, и точка 2, расположенная на периферии (рис. 6.1). Обе они могут выступить в роли Х0, однако опасность растянуть процесс решения задачи (перерасходовав тем самым материальные средства) оказывается большей для точки 2. Причина этого заключается в возможности появления X* на "противоположной стороне" области Э и связанного с этим увеличения количества переходов, составляющих процесс поиска. Следовательно, всегда желательно выбирать Х0, используя понятия центра области. Ниже приведены три определения центра, которые могут быть полезны на практике.
I. Предположим, что в качестве характеристики области Э принят перечень величин
определяющий ее "габаритные" размеры и содержащий 2n чисел (рис. 6.2); точка Хс с координатами xjc = 0,5(xjmn+xjmn) (j = 1,...,n) называется средней точкой и может рассматриваться как центр области; достоинством такого определения является простота, недостатки же заключаются в возможности попадания Хс за пределы Э (если, например, область имеет кольцеобразную форму), а также в чувствительности к поворотам координатной системы.
II. Пусть в области эксперимента выбрана некоторая точка X; гиперплоскость, являющаяся касательной к поверхности уровня z = const в этой точке, делит Э на две части с объемами v1, v2 всегда можно считать v1≤v2, см. рис. 6.3). Величины v1, v2 зависят о от положения X и направления вектора градиента v1(X), т. е. v1 = v1(X, ∇) и v2 = v2(X, ∇).
Рис. 6.1
Рис. 6.2
Рис. 6.3
Критерием сравнения X с другими точками области Э может служить величина v
это позволяет рассматривать точку Хмм с характеристикой
в качестве искомого центра области (минимаксный центр). Он нечувствителен к поворотам и параллельным переносам координатной системы, однако трудности его вычисления весьма велики (особенно в случаях, когда область Э имеет сложную форму и n<3).
III. Часто оказывается удобным использовать понятие центра тяжести (Хцт), связывая его с представлением области эксперимента как некоего однородного тела; все необходимые вычисления проводятся по известным формулам механики (их можно найти в примере на с. 186).
Приведенные определения центра не исчерпывают всех возможных определений. Точки Хс, ХММ, Хцт и другие выполняют функции исходных опорных точек не только на первом шаге поиска (здесь они обозначаются как Х0), но и на последующих шагах, если, конечно, имеющаяся (или появляющаяся) в распоряжении исследователя информация о свойствах z = f(X) не отвергает самой идеи использования понятия "центр" в подобных целях.
Обратимся теперь к анализу этапа I, считая, что точка Х0 с координатами х10, x20,....,xn0 по так или иначе выбрана и в ней определено опытным путем значение z0 = f(x10, x20, ...., xn0). Этот единственный пока эксперимент не дает никаких сведений о характере поверхности отклика в окрестности Х0 (а также о направлении дальнейшего "движения"). Чтобы получить нужную информацию в существующих условиях неопределенности, приходится строить более или менее приближенную модель исследуемого участка рассматриваемой поверхности. В качестве основы здесь может быть принята формула Тейлора
(6.1)
позволяющая оценить приращение Δz, которое будет получено при переходе из Х0 в какую-то другую точку X. Для вычисления частных производных, входящих в (6.1), используется первая группа пробных экспериментов, проводимых "вблизи" Х0. Их число определится количеством членов разложения (6.1), причем обычно оставляется его линейная часть
что позволяет разумно Сократить объем работы и в то же время получить приемлемый результат. Здесь достаточно вычислить только первые производные, и пробные эксперименты проводятся в точках (х10+ε, x20,....,xn0), (x10, x20+ε, x30, . . ., xn0),....., (x10, . . ., xn0+ε), находящихся на расстоянии ε от Х0 (смысл величины ε в данном случае тот же, что был при анализе простейших схем поиска, см. гл. 5). Соответствующие величины zjε (j = 1,...,n) входят в оценочные формулы
позволяющие, в свою очередь, найти Δzл при различных вариациях значений Δxj. Знак и величина Δzл определят направление следующего шага (этим завершается этап I поиска X*, z*).