7.3. Анализ точности результатов. Критерий качества получаемых решений
Обратим теперь внимание на следующее важное обстоятельство: теоретически достичь точки х* можно лишь за бесконечно большое число шагов, причем различными путями (условия сходимости процесса являются слабыми и допускают широкий выбор последовательностей корректирующих коэффициентов). В то же время любая практическая ситуация характеризуется тем, что:
1) исследователь может провести лишь конечное число экспериментов (ограничены средства, время);
2) поиск х* редко проводится "вручную"; обычно используются те или иные технические устройства, обладающие ограниченной чувствительностью к изменениям скорости сходимости процесса (начиная с некоторого номера i создается впечатление, что процесс "остановился");
3) часто неоднозначность выбора аi (или аi/сi) просто нежелательна из-за трудностей, к которым она может привести при разработке единых схем решения задач (например, стандартных программ для ЭВМ или инструкций для персонала средней квалификации и т. п.). Таким образом, получить точный результат х*, z* практически невозможно, и приходится давать опенки погрешностей найденных решений.
Чтобы оценить точность какого-либо результата, необходимо выбрать критерий качества. Обычно этот выбор согласуется с характером и содержанием той оптимизационной задачи, которая представляет интерес в данный момент. Вместе с тем существуют критерии, достаточно универсальные, применяемые в разных задачах (например, вероятностные).
Рассмотрим разность x*-Xi+1 = Δi+1 (здесь и в дальнейшем будем полагать х = х*). Предположим, что xi+1- последняя точка, определяемая в ходе поиска х*(i>1). В этих условиях величина Δi+1-погрешность полученного результата, носящая случайный характер. Ее систематическая составляющая есть х*-Yi, а случайная составляющая -Ri.
Если выбирать различные последовательности {ai} или {ai/ci) (т. е. менять скорость сходимости процесса), то можно заметить следующее: чем меньше эта скорость, тем меньше ожидаемая величина |х*-Yi|, но тем больше Ri (расширяется возможность приблизить Yi к x* с одновременным возрастанием опасности случайного "выброса" точки xi+1). Наоборот, увеличение скорости сходимости способствует более интенсивному подавлению помехи, но затрудняет приближение Yi к х*. Таким образом, закономерности поведения составляющих ошибки Δi+1 в рассмотренной ситуации противоположны. Меняя характер сходимости процесса, можно лишь менять соотношение между величинами систематической и случайной погрешностей, стремясь сделать это соотношение наиболее приемлемым в том или ином смысле. Очевидно, эти соображения должны быть положены в основу выбора критерия качества.
Одним из наиболее распространенных является критерий вида Ki=(x*-Yi)2+σ2[Ri], где σ2[Ri]-дисперсия D [Ri]; для краткости его часто называют "сумма квадратов случайной и систематической ошибок". Требование минимизации Ki равносильно требованию найти разумное сочетание величин составляющих Δi+1, определив тем самым оптимальную последовательность корректирующих коэффициентов.
Теперь можно сформулировать задачу: для известного числа экспериментов (N), находящихся в распоряжении исследователя, и известных условий сходимости процедур стохастической аппроксимации выбрать параметры принятой схемы переходов так, чтобы исключить опасность возрастания величин Ki.
Как будет видно из дальнейшего, поставленная задача разрешима тогда, когда есть информация о свойствах zи = f(x) (это уже было замечено в § 7.3). Дать такую информацию могут, в частности, те или иные гипотезы, принимаемые и используемые исследователем. С этой точки зрения ниже рассматриваются процедуры Роббинса - Монро и Кифера - Вольфовица.