Метод эталонов [7. 1 ] позволяет безошибочно классифицировать учебную выборку любого объема ε-непересекающихся образов (см. главу III). Однако в силу того, что объем учебной выборки всегда ограничен, построенное по ней решающее правило не гарантирует отсутствия ошибок на экзамене. На экзамене могут встретиться ошибки трех видов: ошибка неправильного опознания - реализация попадает в эталонную оболочку чужого образа и не попадает в свою; ошибка отказа - реализация не попадает ни в одну из эталонных оболочек всех образов; альтернативная ошибка - реализация попадает в пересечение двух (более двух) эталонных оболочек различных образов.
Как правило, в практических задачах опознания указанные ошибки неравноценны.
Наиболее "тяжелой" по своим последствиям является ошибка неправильного опознания.
Ошибка отказа менее важна, чем ошибка неправильного опознания, так как во многих случаях бывает выгоднее отказаться от опознания, нежели выдавать неправильный ответ. Это особенно полезно тогда, когда есть возможность переспроса, т. е. повторения процесса опознания.
В задачах опознания многих классов часто целесообразно рассматривать альтернативные ошибки отдельно, так как неопределенность решения между двумя классами (дилемма), тремя (трилемма) и т. д. значительно меньше неопределенности решения в случае ошибки отказа.
Так, например, при опознании речевого потока по фонемам неопределенность решения между двумя-тремя фонемами в слове может быть ликвидирована дополнительными лингвистическими априорными данными. В то же самое время всегда остается возможность свести альтернативные ошибки к ошибкам отказа.
Детерминированный метод построения решающего правила, как и любой другой метод, не оперирующий непосредственно информацией о многомерных распределениях образов, сам по себе не может дать указание ни на величины рассмотренных типов ошибок, ни на эффективные способы их устранения.
Все, что удается сделать в этих условиях, - это сформировать наиболее простое решающее правило, безошибочно классифицирующее учебную выборку.
Увеличение объема выборки, естественно, улучшает решающее правило, сформированное детерминированным методом за счет того, что выборка становится более представительной. Однако прогнозирование этого улучшения и величины ошибок на экзамене по прежнему остаются невозможными.
Следовательно, для придания детерминированному методу построения решающего правила экстраполирующих свойств процедура доучивания или, как мы ее назовем, процедура коррекции должна быть статистической. Ввиду того, что многомерные распределения образов неизвестны, процедура коррекции решающего правила может быть только непараметрической. Для получения непараметрической оценки качества решающего правила, а также для его целенаправленной коррекции необходима контрольная выборка.
При не равноценности ошибок опознания разных типов целесообразно произвести коррекцию решающего правила так, чтобы обеспечить уровень наиболее тяжелых ошибок - ошибок неправильного опознания не более заданного техническими условиями. Платой за это может явиться некоторое увеличение альтернативных ошибок и ошибок отказа.
Критерием качества коррекции может, таким образом, служить величина альтернативных ошибок и ошибок отказа при заданном уровне ошибок неправильного опознания, т. е. этап коррекции направлен, в первую очередь, па обеспечение малости ошибок неправильного опознания и, во вторую очередь, на минимизацию областей альтернативных ошибок и ошибок отказа. Естественно, что достигаемая при однократной коррекции величина минимума ошибок второго и третьего видов при заданной ошибке неправильного опознания существенно зависит от того, как было построено исходное решающее правило по учебной выборке, т. е., однократная коррекция исходных эталонных оболочек может дать лишь условный минимум альтернативных ошибок и ошибок отказа.
Само собой разумеется, что коррекция не должна приводить к значительному усложнению решающего правила. Предлагаемый метод коррекции, как это показано в § 7.2, может несколько увеличить количество эталонов, но не более чем в два раза.
Статистическая коррекция решающего правила осуществляется с помощью некоторых одномерных предельных статистических параметров, которые характеризуют поведение будущей экзаменационной выборки относительно исходных эталонных оболочек, построенных по учебной выборке. А именно, по независимой контрольной выборке оцениваются величина максимально возможного выброса реализации за эталонную оболочку "своего" образа и величина максимально возможного проникновения реализаций внутрь эталонных оболочек "чужих" образов.
Метод нахождения оценок этих параметров основан на теории экстремальных значений [7.2], причем в задачах опознания многих классов требуемый объем контрольной выборки при некоторых условиях (см. главу III) может оказаться относительно небольшим.
Таким образом, статистическую коррекцию удается провести за счет некоторого увеличения обучающей выборки и небольшого усложнения решающего правила.
Эталонные оболочки образов строятся и корректируются по конечным выборкам. Поэтому весьма важными являются вопросы сходимости алгоритмов построения эталонных оболочек и алгоритмов их коррекции к безошибочному решающему правилу при увеличении учебной выборки.
В приложении 7.II приводятся теоремы о сходимости метода эталонов к безошибочному решающему правилу. Доказывается также, что многократное использование процедуры статистической коррекции за конечное число исправлений решающего правила приводит к не пересекающимся покрытиям образов.
Там же приводятся соображения о скорости сходимости формируемых эталонных оболочек образов к безошибочному решающему правилу.