§ 4.9. О соотношении компромиссных и оптимального критериев качества признаков
Как уже указывалось раньше, изложенные дискриминантные критерии оптимизации системы признаков являются компромиссными, в разной степени разрешающими противоречие между сложностью вычислительных процедур и близостью к оптимальному решению.
Напомним, что в рамках детерминированно-статистического подхода оптимальной системой признаков мы называем подпространство минимальной размерности, в котором сохраняется условие ε-непересекаемости образов.
Очевидно, что найти такую систему признаков можно, лишь зная многомерные распределения образов.
В действительности все описанные выше критерии и методы оптимизации линейных признаков используют только информацию, заключенную в конечной учебной выборке, и направлены на обеспечение метрической разделимости этой учебной выборки с некоторым порогом d. При этом величина порога d может иметь и статистический и детерминистский смысл. Так, например, в многомерных дискрихминантных критериях выбор числа признаков осуществляется по величине среднеквадратичной ошибки аппроксимации d̄2, а в одномерных дискриминантных критериях - по величине наименьшего расстояния между реализациями выборки различных образов d*0. Модифицированные многошаговые процедуры поиска дискриминантных признаков являются примером использования величины критерия d ив статистическом и детерминистском смыслах.
Система линейных признаков, обеспечивающая метрическую разделимость учебной выборки с порогом d*0 (соизмеримым с минимальным выборочным расстоянием между образами), интуитивно близка к оптимальной в указанном смысле системе признаков, если учебная выборка представительна.
Однако гарантировать сохранение условия ε-непересекаемости такая система признаков, вообще говоря, не может.
Поэтому окончательное число признаков (близкое к минимальному) выбирается после оценки метрической близости образов по независимой контрольной выборке (см. главу III). Сделать это относительно нетрудно, так как найденные признаки уже упорядочены по величине критерия разделимости.
Необходимо также отметить, что при переходе в пространство признаков величина метрической близости образов может измеряться в различных метриках. Для технической осуществимости опознающего автомата важно лишь соотношение фактической величины ε с аппаратурной погрешностью А в соответствующей метрике.