Глава вторая. Детерминированно-статистический подход к опознанию образов
§ 2.1. Введение
Наиболее характерная ситуация, с которой приходится сталкиваться при проектировании автомата для решения невырожденных задач опознания, заключается в следующем.
1. Как правило, априорно отсутствует строгое понятие образа, т. е. заранее неизвестны законы (статистические либо детерминистские), по которым могут быть генерированы реализации образов.
Вся доступная информация представлена лишь некоторым подмножеством реализаций (учебная выборка), на основании которой и требуется создать опознающий автомат, способный классифицировать не предъявленные ранее реализации образов.
2. Объем учебной выборки недостаточен для удовлетворительного восстановления многомерных распределений образов.
3. Размерность пространства исходного описания велика. Число образов в некоторых задачах может быть также достаточно большим.
Очевидно, что при этих условиях необходимо ввести некоторые ограничения, которые позволили бы выделить достаточно широкий класс практических задач опознания, решаемых единообразно с помощью некоторого алгоритмического подхода.
В развиваемом в монографии детерминированно-статистическом подходе приняты следующие ограничения:
1) алфавит образов задан заранее;
2) образы в пространстве исходного описания ε не пересекаются, т. е. минимальное расстояние между реализациями различных образов остается не менее некоторой конечной величины ε при неограниченном увеличении объема выборки;
3) исходные описания объектов различных классов являются компактными семействами функций (см. приложение 2. I).
При разработке детерминированно-статистического подхода требовалось выполнить следующие основные условия:
1. Обеспечить при постулируемых ограничениях принципиальную осуществимость конечного опознающего автомата, обладающего нулевой ошибкой опознания на учебной выборке любого объема.
2. Обеспечить при постулируемых ограничениях сходимость процесса обучения к безошибочному решающему правилу с вероятностью единица.
3. Обеспечить реализуемость алгоритмов подхода на ЭВМ среднего класса для массивов с достаточно большим алфавитом образов.
4. Обеспечить возможность технической реализации опознающего автомата в виде достаточно простого специализированного опознающего устройства с заданными уровнями ошибок различных типов.
Недостаточный объем априорной информации, большая размерность исходного описания, многоклассовость в рассматриваемых задачах опознания, с одной стороны, и требования технической реализуемости подхода, с другой - привели авторов к мысли о необходимости разумного сочетания достоинств детерминистских и статистических методов исследования.
Детерминистские методы позволяют найти наиболее простую структуру опознающего автомата, а статистические - позволяют прогнозировать и регулировать качество его работы в режиме нормальной эксплуатации.
Естественно, что требования практической пригодности тех или иных алгоритмов подхода заставляют иногда отказаться от поиска оптимального решения. Вместо этого приходится искать компромисс между сложностью реализации алгоритма и близостью его к оптимальному.