Формирование решающего правила в пространстве высокой размерности сопряжено с большими вычислительными трудностями. Не меньшие трудности возникают и при его технической реализации. В связи с этим появляется необходимость в образовании из большого числа параметров исходного описания относительно малого числа других характерных параметров, называемых признаками, значения которых были бы "близки" для реализаций одного и того же образа и "далеки" для реализаций различных образов.
Методы создания признаков можно разделить по степени участия человека в процессе создания признаков на эвристические и алгоритмические.
Этап нахождения признаков является первой ступенью обобщения свойств объектов опознания. Нельзя не вспомнить, что такой замечательной способностью к обобщению обладает человек. Так, например, несмотря на то, что в большинстве задач опознания зрительных образов весь процесс опознания происходит подсознательно, человек может, если это необходимо, сформулировать эвристические признаки, достаточные для опознания заданных классов. Эта способность человека находить эвристические признаки отразилась и в подходе к решению ряда опознавательных задач [1.19-1.21].
Признаки, создаваемые человеком эвристически, пригодны только для решения конкретной задачи опознания и создаются в основном для решения "человеческих" задач опознания. Поиск таких признаков всегда требует весьма тщательного изучения физической сущности опознаваемых образов. Эвристические признаки обладают, как правило, хорошими разделяющими свойствами. Однако система таких признаков является сильно коррелированной, и новые признаки фактически повторяют информацию, содержащуюся в малом числе ранее найденных удачных признаков.
Все это привело к необходимости разработки алгоритмических методов создания системы не коррелированных признаков.
Алгоритмические способы создания признаков реализуются при помощи ЭВМ и построены на оптимизации некоторого критерия (функционала), характеризующего разделяющие свойства системы признаков.
При этом предполагается, что информация о свойствах образов заключена в описании реализаций, а изучение физических свойств образов может быть сведено к минимуму - к виду функционала, который обычно заранее задается человеком. Модель, на основании которой выбирается функционал, является достаточно общей, что позволяет использовать одни и те же алгоритмы нахождения признаков для решения широкого круга задач. Алгоритмические методы создания признаков были успешно применены при решении задач опознания зрительных образов [1.11, 1.22], речевых образов [1.23-1.26], [§ 8.2, 8.4 этой книги], в задачах технической [1.27], [§ 8.3] и медицинской диагностики [1. 28].
В соответствии с типами задач опознания критерии в алгоритмических методах создания признаков можно разделить на две категории: критерии, служащие для минимизации ошибок опознания при заданном числе признаков, и критерии, служащие для минимизации числа признаков при сохранении разделимости образов.
Критерии создания признаков в задачах опознания с пересекающимися образами направлены на минимизацию числа ошибок опознания при заданном числе признаков |1. 29, 1. 30].
В задачах опознания с ε не пересекающимися образами, как показано в главе II, критерии создания признаков могут быть направлены на упрощение функциональной структуры опознающего автомата при сохранении ε не пересекаемости.
Признаки, создаваемые алгоритмически, образуются из параметров исходного описания в определенном классе преобразований.
По классам преобразований методы, используемые при создании признаков, можно разделить на логические, линейные и нелинейные.
Алгоритмы создания признаков на основе логических операций над квантованными значениями параметров исходного описания являются в основном переборными и приводят к двоичному пространству признаков.
Геометрически каждый признак, найденный по этому способу, можно отождествить с некоторым многомерным параллелепипедом в пространстве исходного описания. Для реализаций, попавших внутрь параллелепипеда(или фигуры, образованной в результате объединения и пересечения нескольких параллелепипедов), признак принимает значение 1, а для реализаций, лежащих вне параллелепипеда, - значение 0.
Эти алгоритмы были проверены на задачах медицинской и технической диагностики [1.27, 1.31, 1.32, 1.33].
Линейные признаки представляют собой линейные комбинации параметров исходного описания. Геометрически линейные признаки являются векторами в пространстве исходного описания. Совокупность признаков выделяет маломерное подпространство исходного описания, в котором сохранены условия разделимости образов.
В задачах опознания образов, которые в пространстве исходного описания ε не пересекаются, для создания системы линейных признаков целесообразен критерий минимума числа признаков при сохранении условия е-не- пересекаемости образов (см. главы II и IV).
Линейные признаки были использованы при решении задач опознания, описанных в главе VIII.
При создании линейных признаков, как это показано в главе IV, могут использоваться две модели.
Ё первой модели центр тяжести образа (выборочное среднее) несет информацию о большинстве реализаций образа. Такая модель позволяет существенно сократить перебор при нахождении системы признаков. Этой модели удовлетворяют, например, задачи опознания речевых команд (в соответствующем исходном описании, см. § 8.2), задача диагностирования основных видов состояний глубинных нефтяных насосов (по динамограммам их работы, см. § 8.3), задачи опознания основных видов интонаций (см. § 8.4).
Во второй модели центр тяжести в пространстве исходного описания не несет информации о большинстве реализаций образов (см. § 4. 5). В этом случае процесс нахождения линейных признаков начинается с выделения групп реализаций учебной выборки образов, однородных в метрическом смысле, с помощью метода эталонов [1.25]. Далее линейные признаки находятся из условия разделимости найденных группировок, принадлежащих к различным образам.
Методы создания линейных признаков, как это показано в главе IV, не требуют чрезмерно сложных вычислительных процедур на ЭВМ среднего класса для достаточно большого алфавита образов.
Перспективными являются интенсивно разрабатываемые методы создания нелинейных признаков, хотя они требуют гораздо более трудоемких процедур как при обучении, так и на экзамене [1.34, 1.35].
Существенный интерес представляет использование одномерных нелинейных преобразований, для оптимизации которых требуются лишь одномерные сечения многомерных статистических характеристик. Такие преобразования особенно целесообразны в комбинации с линейными преобразованиями общего вида (см. гл. IV).
Отметим, что одномерные нелинейные преобразования могут быть реализованы с помощью достаточно простых технических средств.
Необходимость разработки системы новых критериев для оптимизации нелинейных признаков побудила авторов отказаться в этой книге от подробного рассмотрения вопросов, связанных с нелинейными преобразованиями.
На методы создания признаков и на методы опознания значительное влияние оказывает число образов, подлежащих классификации.
Вообще говоря, задачи опознания многих образов с математической точки зрения всегда могут быть сведены к задаче опознания двух классов, в которых рассматривается один данный класс и все остальные. Но это не является наилучшим решением с технической точки зрения.
Проблема многоклассовости сама по себе влечет постановку новых задач. Например, сильно изменяются задачи отыскания признаков, задачи борьбы с возникающим в алгоритмах перебором, задачи и требования технической реализации опознающего автомата и ряд других. С другой стороны, при определенных условиях многоклассовость позволяет получить достаточно точные оценки некоторых статистических параметров, характеризующих взаимоотношение между образами, даже в том случае, когда объем выборки на каждый класс относительно невелик. (Об этом более подробно написано в главах III, IV, VII.)
В задачах опознания заданного алфавита образов из неограниченного алфавита этап нахождения признаков приобретает совершенно иную идеологию [1.11]. В этих задачах нельзя исключить ни одного свойства, представленного в исходном описании образов, так как класс "не знаю" в учебной выборке не фигурирует. Этап нахождения признаков в этой задаче направлен на отыскание наиболее экономной формы представления информации и заключается в нахождении для каждой реализации выборки параметров преобразования ее в эталонную реализацию.