Новости    Библиотека    Байки    Ссылки    О сайте


предыдущая главасодержаниеследующая глава

§ 4.5. Создание системы признаков по модифицированному взвешенному дискриминантному критерию, учитывающему сложность конфигурации образов

Использование простого дискриминантного критерия позволяет по центрам тяжести образов найти признаки, разделяющие свойства которых по отношению к реализациям различных образов эквивалентны разделяющим свойствам для центров тяжести.

Введение в критерий весовой функции нарушает выполнение этого условия. Поэтому, если действовать строго, то по взвешенному дискриминантному критерию нужно находить систему из минимального числа признаков, обеспечивающих заданную величину взвешенного среднеквадратичного расстояния между реализациями различных образов, а не между их центрами тяжести, как это предлагалось в § 4.4.

Однако практическое решение такой задачи возможно лишь для весьма небольших выборок и не реализуемо для больших выборок из-за перебора, квадратично зависящего от объема учебной выборки.

Для сокращения перебора процесс оптимизации признаков предлагается осуществлять в два этапа.

На первом этапе по взвешенному дискриминантному критерию оптимизируется система признаков, разделяющая центры тяжести образов.

Во многих случаях исходное описание таково, что центры тяжести образов несут информацию о большинстве реализаций выборки (хотя сами образы при этом- могут иметь достаточно сложную конфигурацию). Тогда система признаков, хорошо разделяющая центры тяжести, хороша и для разделения основной массы реализаций, т. е. расстояние между большинством пар реализаций выборки, принадлежащих различным образам, в найденном пространстве признаков больше некоторой величины d0*.

На втором шаге для оставшихся неразделенными реализаций, составляющих небольшую часть выборки, создается дополнительная система признаков. При этом в связи с малостью перебора для оптимизации этой системы можно воспользоваться взвешенным дискриминантным критерием, оперирующим не с центрами тяжести, а со всеми не разделивщимися реализациями.

Поиск признаков в два этапа: сначала по центрам тяжести, а затем по не разделившимся реализациям выборки позволяет сократить перебор во много раз. При этом в число не разделившихся после первого этапа пар реализаций попадут в основном наиболее близкие пары, которые вошли бы в критерий оптимизации признаков по всей выборке с наибольшим весом. Указанное обстоятельство позволяет предполагать, что результаты оптимизации признаков в два этапа близки к результатам оптимизации по всей выборке в целом.

Таким образом, пространство признаков образуется базисом, состоящим из признаков, разделяющих основную массу реализаций образов, и дополнительных признаков для не разделившейся части реализаций. Полученные системы признаков неортогональны и могут быть дополнительно ортогонализированы в тех случаях, когда решающее правило строится в метрике l2. Алгоритм поиска дополнительных признаков приводится в приложении 4.V.

В тех задачах опознания, в которых центр тяжести не несет информации об основной массе реализаций образов, алгоритмы создания линейных признаков усложняются. В этом случае признаки, находимые по центрам тяжести, не разделяют основную массу реализаций образов и не позволяют сократить перебор при нахождении дополнительных признаков.

В данной ситуации может оказаться, что образы имеют достаточно сложную конфигурацию, но в то же время могут быть покрыты относительно небольшим числом

сфер в метрике 12, включающих в себя только точки одного образа. Тогда здесь целесообразно предварительно найти в пространстве исходных параметров минимальное покрытие образов в l2, что можно сделать с помощью метода эталонов (см. главу VI).

Очевидно, что система признаков, обеспечивающая разделимость сфер, принадлежащих различным образам, обеспечивает также разделимость всех реализаций образов. Для нахождения системы признаков, разделяющих сферы, используется уже описанный взвешенный дискриминантный критерий, оперирующий с векторами, соединяющими центры сфер различных образов, уменьшенными на величину, равную сумме их радиусов.

Алгоритм нахождения системы признаков для этого случая не приводится, так как мало отличается от алгоритма приложения 4. IV. Различия в алгоритмах легко устанавливаются по содержанию параграфа.

предыдущая главасодержаниеследующая глава





Пользовательский поиск


Диски от INNOBI.RU




© Злыгостев Алексей Сергеевич, подборка материалов, оцифровка, статьи, оформление, разработка ПО 2001-2017
При копировании материалов проекта обязательно ставить активную ссылку на страницу источник:
http://informaticslib.ru/ "InformaticsLib.ru: Информатика"