Исследователи в области распознавания образов сосредоточивают внимание на извлечении глобальных признаков, за которым идет манипулирование в пространстве признаков. Получаемые результаты часто оказываются полезными при решении практических задач.
Рис. 8.21. Программа Холлербаха позволяет успешно описать и идентифицировать амфору и килик. Описание для амфоры: тип - амфора, используется для хранения твердых и сыпучих тел - тело: высокое яйцеобразное, высокоплечее с прямым профилем снизу, резко переходящим в округлый - горло: высокий и широкий цилиндр с прямым и вертикальным профилем, не сливается с телом - венчик: завернутый- опора: низкая и узко формованная - ручки: две вертикальные ручки от плеча к горлу. Описание для килика: тип - килик, используется для разливания жидкостей - тело: неглубокая пиала, раскрытая, с выпуклым округлым профилем - венчик: очень низко формованный - опора: высокий пьедестал, широко скошенный с широким черенком и узким основанием, не сливается с телом - ручки: две горизонтальные ручки под малым углом относительно тела
Рис. 8.22. Очень сложные формы можно описать как комбинацию из простых форм с вырезами и выступами. Телефонный аппарат представляет собой усеченный клин с углублением, из которого выдаются два U-образных выступа
Существует обширная литература по физиологии и психологии зрения животных, восходящая к Гельмгольцу и более ранним исследованиям. Известные результаты наводят на мысль о том, что в системах зрения животных используются колоссальные по масштабам вычисления.
Долгосрочная цель исследований по машинному зрению состоит в создании программ, которые могут описывать и понимать наблюдаемый мир. Достижение этой цели является трудной задачей. Проделана большая работа, но не ясно, насколько жизнеспособными окажутся созданные теории.
Системы, в которых знания высшего уровня используются вплоть до процессов прослеживания краев предметов, достаточно хорошо работают в мире кубиков. Эти знания высшего уровня подсказывают, где следует посмотреть наиболее внимательно.
Большой объем вычислительной работы требуется в программах, которые переводят изображения в форму первичных набросков. Первичный набросок необходим для того, чтобы справиться с дополнительными трудностями, возникающими при попытке зрительного восприятия объектов реального мира.
При формировании первичного наброска первый шаг - это фильтрация изображения с помощью профилей типа ступеньки и столика, ориентируемых под несколькими углами. Результирующие положения и высоты пиков затем подвергаются анализу и отображаются в описания признаков, составляемые из нескольких базовых описаний.
Гистограммы свойств первичных набросков содержат информацию, относящуюся к определению текстуры. К этим свойствам относятся интенсивность, краевой контраст, длина краев, их ориентация и расстояние между краями.
Большая часть лучших работ в области зрения дает объяснение тем ограничениям, которые физический мир накладывает на изображения. Наилучшие результаты были получены с использованием информации о том, каким образом реальный мир ограничивает изображения. Представительными примерами в этом отношении являются работа Уолца по сценам и работа Хорна по восстановлению формы, исходя из освещенности.
Градиентное пространство представляет собой такое преобразование реального пространства, которое выделяет ограничения, касающиеся ориентации поверхностей, краев и наблюдаемых интенсивностей. В случае мира кубиков ориентации многих поверхностей могут быть найдены путем растягивания и перемещения треугольника, определяемого краями. В случае же предметов, ограниченных плавными поверхностями, необходимо решить некоторые уравнения в частных производных.
Обобщенные цилиндры представляют собой тела, образованные перемещением некоторых двумерных фигур вдоль линии - оси. Эти фигуры могут постепенно менять свою форму при движении вдоль линии. Линия может быть кривой. Обобщенные цилиндры позволяют описывать большое разнообразие форм, включая объекты из мира кубиков или греческих ваз. Если допускать комбинации нескольких цилиндров, то описанию поддаются сложные предметы реального мира, такие, как телефонный аппарат.
Многое уже сделано, но возникающие проблемы весьма трудны. Многое еще нужно сделать, и только напряженная работа поможет рассеять туман.