Возможности моделирования образного и понятийного мышления на ЭВМ (Ю. В. Орфеев)
При обсуждении философских аспектов моделирования мышления исследователями уделяется недостаточно внимания проблеме моделируемости образного мышления на ЭВМ, в то время как ограниченность методов информационного моделирования (дискретного по самой своей природе) в этих вопросах проявляется более ярко, нежели при информационном моделировании процесса решения логических задач, в которых наглядные образы могут не играть существенной роли при поиске решения.
С точки зрения генетической психологии структуры понятийного мышления, интерпсихического по своей природе, возникают в онтогенезе ребенка на базе уже развитых способностей оперирования образами окружающих предметов. Даже в раннем детском возрасте ребенок способен распознавать лица окружающих его людей, пищу, игрушки. У аномально развитых детей, например дебилов, способность оперировать образами не зависит от уровня его интеллектуального развития. То же самое можно сказать и о животных, которые способны активно использовать образы окружающей среды для организации своего поведения, в то время как понятийное мышление у них вообще отсутствует.
Образное мышление является особой формой проявления разумного поведения, как и понятийное, развиваемое человеком в процессе овладевания знаковой деятельностью. Интересно отметить, что современная письменность и предшествовавшее ей идеографическое письмо развились из символов - картин. Некоторые иероглифические символы еще до сих пор не утратили ясного изобразительного сходства с предметом, который они обозначают.
В мыслительной деятельности человека образные и понятийные компоненты тесно связаны и активно взаимодействуют между собой. В свое время С. Л. Рубинштейн по этому поводу писал, что, будучи различными уровнями или ступенями познания, образное и абстрактно-теоретическое мышление являются в известном смысле различными сторонами единого процесса и равно адекватными способами познания различных сторон объективной действительности [80].
Если рассматривать только мыслительную деятельность человека в сфере точных наук, где естественно велика доля абстрактно-теоретического мышления, то даже здесь на начальном этапе творческого процесса образы играют решающую роль*. А. Эйнштейн по этому поводу писал в своей творческой автобиографии следующее: "Для меня не подлежит сомнению, что наше мышление протекает в основном минуя символы (слова) и к тому же бессознательно. Если бы это было иначе, то почему нам следует иногда "удивляться", притом, совершенно спонтанно, тому или иному переживанию (Erlebnis)? "Акт удивления", по-видимому, наступает тогда, когда восприятие вступает в конфликт с установившимся в нас миром понятий. В тех случаях, когда такой конфликт переживается остро и интенсивно, он, в свою очередь, оказывает сильное влияние на наш умственный мир" [109].
* (В этой связи интересно привести высказывание А. И. Мещерякова: "...реальное мышление никогда не сводится к оперированию символами, каковыми в известном смысле являются жесты и слова, а всегда предполагает оперирование образами предметов и действий" [60].)
Как дискурсивное, так и образное мышление имеют свои сферы и границы эффективности. Некоторый класс задач легче решить, опираясь на наглядные модели, а другой класс задач этими моделями решается неэффективно, и в этом случае дискурсивное мышление имеет неоспоримые преимущества. Образное мышление может приводить к грубым ошибкам, если решаемая задача выходит за пределы непосредственно воспринимаемой последовательности событий. В тех же случаях, когда решение задачи вытекает из самой организации "зрительного поля", если применить терминологию гештальтпсихологов, то наглядно-образное мышление имеет бесспорные преимущества перед дискурсивным мышлением.
Начиная с 50-х годов в области кибернетики предпринимались энергичные усилия по обучению машин распознаванию зрительных образов. Сформировалось по существу целое направление в кибернетике - так называемое распознавание образов*. Однако фактически задачи, которые решаются методами "распознавания образов", не эквивалентны проблемам восприятия образов. Главная задача, решаемая вычислительной машиной при распознавании образов, состоит в отнесении определенного объекта, характеризуемого набором признаков, к какому-либо классу, т. е. решается задача классификации, в то время как психологическая проблема восприятия предмета в результате активных предметных действий с ним методами кибернетического распознавания образов фактически не решается**. С психологической точки зрения процессу классификации объектов предшествует по крайней мере его восприятие и распознавание [18]. Действительно, для того чтобы распознать какой-либо минерал, мы должны воспринять его как предмет. Манипулируя этим предметом, можно установить, например, что перед нами лежит гранит. И только узнав предмет, мы можем его идентифицировать. Конечно, в определенных условиях человеческой деятельности процессы восприятия могут быть редуцированы к процессу идентификации***. Например, в крупной библиотеке только шифр книги является информацией о ее местоположении, и библиотечные работники могут не обращать внимания ни на название книги, ни на ее внешний вид****.
* (Принятый в отечественной литературе по кибернетике термин "распознавание образов", который, по-видимому, является калькой с английского выражения "pattern recognition", было бы целесообразным заменить термином "классификация образцов", так как последний термин лучше отражает существо решаемой на ЭВМ задачи, к тому же английское слово "pattern" может переводиться и как "образец".)
** ("Для формирования образа вещи, отражающего ее объективные свойства,- пишет Л. И. Мещеряков,- индивиду необходимо по отношению к ней осуществлять практическое действие. Простое восприятие вещи без практического воздействия на нее не даст возможности глубоко проникнуть и его сущность" [60].)
*** (Задержание преступника может быть осуществлено на основании как словесного портрета, так и очной ставки. В первом случае необходим перечень признаков преступника, а при узнавании на очной станке этот перечень не нужен. Идентификация посредством словесного портрета во многом напоминает принципы распознавания, реализованные в существующих программах ЭВМ, в то время как идентификация на основе очной ставки пока что не доступна ЭВМ.)
**** (В этой связи интересно отметить, что в древнеиндийской философии (философия Ньяя) различались три способа восприятия. Первый способ - нирвакальпака - означал познание простого существования вещи без отчетливого представления о поп и ее характеристики. Например, погрузившись в свои мысли, вы можете искупаться в ванне, ни разу не подумав о воде, которой вы пользовались, именно как о воде. Тем не менее нельзя сказать, что вы не воспринимали воду в процессе купания. Второй способ восприятия заключается в том, что объект рассматривается как вещь особого рода, этот способ называется савикальпака. Так, например, глядя на апельсин, я высказываю про себя суждение: "Это апельсин". В этом случае я не только узнаю о его существовании как такового, но также отчетливо понимаю, что он существует, по крайней мере в моем восприятии. Третий способ - пратьябхиджня - означает узнавание объекта как чего-то известного нам. Например: "Это, должно быть, тот же самый человек, который толкнул меня вчера" [102].)
В известных сегодня методах распознавания образов используется много всевозможного рода остроумных приемов для отделения признаков одного образа от другого, например гипотеза компактности, проектирование признаков на подпространство. Однако все эти методы так или иначе предполагают возможность выделения определенного набора признаков и соотнесения их с наперед заданным фиксированным списком признаков или эталоном*.
* (В европейской психологии эта классификация может соответствовать таким понятиям, как восприятие, распознавание и идентификация. Всю сложность решения проблемы распознавания образов на современных ЭВМ из кибернетиков наиболее четко осознал К. Шеннон, который сказал: "...эффективные машины для таких задач, как распознавание образов, перевод с одного языка на другой и т. п., могут потребовать другого типа вычислительных машин, чем мы имеем сегодня. Мне кажется, что это будут вычислительные машины, которые будут выполнять естественные операции с образами, понятиями и смутными аналогиями, а не последовательные операции с десятиразрядными числами" (выступление К. Шеннона на дискуссии "Что будут делать вычислительные машины?" опубликовано в сборнике [122]). Однако машин, которые могли бы оперировать "смутными аналогиями", еще нет и пока никто не знает, как они должны быть организованы.)
Различие между распознаванием человека и поведением ЭВМ при "распознавании образов" носит принципиальный характер. Такие простые свойства внешних предметов, как прямизна, связность и т. п., не могут быть заданы машине непосредственно, а должны воспроизводиться через сложную систему уравнений, которые обеспечивают проверку координат соответствующих точек, чтобы определить, имеет ли машина перед собой прямую или кривую линию. Машина не может предпочесть одну комбинацию фигур другой, если нет заранее заданных признаков предпочтения. В то же время человек при выборе той или иной комбинации фигур обычно руководствуется невербализуемыми эстетическими критериями. ЭВМ может делать то же самое только в тех случаях, когда способы классификации четко описаны.
Использование на практике кибернетических способов опознания осложняется тем, что, во-первых, зачастую трудно сказать, в чем именно заключаются существенные признаки предмета, а во-вторых, нет оснований для допущения, что признаки сходства между А и В и между В и С будут теми же, что и между А и С. Между А и С может не быть никакого заметного сходства, кроме того, что они похожи на В. Отнесение предмета к тому или иному классу определяется не его свойствами, а целями классификации.
Чтобы глубже рассмотреть этот круг вопросов, необходимо обратиться к существующим психологическим теориям восприятия. В психологии восприятия обычно проводится различие между сукцессивным и симультанным узнаванием. Для того чтобы показать принципиальное различие в их механизмах, приведем несколько примеров*.
* ("Симультанное узнавание,- пишет М. С. Шехтер,- включает в себя интегрирование нескольких признаков (точнее, соответствующей сенсорной информации) в одну неразлагаемую единицу, в результате чего объект оценивается по одному перцептивному признаку, а не по нескольким соответствующим разным свойствам объектов" [107].)
Любой грамотный человек способен распознать рукописные буквы, и в то же время он не может идентифицировать признаки, на основе которых производится это опознание. Именно потому, что для рукописных букв невозможно выделить необходимый и достаточный список признаков, современные ЭВМ могут надежно распознавать только в той или иной мере формализованный шрифт, а не рукописный. Были затрачены большие усилия на то, чтобы машина была способна воспринимать любой рукописный текст, однако существенного прогресса в этом пока не достигнуто.
Трудность решения данной задачи состоит, по-видимому, не только в том, что симультанное узнавание не может быть заменено концептуальным при восприятии рукописных букв, но и в том, что в распознавании графических элементов рукописных букв в обычных условиях распознавание опирается на контекст, т. е. в нем участвуют близлежащие буквы слова, а в ряде случаев учитывается и весь контекст высказывания. Например, слово "Мишка", написанное от руки, может быть прочитано и как "Мишка" и как "Шишка" - все зависит от более широкого контекста, который бессознательно учитывается человеком.
То же самое можно сказать и про опознание графических элементов рукописных цифр вида: 10%. Эти графические элементы можно распознать и как число 10010 и как 10% и как три буквы О, разделенные палочками, и т. п.
Таким образом, при распознании рукописного текста нет минимальных графических элементов (своего рода кирпичиков, из которых слагается текст), на которые можно опереться. Правильное распознавание зависит от интерпретации "кирпичиков" на каждом уровне лингвистического описания (буква, фонема слова, предложение, высказывание).
С другой стороны, если цивилизованному человеку необходимо отличить 20-этажный дом от 21-этажного дома одинаковой высоты или отличить многоугольник с 20 сторонами от многоугольника с 19 сторонами, то в этом случае необходимо наличие четких признаков того или иного образа и симультанное восприятие в этих случаях неэффективно. При решении подобного рода задач ЭВМ могут превосходить человека, если число признаков, необходимых для идентификации, достаточно велико.
Различие между симультанным и сукцессивным узнаванием носит принципиальный характер. Многочисленные психологические исследования процессов восприятия показывают, что симультанное восприятие - это не свернутое быстропротекаемое сукцессивное восприятие, а психический процесс особого вида, основывающийся на учете "внешнего вида" фигуры, "формы" всей фигуры в целом, восприятии контекста, фона и т. п. Иными словами, это - распознание, основанное на целостных признаках, благодаря которым восприятие целого опережает восприятие частей, т. е. части определяются только после восприятия целого.
Психология восприятия рассматривает симультанное узнавание как деятельность, совершаемую без последовательного анализа воспринимаемого объекта. Сукцессивное узнавание в процессе тренировки (обучения) переходит в симультанное, но для такого перехода необходимо наличие идеального плана в сознании человека, который и является специфически человеческой формой отражения действительности*.
* (В психопатологии хорошо известны агнозии, связанные с нарушением симультанного узнавания; в этом случае узнавание предметов может происходить только при опоре на сукцессивное узнавание.)
С проблемой симультанного восприятия тесно связан вопрос о наличии в восприятии человека неосознанного отражения объектов окружающей действительности, экспериментальным подтверждением которого могут служить опыты по субсенсорному восприятию. Хорошо известны эксперименты такого, например, рода: испытуемому предъявляют последовательно наборы бессмысленных слогов, предъявление некоторых из них сопровождается ударом испытуемого электрическим током. В процессе дальнейших экспериментов у испытуемого вырабатывается рефлекс: при предъявлении того или иного слога у него возникает предчувствие удара электрического тока. При этом испытуемый не может объяснить (вербализовать) признаки слога, предъявление которого вызвало это предчувствие [146].
Хорошим примером неосознанного отражения может также служить всем известный стереоскопический эффект, который возникает при рассматривании через специальные очки двух почти тождественных изображений. Наличие подобного отражения наблюдается и при слуховых и тактильных раздражителях [33].
Таким образом, в восприятии объектов и их отношений определенную роль играет неосознанное отражение, которое проявляется в симультанном и гештальтном характере восприятия. Как известно, ЭВМ может оперировать только формализованным знанием об объектах при их распознавании. Именно наличие неосознанного, неформализуемого знания о внешних объектах является главным препятствием прогрессу в области распознавания образов посредством ЭВМ.
Кроме деления процессов восприятия на симультанные и сукцессивные (концептуальные), в психологии восприятия иногда проводится также различие между когнитивными и оперативными образами. Когнитивные образы - это своего рода склады, кладовые, в которых сосредоточена вся доступная субъекту информация об объекте.
Оперативными называют образы, возникающие в процессе выполнения практических действий с объектами, направленных специально на решение определенных задач.
Хотя кибернетики достигли определенных успехов в создании методов распознавания когнитивных образов, проблема формирования у современных ЭВМ оперативных образов не разрешима в рамках данной методологии. Всю сложность формирования оперативного образа показывают данные феноменологической психологии о подвижности границ между телом субъекта и окружающим его "внешним миром". Поэтому части собственного тела иногда могут восприниматься как "внутренний", иногда как "внешний мир" в зависимости от условий восприятия.
Например, при остригании ногтей рука, которая проводит эту процедуру, принадлежит к "внутреннему миру", а другая - к "внешнему миру". В других случаях наоборот: часть того, что мы обычно понимаем как принадлежащее к "внешнему миру", оказывается включенным во "внутренний мир". Например, каждый, кто ездит на автомобиле, знает, что во время езды "внешний мир" для водителя начинается по ту сторону стен кабины. Те же самые эффекты наблюдаются и при управлении самолетом. В оперативном образе, следовательно, возможна подвижность границ субъект - объект.
Подвижность границы субъект-объект лежит также в основе предметности нашего восприятия. Действительно, с точки зрения кибернетической теории распознавания образов трудно объяснить предметность, объективируемость образов.
По кибернетической концепции зрительного восприятия, распознаваемый предмет должен вначале находиться где-то внутри субъекта, а уже потом, посредством акта рефлексии или каких-либо других механизмов, выноситься вовне и соотноситься с реальностью. Подобного рода рецепторная концепция восприятия экспериментально опровергается всем развитием экспериментальной психологии.
Подвижность граней субъект-объект позволяет дать более глубокое объяснение предметности зрительного восприятия,- на которую уже давно обращала внимание марксистская философия: "...световое воздействие вещи на зрительный нерв воспринимается не как субъективное раздражение самого зрительного нерва, а как объективная форма вещи, находящейся вне глаз" [1, с. 82].
Чтобы понять эту специфику, необходимо обратиться к способу использования трости (зонда) при нащупывании дороги в темноте. Вначале, продвигаясь в темноте с помощью трости, вы будете ощущать толчки в ладонь и пальцы рук, когда трость будет соприкасаться с каким-либо предметом, лежащим на пути. По по мере накопления опыта (как это бывает у слепых) эти толчки будут трансформироваться в ощущение каких-то предметов вне нас. Кроме того, эти субсидарные ощущения, как называет их М. Поляный, будучи интегрированы нашим телом, приобретут для нас определенный смысл как сигналы предметов, лежащих на нашем пути [149].
Нечто подобное происходит и при зрительном восприятии, в основе которого, как известно, лежат интериоризованные сенсомоторные схемы локомоций и манипулирования с предметами. В зрительном восприятии роль зонда (щупала) выполняет луч света, благодаря которому смещаются паши ощущения, создавая объективируемость, предметность воспринимаемых образов.
Такая интерпретация предметности зрительных образов восходит к И. М. Сеченову, который писал по этому поводу: "В этом смысле акт смотрения можно уподобить выпусканию из тела щупал, могущих очень сильно удлиняться и укорачиваться с тем, чтобы свободные концы их, сходясь друг с другом, прикасались к рассматриваемым в данное мгновение предметам. Зрительные I оси представляли бы тогда без всякой натяжки такие сократительные щупалы" [84, с. 521].
Кроме этих фактов, которые обычно не принимаются во внимание при кибернетическом моделировании восприятия, существуют также факты, указывающие на тесную связь восприятия с эмоциями и чувственным ожиданием воспринимаемого объекта.
Рассмотренные выше примеры показывают, насколько далеки принципы, используемые в автоматическом распознании образов, от реальных процессов восприятия человека. Тем не менее кибернетиками был предложен ряд важных технических приемов в распознавании образов, и этот факт нельзя забывать. Существующая практика распознавания образов пошла по пути совместного решения этих задач человеком и машиной в режиме "диалога". В этих условиях уникальные способности человека не исключаются из распознавания, а наоборот, технические средства дополняют и усиливают эти способности. На этом пути удалось добиться ощутимых практических результатов.
Проблема распознавания образов на ЭВМ ставится в кибернетической литературе и как проблема автоматического формирования понятий, если объекты, подлежащие классификации, не могут быть наглядно интерпретированы. Типичным примером попыток применить ЭВМ для формирования понятий могут служить работы Э. Ханта [99] и Р. Бенерджи [18]. Но и здесь успех в начальной фазе использования методов сменяется разочарованием, как только требуется применить их к формированию понятий в более сложных ситуациях.
Хант следующим образом интерпретирует процесс формирования понятий:
объектами называются те реальные элементы, которые может наблюдать "испытуемый" (человек или искусственная система формирования понятий). Множество всех объектов составляет генеральную совокупность;
объекты можно различить по значениям характеризующих их признаков. Таким образом, каждый признак представляет собой степень свободы качественных различий объектов;
описание объекта - это указание его статуса, определяемое исходя из наблюдаемых признаков;
множество количественных характеристик признаков, которые можно считать эквивалентными, представляется некоторым значением;
пространство описания - множество всех возможных описаний объектов.
Если рассматривать с философской точки зрения методы формирования понятий, используемые в "машинном мышлении", то фактически эти методы восходят к тому чисто эмпирическому пониманию процесса абстракции, который мы находим в работах Локка и Милля. Теоретический аспект формирования понятий был в философии поставлен Платоном, который уже ясно осознавал всю сложность этой проблематики.
Как мы идентифицируем предметы, относим их к тому или иному классу, в то время как каждый отдельный предмет отличается друг от друга? В диалоге с жрецом Евтифроном Сократ требует дать четкое и недвусмысленное определение понятия благочестия. Евтифрон все время пытается уточнить определение благочестия, но каждый раз предлагаемое Евтифроном определение критикуется и опровергается Сократом, так как все определения Евтифрона явлются только "акциденциями" - модусами идеи благочестия, в то время как Сократ требует от Евтифрона дать ему саму идею благочестия [68]. Борьба номинализма и реализма в средневековой философии также является отражением тех сложных философских проблем, с решением которых связан теоретический анализ формирования понятий человеком.
Тот кризис, который испытывает сейчас кибернетический подход к формированию понятий на ЭВМ, был в известном смысле предвосхищен критикой слабых сторон эмпирической теории абстракции в работах Канта, Фихте, Гегеля, Гуссерля. Как известно, Гуссерль в своих работах подверг тщательной критике эмпирическую теорию абстракции, согласно которой общее возникает в сознании субъекта на основе сравнения сходных признаков.
Гуссерль считал, что для усмотрения общего в предметах нужен особый интенциональный акт, при котором сознание должно быть направлено не на конкретные предметы, а на саму идею, посредством которой генерализуются окружающие человека предметы. Гуссерль считал, что при распознавании объектов человек вносит глобальное значение (ноэму) при интерпретации своих чувственных данных [14]. Иными словами, распознавание образов и формирование понятий невозможно без наличия определенного идеального плана.
Критика упрощенного понимания природы абстракции и разъяснение таящейся в этом опасности велись также Л. Витгенштейном и другими представителями лингвистической философии. Л. Витгенштейн выдвинул концепцию "фамильных сходств" как альтернативу традиционной теории абстракции. Витгенштейн утверждает, что идея характерных черт лица члена семьи может быть передана путем показа "фамильных портретов" (цитируется по [19]). С точки зрения Витгенштейна, человек способен узнать члена семьи, не перечисляя списка признаков, па основе которых он это сделал.
Наиболее глубоко проблема образования понятий решается в марксистской философии, на основе диалектики единичного, особенного и общего. Четко сформулирована проблема всеобщего Э. В. Ильенковым: "То радикально-материалистическое переосмысливание достижений гегелевской логики (диалектики), которое осуществили Маркс, Энгельс и Ленин, связано с утверждением объективной реальности всеобщего, но отнюдь не в духе Платона и Гегеля. А в смысле закономерной связи материальных явлений, в смысле закона их сцепления в составе некоторого целого, в составе саморазвивающейся тотальности, все компоненты которой "родственны" по существу дела не в силу того, что все они обладают одним и тем же одинаковым признаком, а в силу единства генезиса..." [46, с. 256].
Анализ эмпирической теории абстракции, в которой понятия рассматриваются как дизъюнктивно-конъюнктивная комбинация признаков объектов, была подвергнута резкой критике В. И. Лениным в связи с дискуссией о профсоюзах, развернувшейся в начале 20-х годов в партии. В. И. Ленин писал: "Логика формальная, которой ограничиваются в школах (и должны ограничиваться - с поправками - для низших классов школы), берет формальные определения, руководясь тем, что наиболее обычно или что чаще всего бросается в глаза, и ограничивается этим. Если при этом берутся два или более различных определения и соединяются вместе совершенно случайно (и стеклянный цилиндр и инструмент для питья), то мы получаем эклектическое определение, указывающее на разные стороны предмета и только.
Логика диалектическая требует того, чтобы мы шли дальше. Чтобы действительно знать предмет, надо охватить, изучить все его стороны, все связи и "опосредствования"" [4, с. 289-290].
Из вышеизложенного видно, что в "машинном мышлении" понятие рассматривается только как комбинация признаков, выделенных из совокупности рассматриваемых объектов, т. е. находится на уровне эмпирической теории абстракции. В то же время проблема формирования теоретических понятий не решается в "машинном мышлении". Отсюда становится понятным, что процедуры формирования понятий, используемые в "машинном мышлении", имеют пока что ограниченную сферу практического применения и дальнейший прогресс в этой сфере может быть обеспечен только на путях "диалогового" взаимодействия человека с ЭВМ.