"Искусственный интеллект" и вопросы коммуникации (А. Е. Войскунский)
Коммуникация с ЭВМ на естественном языке занимает одно из почетных мест в том списке задач, которые стоят перед специалистами по "искусственному интеллекту". Вся проблематика работы над "искусственным интеллектом", как это часто признается, достаточно тесно соотносится с психологическими исследованиями. Вопросам же коммуникации "повезло" меньше - при их обсуждении необходимость привлечения психологических данных почти не учитывается. Это приводит к некритичному повторению расплывчатых и чрезмерно общих выражений и формулировок, за которыми подчас не стоит конкретное содержание. Между тем работа над системами, допускающими коммуникацию человека с ЭВМ на языке, близком к естественному, не менее других традиционных для "искусственного интеллекта" направлений нуждается в психологических фактах и исследованиях.
Постараемся показать это на частном примере. Имеющиеся в некоторых лингвистических работах указания на многозначность слов и выражений естественного языка нередко расцениваются специалистами в области "искусственного интеллекта" как специально подобранные примеры, призванные продемонстрировать сложность естественного языка. Неоднократно высказывалось мнение, что в реальных деловых беседах между специалистами (и уж тем более - при коммуникации с ЭВМ) неоднозначные слова не употребляются, что технические подъязыки их не содержат. Однако замечено, что для говорящего человека произносимые им слова вполне однозначны [112]. Объясняется это тем, что контекст (очевидный для говорящего) отбирает единственное значение слова, другие же возможные значения попросту не осознаются. Таким образом, следует признать беспочвенными надежды на то, что при коммуникации с ЭВМ люди будут избегать многозначных выражений. С психологической точки зрения несомненно, что человек в позиции говорящего не способен распознавать возможность множественной интерпретации своей речи как на уровне слов, так и на уровне предложений.
Зато многозначность (например, связанная с омонимией) серьезно затрудняет восприятие речи слушающим. Оговоримся, что она может стать очевидной и для говорящего - тогда он поправляется, помещает свою мысль в однозначный контекст. Но для этого говорящий должен во время речевого акта воспринимать ее как бы с позиции слушающего, отделяя произносимый текст от процесса его генерирования. Успешность такого анализа речи, совпадающего по времени с самим процессом говорения, зависит от развитости коммуникативных навыков говорящего, его способностей к совмещению обеих позиций.
Вопрос о различии позиций говорящего и слушающего поднят здесь не случайно. Дело в том, что коммуникативные интересы их не вполне тождественны: говорящий заинтересован в наличии экономного способа порождения текстов, а слушающему важен лишь результат, т. е. сам текст. Каждый естественный язык в равной, по-видимому, степени приспособлен и для говорения, и для слушания, но тем не менее выделение коммуникативных интересов говорящего и слушающего нельзя не признать закономерным. Любой из имеющихся естественных языков представляет собой историческую форму "компромисса" между этими разнонаправленными интересами. Правда, в рамках диалога позиции говорящего или слушающего не фиксированы - участники коммуникативных актов занимают их попеременно. Хотя в каждый данный момент речевую активность проявляет только говорящий, он не может в полной мере реализовать свои коммуникативные интересы, ибо велика вероятность того, что его сообщение не будет понято партнером. Так слушающий регулирует (по звену обратной связи) степень компромисса между разнонаправленными коммуникативными интересами.
Детальное выяснение коммуникативных интересов говорящего и слушающего затруднено в силу того, что они вошли в качестве неотъемлемого элемента в систему языка. Такие попытки делаются лишь в области типологии - при сравнении множества естественных языков могут быть вскрыты некоторые формы компромисса, различно выраженные в разных языках [98].
Наиболее отчетливое проявление коммуникативного интереса слушающего усматривается в требовании дублировать определенные признаки в пределах высказывания. Это могут быть, например, грамматические или акустико-артикуляционные признаки - "кирпичики" языка, понимаемого как система противопоставленных элементов разных уровней. При синтагматическом развертывании высказывания повторение определенного признака (скажем, показателя множественного числа) создает выгодную для слушающего избыточность, облегчающую адекватное понимание текста в условиях неизбежных помех. В теории информации известно, что повторное пропускание значимого элемента через канал связи - отнюдь не самый экономный способ обеспечения безошибочного приема текста на другом конце канала. Существуют более тонкие способы введения избыточности в код. Тем не менее в естественных языках широко распространено такое "примитивное" с точки зрения теории передачи сообщений средство, как механическое дублирование элементов, и это свидетельствует о том, что говорящий согласен ради учета интересов слушающего идти на достаточно неэкономные "жертвы".
Вряд ли есть необходимость останавливаться на очевидном: коммуникативные интересы говорящего и слушающего можно (выделять, лишь абстрагируясь от реальных носителей языка, для которых эти интересы находятся, разумеется, в области неосознаваемого. Однако эти коммуникативные интересы наряду со многими другими факторами оказывают влияние на эволюцию естественных языков. Для носителей же языка последний выступает в синхронном срезе, вне процесса развития, и каждый человек принимает установившийся в системе языка компромисс между разнонаправленными коммуникативными интересами. Лишь в патологии этот компромисс может быть нарушен; и, действительно, в речи больных афазией интересы слушающего часто совсем не учитываются. Тексты, продуцируемые афатиками, иногда сравнивают с "телеграфным стилем": как известно, при отправке телеграмм избыточность текста частично устраняется, и эта экономия, конечно же, не в интересах адресата.
В настоящее время очень мало известно о том, в чем именно состоят коммуникативные интересы говорящего и слушающего. Отсутствуют и экспериментальные исследования, посвященные выяснению того, в какой степени говорящий учитывает в процессе производства речи интересы слушающего. Так, в работах по психологии воздействия [21] лишь упоминается явление фасцинации, а об экспериментальных подходах к ого изучению речи нет. Фасцинация - это сигналы, "настраивающие" слушающего на прием сопутствующей им информации. Фасцинативные сигналы воздействуют на имеющиеся у слушающего фильтры, о которых говорил Н. Винер и через которые должно пройти сообщение, переданное говорящим. Лишь та часть сообщения, которая прошла через эти фильтры, воспринимается слушающим и способна вызвать тот эффект, которого добивался говорящий. Это-то и вынуждает говорящего включать в генерируемый им текст сигналы, создающие благоприятные условия для восприятия слушающим этого текста. Таким образом, фасцинация - это один из ключевых феноменов в сложных взаимоотношениях между говорящим и слушающим, однако исследование его, как уже говорилось, только начинается [22, 54, 76].
Сложившийся в естественных языках компромисс целиком обусловлен тем, что обе позиции - и говорящего, и слушающего - всегда занимали люди, т. е. существа, обладающие (при всех индивидуальных различиях) сходной нервной системой, сходными психологическими возможностями и ограничениями. Стоит ли этот компромисс переносить в область коммуникации между человеком и машиной? А ведь это, по существу, предлагается, когда заходит разговор о том, чтобы "научить" ЭВМ понимать естественный язык. Представляется, что это не лучший путь поисков оптимальных для человека средств коммуникации с ЭВМ. Ведь если в качестве партнера выступает ЭВМ, не обладающая свойственными человеку психологическими особенностями и ограничениями (в качестве примера может быть приведена ограниченность оперативной памяти человека), то человек мог бы в полной мере реализовать свои интересы - как говорящего, так и слушающего. Это может, по нашему мнению, привести к разработке средств коммуникации, специально предназначенных для человека в позиции говорящего или в позиции слушающего, и средства эти могут оказаться различными.
В ходе диалога с ЭВМ человек оказывается и говорящим, и слушающим. Оговоримся, что имеется в виду отнюдь не только звуковая коммуникация с ЭВМ, но и более стандартная письменная, а термины "говорящий" и "слушающий" - это в данном случае обобщенные наименования позиций соответственно передатчика и приемника сообщений. Таким образом, в дальнейшем эти термины будут употребляться вне контекста устного общения между людьми.
Исследования таких средств коммуникации с ЭВМ, которые были бы естественными для человека (говорящего или слушающего),- вот реальный вклад, который могут внести психологи в такую область "искусственного интеллекта", как разработка систем коммуникации с ЭВМ на языке, близком к естественному. К сожалению, работа эта только начинается.
Если задаться целью сразу же определить естественность для человека того или иного языка коммуникации с ЭВМ, то интерпретация результатов будет затруднена, ибо придется учитывать очень большое число параметров. Поэтому удобнее начать исследование отдельных фрагментов языка (например, синтаксических конструкций), которые в дальнейшем можно будет объединить в единый язык коммуникации с ЭВМ. Анализ естественности таких фрагментов для человека следует проводить и тогда, когда человек занимает позицию говорящего, и тогда, когда он занимает позицию слушающего. Последняя пока не привлекла внимание специалистов, в силу чего остановимся на первой.
В работах по математической лингвистике большое внимание уделяется действующему в естественных языках механизму самогнездования предложений. Он состоит в разрыве некоторого предложения на две части и "вкладывании" между ними другого предложения. Получившуюся фразу можно, в свою очередь, разорвать и вставить в нее новое предложение. С точки зрения грамматики число таких самогнездований не ограничено. На самом же деле существует некоторый предел, как это вытекает из выдвинутой американским математиком В. Ингве гипотезы "глубины" [47].
Начиная фразу па естественном языке, мы должны запоминать определенную грамматическую информацию и пользоваться ею при завершении этой фразы. Иначе высказывание получится грамматически неправильным. Можно сказать вслед за Ингве, что мы храпим в памяти "обязательства" правильно завершить начатое предложение. По гипотезе Ингве, число таких промежуточных сведений, сохраняемых при построении фразы в оперативней памяти, не может превышать числа 7±2. Количество таких запоминаемых единиц, Каждая из которых отражает определенный шаг развертывания фразы, было названо "глубиной" фразы.
Самогнездование - это один из очевидных способов увеличения "глубины" фразы. Ограниченность психологических возможностей человека должна сказываться в любой коммуникации, в том числе и с ЭВМ. Предположение о том, что для человека, передающего сообщение ЭВМ (т. е. занимающего позицию говорящего), гнездующиеся конструкции окажутся сложными и неестественными, было подвергнуто экспериментальной проверке.
Проверка проводилась на материале двух типов условных выражений, получивших широкое распространение в ряде языков программирования. Были разработаны два микроязыка: язык А содержал гнездующуюся конструкцию "если... то... иначе...", а язык Б - конструкцию с переходом к метке "если... переход,..". Задачи выбирались так, что для решения требовалась последовательная проверка ряда условий. При этом программы решения задач, составленные на микроязыке А, неизбежно должны были содержать гнездующиеся конструкции, а в программах на микроязыке Б это было невозможно. Эксперимент подробно описан в книге "Искусственный интеллект и психология" [50].
Проведенный эксперимент показал, что для испытуемых более предпочтительным является микроязык Б. Однако в аналогичном эксперименте [154] результаты оказались прямо противоположными: более легкой была признана конструкция с самогнездованием. Возможно, одна из причин расхождения экспериментальных результатов - это различие между предлагавшимися испытуемым задачами.
Делать окончательные выводы еще рано. Тем не менее нельзя исключить вероятность того, что для человека в позиции говорящего конструкции естественного языка - не самое удобное средство коммуникации с ЭВМ. Подтверждение данного допущения требует многочисленных и кропотливых экспериментальных исследований по сравнению отдельных языковых фрагментов. Методика подобной работы достаточно подробно описана в статье В. М. Глушкова и Б. Б. Тимофеева [35].
Лишь после проведения исследований такого рода может быть дана оценка высказанному нами ранее [50] мнению, согласно которому близость языка взаимодействия человека с ЭВМ к естественному языку не означает естественности первого для пользователя. Следует, однако, отметить, что в последнее время научной литературе все чаще выдвигается и обосновывается нелогичная точка зрения. Так, М. Л. Смульсон [87] разводит лингвистическую и психологическую естественность языка взаимодействия человека с ЭВМ. Дж. Мойн [143] также утверждает, то близость последнего к естественному языку отнюдь не означает (и даже противоречит) легкости ого изучения пользователем, естественности его для человека. Язык, наилучшим образом отвечающий интересам пользователя (активный язык, по терминологии М. Халперна [129]), Мойн называет "простым естественным языком". Он противопоставляет ему две тенденции: разработку "псевдоестественных языков" и языков "типа естественного" (различающихся принципами организации языковых процессоров).
Таким образом, высказанная точка зрения находит прямое подтверждение в работах указанных авторов, что позволяет считать рассмотренные проблемы актуальными и подлежащими развернутому экспериментально-психологическому изучению.
Однако до выводов еще и потому далеко, что нахождение удобных для человека в позиции говорящего речевых средств коммуникации с ЭВМ - это только полдела. Исследования, проведенные на материале искусственных языков, могут оказать существенную помощь и в изучении человеческого общения, в частности, пролить свет на проблему коммуникативных интересов говорящего и слушающего, природу компромисса между ними. Таким образом, психологическое исследование как бы замкнется. Будучи начато с целью внести "человеческий фактор" в коммуникацию человека с ЭВМ (при этом учитываются особенности общения между людьми), оно обратится к решению проблем, касающихся человеческого общения (при этом будут использованы данные о коммуникации человека с ЭВМ на искусственных языках). Если такую программу исследований действительно удастся воплотить в жизнь, то она послужит своего рода уникальным примером того, как исследовательская работа в области "искусственного интеллекта" будет способствовать решению собственно психологических (или психолингвистических) проблем.