НОВОСТИ   БИБЛИОТЕКА   ЮМОР   КАРТА САЙТА   ССЫЛКИ   О САЙТЕ  




предыдущая главасодержаниеследующая глава

Критерий Тьюринга, мышление и общение (А. Е. Войскунский)

Попытки сравнить человека с машиной, объяснить его "устройство" и поведение по аналогии с принципами работы технических систем и механизмов имеют давнюю историю. Достаточно вспомнить, что идея эта очень интересовала столь выдающихся мыслителей, как Лейбниц, Ламетри, Декарт. Обсуждалась и теоретическая возможность создания искусственных устройств, неотличимых от человека (эта тема даже представлена в городском фольклоре, например легендами о Франкенштейне, о Големе). Философы были согласны с тем, что для этого недостаточно было бы моделировать функции тела,- нет, такое устройство непременно должно было быть способно выполнять интеллектуальные действия. Подобные рассуждения поневоле оставались абстрактными, ибо среди машин не было сколько-нибудь перспективных "кандидатов" на роль интеллектуальных созданий. Если же таковые находились, то они неизменно оказывались мистификацией (вроде "шахматного автомата" Кемпелена).

В середине XX в. такие машины появились. Всем памятны принесенные кибернетикой жгучие споры о том, может ли машина мыслить. Появление кибернетических систем действительно знаменует собой новый этап в эволюции машин. Будучи информационными машинами, они вторгаются в те области, которые традиционно считались интеллектуальными. Одно время и впрямь могло показаться, что вот-вот будет запрограммирована подлинно мыслящая машина. В 70-х годах становится ясно, что "кибернетический бум" к этому не привел, да и не мог привести. В 1950 г. в этом еще позволительно было сомневаться. Именно тогда вышла в свет статья известного английского математика А. Тьюринга [95]. Статье этой суждено было получить широкую известность.

"Я собираюсь рассмотреть вопрос: "Могут ли машины мыслить?"- писал Тьюринг.- Но для этого нужно сначала определить смысл терминов "машина" и "мыслить"" [95, с. 19]. Имеющиеся в философской литературе определения его не удовлетворили, ибо непосредственно "примерить" их к вычислительной машине не представлялось возможным. Почти через двадцать лет один из первых советских кибернетиков И. А. Полетаев вспоминал, что "споры о "машине, которая мыслит", остановились примерно на том этапе, где кибернетики заявили: "Определите, что такое мышление, и мы это быстренько запрограммируем!", на что сторонники "душевности" ответили: "Мышление есть высшая форма отражения действительности". Запрограммировать это определение, насколько нам известно, не удалось" [69, с. 10-11].

Тьюринг нашел выход в построении операциональной процедуры, позволяющей сравнивать человеческое и машинное мышление. Он воспользовался принципом "черного ящика", особенно модным на заре кибернетики. Будучи не в силах познать то, что "внутри" человека, ученые научились выводить определенные заключения, сопоставляя входные и выходные сигналы. Такова была, например, предложенная К. Шенноном оригинальная методика угадывания, с помощью которой удалось установить статистические закономерности письменного текста. Как и К. Шеннон, да и многие другие пионеры кибернетики, Тьюринг искал способ воспользоваться знаниями и мыслительными способностями человека, не сделав ни шагу к их познанию.

Для этого Тьюринг разработал "игру в имитацию". Играют в нее трое: мужчина (А), женщина (В) и задающее вопросы лицо любого пола (С). Задача последнего - вступив в коммуникацию с А и В, выяснить, кто из них мужчина, а кто женщина. При этом С не видит своих партнеров и общается с ними письменно, например посредством телеграфного аппарата. Цель игры для А - Побудить С прийти к ошибочному выводу, а для В - помочь С.

Описав правила "игры в имитацию", Тьюринг продолжает: "Поставим теперь вопрос: "Что произойдет, если в этой игре вместо А будет участвовать машина?" Будет ли в этом случае задающий вопросы ошибаться столь же часто, как и в игре, где участниками являются только люди? Эти вопросы и заменят наш первоначальный вопрос "могут ли машины мыслить?"" [95, с. 20].

Такова разработанная Тьюрингом процедура выяснения возможностей вычислительных машин к мышлению. Едва ли он предполагал применять ее в ближайшее время. С этим, как нам кажется, связаны недостаточная разработанность правил "игры в имитацию" (об этом будет говориться ниже) и некоторые случайные моменты, внесенные в процедуру самим Тьюрингом. Определение пола корреспондента по его письменным высказываниям, к примеру,- не самое обоснованное место в "игре в имитацию". К этому трудно отнестись иначе как к произвольному выбору критерия. Вместе с тем он представляется довольно удачным. В самом деле, ведь ни алгоритмов, ни даже сколько-нибудь единообразных навыков определения пола партнера по его письменным репликам скорее всего не существует. В силу этого от игрока С можно ожидать любых непредсказуемых заранее вопросов, и машина должна быть к ним готова. Таким образом, "игра в имитацию" полностью обеспечивает непредсказуемость ситуаций, в которых может оказаться машина, и требует от нес определенной универсальности.

Как бы то ни было, мы рискнем высказать убеждение, что "игра в имитацию" была воспринята большинством читателей статьи Тьюринга освобожденной от случайных, произвольно внесенных в правила игры условий. Как нам кажется, суть предложения Тьюринга была интерпретирована следующим образом: если человек, вступая в коммуникацию, не заметит, что его партнер- машина, а не человек, то такую машину можно считать мыслящей. Представляется, что это утверждение, передающее суть процедуры, можно наряду с "игрой в имитацию" считать критерием (или тестом) Тьюринга. Такую интерпретацию подтверждает анализ современных научных изданий.

Этот критерий был встречен с определенным энтузиазмом. Останавливаться на отдельных проявлениях этого энтузиазма ни к чему, однако стоит вспомнить, что критерий Тьюринга и сейчас принадлежит научному обиходу (только этим, кстати говоря, и объясняется публикация данного материала). Тут следует сделать оговорку. Молодые исследователи в области "искусственного интеллекта" в настоящее время редко задумываются о машинном мышлении, критерии Тьюринга и тому подобной "философии". Однако для некоторых, менее прагматически настроенных специалистов критерий Тьюринга - часть их теоретического багажа.

Постараемся обосновать это на примерах. "Тьюринг потратил много труда па то, чтобы преодолеть глубоко укоренившиеся предрассудки о якобы низшем положении технических систем и каталогизировал эти предрассудки. Сколько бумаги можно было бы сэкономить сегодня, если бы многие почтенные авторы, пишущие на тему "машины не могут мыслить", внимательно прочитали работы Тьюринга!"- восклицает К. Штейнбух [108, с. 438]. Г. Гелернтер связал перспективу преодоления критерия Тьюринга с машинным воплощением вскрытых Пойа эвристических приемов: "Машина, которая работала бы на основе полного набора принципов, указанных Пойа, оказалась бы превосходным устройством для решения математических задач и знаменовала бы собой большой шаг вперед на пути удовлетворения условий Тьюринга для машины, успешно справляющейся с "игрой в имитацию". Однако создание такой машины - дело неопределенного будущего..." [32, с. 146].

Подробно описывает процедуру Тьюринга У. Рейтман. Он говорит о возможности преодоления критерия одной из будущих систем, отвечающих на вопросы, заданные на естественном языке. Предложенная Б. Рафаэлем вопросно-ответная система, по мнению У. Рейтмана, "ясно указывает направление разработки новых программ, которые были бы способны играть в простую игру Тьюринга, описанную в его программной статье, и выигрывать ее" [78, с. 318]. В отличие от него М. Адлер - автор многочисленных книг и директор института философских исследований в Чикаго - не решается на такой прогноз. Это не мешает ему принять [114] точку зрения Тьюринга. Из эволюционных и антропологических данных М. Адлер выводит, что фундаментальнейший признак человека разумного, характеризующий его в первую очередь и отделяющий от всех иных существ,- это обладание членораздельной речью. В силу этого-то "игра в имитацию" так импонирует М. Адлеру: ведь она требует владения языком и тем самым направлена на основное, "бьет" прямо в цель [132].

Подобное отношение к тесту Тьюринга характерно и для современного состояния работ в области "искусственного интеллекта". Так, Е. А. Александров не только в высшей степени сочувственно цитирует Тьюринга, но и делает вывод: "Такая постановка реализации "игры в имитацию" на редкость плодотворна и в силу своей конструктивности сводит на нет появляющиеся от случая к случаю возражения" [6, с. 41]. Для эвристического подхода к проблеме "искусственного интеллекта", как считает Е. А. Александров, критерий Тьюринга "является методологической основой".

Не прошел мимо критерия Тьюринга и М. Арбиб: он считает, что "машине гораздо труднее выдержать "экзамен" Тьюринга, чем вести себя разумным образом" [10, с. 126]. И поэтому, замечает М. Арбиб, "его (Тьюринга.- А. В.) цель состояла не в том, чтобы найти необходимые условия разумности, а в том, чтобы придумать такой экзамен, сдав который вычислительная машина убедила бы самых закоренелых скептиков в том, что разумные машины существуют, и чтобы свести обсуждение этого экзамена к обсуждению проблемы "искусственного интеллекта"" [10, с. 127]. В книге ведущего зарубежного критика "искусственного интеллекта" X. Дрейфуса критерий Тьюринга описывается подробнейшим образом, после чего делается осторожный вывод: "Вероятно, философу простое сходство в поведении покажется недостаточным основанием для того, чтобы признать за машиной свойство разумности, но в качестве цели работы для тех, кто действительно пытается построить думающую машину, и в качество критерия, которым могли бы пользоваться критики, оценивающие результаты этой работы, тест Тьюринга подходил как нельзя лучше" [124].

Может быть, даже более убедительно говорят о современности критерия Тьюринга следующие замечания, "мимоходом рассыпанные" в работах последних лет. Вот всего несколько примеров. Н. Нильсон - автор одной из лучших современных книг об "искусственном интеллекте" - информирует читателей: "Тьюринг (1950) устранил многие из стандартных доводов против мыслящих машин. Для решения вопроса о том, может ли машина мыслить, им был предложен тест, который принято называть тестом Тьюринга" [62, с. 19]. В цикле работ, ведущихся под руководством известного специалиста в области инженерной психологии А. Чапаниса и посвященных сравнительной оценке различных каналов коммуникации человека с ЭВМ, указывается, что в лабораторных условиях моделируются "идеализированные вычислительные системы, которые выдержат тест Тьюринга" [116]. Следует упомянуть также слова одного из видных современных идеологов направления "искусственного интеллекта" С. Коулза: "Владение естественным языком необходимо, если мы питаем надежду прийти в конечном счете к решению важных задач в области "искусственного интеллекта", таких, как "игра в имитацию", предложенная Тьюрингом еще в 1950 году и известная с тех пор как "тест Тьюринга"" [121, с. 215].

Упоминание об "игре в имитацию" не означает, разумеется, полного согласия с идеей Тьюринга. Предложенная последним процедура может рассматриваться и как "удобный эвристический прием", по выражению А. А. Брудного [21]. А. А. Брудный пользуется этим "приемом" весьма своеобразно: он строит воображаемый "диалог", в котором задаются вопросы об устройстве мира, о его объективности, природе сознания. В качестве же ответов используются цитаты из произведений представителей школы логической семантики Л. Витгенштейна и Р. Карнапа. В результате делается вывод, что ответы должны принадлежать... машине. И хотя фактически этот вывод неверен, но теоретически дело должно было бы обстоять именно так. "Во всяком случае,- замечает А. А. Брудный по поводу ответов-цитат,- содержание этих безупречно сформулированных высказываний несет какой-то "вне-человеческий" отпечаток. Собственно, у Витгенштейна и подразумевался не человек как таковой, а "метафизический субъект", абстрактный носитель способности мыслить, "нечто мыслящее". А если представить себе способность мыслить, реализованную внесоциально и в условиях полной изоляции от предметно-практической деятельности, то реализация этой способности утратила бы присущие человеческому мышлению черты" [21, с. 173].

Прийти к этому выводу А. А. Брудному позволило "эвристическое" использование процедуры Тьюринга (в слегка видоизмененном виде). Кстати, некоторые авторы предпринимают весьма деятельные попытки "ревизии" критерия Тьюринга. Наиболее разработанная из них принадлежит Р. Абельсону [113]. О ней будет говориться ниже. Н. М. Амосов и его соавтор вскользь упоминают о "модификации" предложения Тьюринга: "Мы полагаем, что оценка адекватности планов на основе сравнения психологических и машинных экспериментов может рассматриваться как модификация выдвинутого Тьюрингом критерия оценки "разумности" поведения машин (моделей)". И далее авторы отмечают, что "в условиях проведенного нами эксперимента поведение модели и человека-испытуемого практически неразличимы" [8, с. 208-209].

Для проверки недавно разработанной машинной модели личностного взаимодействия [135] критерий Тьюринга не годился: взаимодействие заключалось в генерировании взаимосвязанных параметров личности. Тем не менее идею Тьюринга удалось использовать: два реальных диалога между людьми были закодированы по той же системе, которая положена в основу машинной модели, и эти протоколы вместе с протоколами "диалога" с ЭВМ, были предложены группе судей. Последние сумели распознать человеческое взаимодействие лишь в одном случае; во втором они ошиблись. Это, как считает автор, в определенной степени подтверждает "реалистичность" созданной им модели [135, с. 267].

Подобные "модификации" (едва ли их можно отнести к "эвристическому" использованию процедуры Тьюринга) соседствуют с сообщениями о машинных программах, успешно выдержавших тест Тьюринга,- достаточно назвать письмо американского специалиста по вычислительной технике Д. Боброва [147]. Когда слушатели оказали предпочтение мелодиям, сочиненным машиной (по заданной программе), а не композиторами-людьми, это фактически означало, что программа выдержала тест Тьюринга [97]. В литературе проскользнуло также выражение "обратный критерий Тьюринга" [106]: имелось в виду, что в некоторых психологических экспериментах по взаимодействию оператора с ЭВМ бывает удобно имитировать работу ЭВМ, так что ответы экспериментатора испытуемый считает генерированными машиной.

Думается, этих примеров достаточно для подтверждения того, что критерий Тьюринга отнюдь не принадлежит только истории науки. Правда, из того, что "игра в имитацию" вполне современна, не следует, что она не встречала критики. Против предложения Тьюринга были высказаны весьма существенные замечания. Одни из них сделаны с позиций философии [128, 142, 63], другие - с позиций математической логики. Некоторые специалисты привлекли для опровержения самой возможности машинного мышления известную теорему Гёделя о неполноте формальных теорий. Однако границы ее применения пе вполне ясны, о чем не замедлили напомнить другие авторы [67].

Мы не будем останавливаться на во многом справедливой критике теста Тьюринга, ибо практика развития работ по "искусственному интеллекту" позволяет перевести разговор о нем в иную плоскость, еще не освоенную, насколько нам известно, критикой. К этому толкает осознание теоретического значения работ по моделированию на ЭВМ естественноязыкового общения. Думается, что настало время для такого осознания. В первую очередь нас будет интересовать программа Дж. Вейзенбаума "Элиза" [27, 155, 150] (и ее разновидности), а также программа К. М. Колби, моделирующая речевые реакции параноика [117, 118, 119]. Остановимся сначала на "Элизе" - это вызвано и хронологическим ее приоритетом, и большей наглядностью.

Создатели "Элизы" поставили перед ней единственную цель - поддерживать коммуникацию (в письменном виде, посредством телетайпа) на ничем не ограниченном естественном языке. Это значит, что "Элиза" должна была быть готова воспринять произвольную фразу и генерировать приемлемый ответ. Такая на первый взгляд непосильная для современной вычислительной техники задача решена неолшданно просто: "Элиза" конструирует свой ответ, видоизменяя поступившую реплику. Например, переводит ее в вопросительную форму, меняя при этом первое лицо местоимений и глаголов на второе и добавляя стереотипное вводное выражение.

Узнавать наиболее значимую часть фразы ей помогает специально составленный список ключевых слов. Тут же указаны другие слова и выражения, ситуативно связанные с данным элементом списка. Если во введенной фразе не содержатся ключевые слова, то "Элиза" выдает в качестве ответа одно из предусмотренных на такой случай выражений универсального характера, не нарушающих ход беседы, или же она может вернуться к одной из предшествующих фраз и, исходя из нее, построить ответ. Таким образом, успехи "Элизы" в поддержании разговора целиком обусловлены выбором адекватных для данных целей списком ключевых слов и выражений универсальной применимости, а также четкостью вложенных в нее грамматических преобразований.

"Элиза" допускает замену "сценария" - всей естественноязыковой части программы. Жестко запрограммированы в ней лишь правила, регулирующие взаимодействие с человеком, сами же конкретные языковые выражения могут быть легко заменены. Это позволяет совершенствовать "Элизу" в ходе приобретения ею коммуникативного опыта. Более того, программа допускает постановку сценария на произвольном языке, и "Элиза" мгновенно оказывается способной вести коммуникацию па этом языке. Сценарий может написать человек, совершенно не знакомый с программированием. Такие сценарии уже готовы для нескольких языков.

Этих поверхностных сведений о работе "Элизы" достаточно для дальнейшего изложения. Теперь нам предстоит вспомнить об очень любопытном эксперименте, проведенном с этой программой лет десять назад в Массачусетсом технологическом институте в рамках Известного проекта MAC [140]. Этот проект предусматривает использование мощной вычислительной машины в режиме разделения времени, что обеспечивает оперативное взаимодействие человека с ЭВМ. В эксперименте коммуникация действительно велась в реальном времени; как указывают авторы, латентный период между окончанием печатания реплики испытуемого и началом печатания ответа "Элизы" не превышал 5 сек.

Эксперимент проводился в помещении психологической лаборатории, где был установлен терминал (пульт связи с ЭВМ) с пишущей машинкой. Терминал был связан с мощной ЭВМ телефонным кабелем. В эксперименте приняли участие 24 человека, среди которых были и программисты. Каждый экспериментальный сеанс длился ровно час. За это время отдельные испытуемые успели ввести в ЭВМ от 10 до 65 сообщений (в среднем - 22 сообщения) и столько же раз получить ответ. Испытуемые были предупреждены, что их партнер - ЭВМ, и все же после окончания сеанса 15 человек (62%) считали, что вели Коммуникацию с человеком, 5 человек (21%) колебались и лишь четверо (17%) были убеждены, что им отвечала ЭВМ. Исследователи установили, что принадлежность испытуемого к любой из этих групп не коррелирует ни со степенью компетентности в вычислительной технике, ни с интенсивностью взаимодействия с ЭВМ в течение сеанса, ни с процентом неудовлетворительных ответов "Элизы" на введенные этим испытуемым сообщения.

Последнее особенно интересно и неожиданно. Ведь 19% ответов "Элизы" были признаны после эксперимента неудовлетворительными: грамматически ошибочными или выпадающими из контекста. Большая часть таких ответов (85%) не изменила веры испытуемых в правильное течение "диалога". Следующую реплику испытуемые не связывали с неудовлетворительным ответом ЭВМ. Синтаксическую аномальность испытуемые склонны были объяснять помехами в канале связи, и для таких предложений они в большинстве случаев находили приемлемую для себя интерпретацию. Не связанные с контекстом ответы "Элизы" испытуемые объясняли тем, что их фраза была понята партнером в каком-то другом смысле, или же находили для таких высказываний оправдание в необычных побуждениях партнера (например, что он шутит). Таким образом, даже явные неудачи программы (имевшие место почти в каждом пятом ее высказывании) не нарушили веру большинства испытуемых в то, что их собеседник - человек. Не насторожило их и повторение в каждом ответе партнера фрагментов их собственных высказываний.

В 1950 г. Тьюринг писал: "Я уверен, что лет через пятьдесят станет возможным программировать работу машин с емкостью 109 так, чтобы они могли играть в имитацию настолько успешно, что шансы среднего человека установить присутствие машин через пять минут после того, как он начнет задавать вопросы, не поднимались бы выше 70%" [95, с. 32]. Но, как мы видим, и полутора десятков лет хватило на то, чтобы шансы среднего человека твердо установить присутствие машин после шестидесятиминутного "диалога" не поднялись выше 17%. Тем самым программа "Элиза" оказалась, по-видимому, первой программой, удовлетворяющей критерию Тьюринга в изложенном выше упрощенном его понимании. Это произошло не только в специальных экспериментальных условиях, но и "экспромтом" [147].

Надо отметить прежде всего, что "Элиза" не моделирует ни одной мыслительной функции, ни одного аспекта мышления. Даже понимание, без которого, казалось бы, не обойтись при вопросно-ответной системе, у нее сводится к поиску ключевых слов. Так что программу, превзошедшую критерий Тьюринга, никак нельзя назвать мыслящей. Но ведь должна же она отвечать какой-то человеческой потребности, если подавляющее большинство испытуемых с видимым удовольствием вели с ней беседу целый час? На этот вопрос следует дать положительный ответ. Действительно, коммуникация с "Элизой" очень напоминает фатическое общение. Единственный смысл этого общения - в объединении группы собеседников. Но тут требуются пояснения.

Впервые заговорил о фатическом общении известный английский этнограф Б. Малиновский [134]. В своей полевой работе он наблюдал жизнь туземных племен, представители которых не были склонны выделять речь из других видов человеческого поведения. Отдыхая после работы или выполняя несложную работу, люди почти всегда обмениваются словами, однако последние, как обратил внимание Малиновский, зачастую никак не связаны с ситуацией. "Простая вежливая фраза,- писал он,- которая среди диких племен не менее в ходу, чем в европейских гостиных, выполняет функцию, к которой почти совершенно не относятся значения составляющих ее слов. Вопросами о здоровье, замечаниями о погоде, утверждениями по поводу какого-либо в высшей степени очевидного состояния вещей - всем этим мы обмениваемся не с тем, чтобы информировать, и не с тем (в данном случае), чтобы связать действующих людей, и, разумеется, не для выражения какой-либо мысли" [134, с. 313]. Обмен подобными вопросами, замечаниями и утверждениями служит исключительно установлению социального взаимодействия, и именно такое использование языка Малиновский назвал фатическим общением. Функцию речи, направленную на установление и поддержание социального контакта, тоже естественно назвать фатической.

Наблюдения и предложения Малиновского быстро получили признание специалистов. Действительно, ведь факты, на которые он опирался, неоспоримы и очевидны. Как отметил сам Малиновский, "несмотря на то, что рассматривались примеры из жизни дикарей, можно было бы найти среди нас самих точные параллели каждому типу применения языка из рассмотренных до сих пор" [134, с. 315]. И в этом он абсолютно прав, а примеры, думается, излишни.

Самое интересное то, что фатическое общение принадлежит к кругу социальных явлений. С точки зрения интеллектуального взаимодействия оно бессмысленно: говорящий не передает никакую мысль и не побуждает слушающего воспринять ее. Таким образом, при фатическом общении не передается информация, что дает основание считать его бесцельным времяпрепровождением. Однако цели нет лишь на интеллектуальном уровне, социальный же смысл фатического общения глубок и неоспорим. Реальные же фразы, которыми люди обмениваются при фатическом общении, большого значения не имеют. Они могут даже полностью выпадать из контекста - ведь важно только то, что они произносятся в привычном темпе и с обычной интонацией. Например, в работе Дж. Лэйвера [133] рассказывается о небольшом эксперименте, проведенном английской писательницей Дороти Паркер во время скучной вечеринки. Каждому из случайных знакомых, обращавшихся к ней с ничего не значащими фразами, писательница отвечала: "Я только что убила топором мужа, и у меня все прекрасно". Произносилось это тоном милой беседы, так что ни один из участников вечеринки не обратил внимания на чудовищный смысл обращенных к нему слов.

Вернемся к программе "Элиза". Теперь, как нам кажется, можно сделать вывод: она предназначена для фатического общения. Ведь единственная поставленная перед "Элизой" цель - любой ценой поддерживать разговор, не давая ему угаснуть. Этим достигается поддержание контакта - главное условие фатического общения. Его не нарушают даже реплики, не связанные с контекстом. А ведь такие реплики, как говорилось выше, в изобилии встречались в экспериментальных "диалогах" испытуемых с "Элизой". Таким образом, фатическое общение оказалось наиболее поддающимся моделированию.

Однако такой вывод бросает серьезную тень на обоснованность теста Тьюринга. Ведь его выдержала программа, моделирующая социальную, а не интеллектуальную функцию языка. Стало быть, критерий Тьюринга не служит проверке мыслительных способностей, не имеет никакого отношения к интеллекту. Можно предположить, что для удовлетворения критерию Тьюринга необходимо наличие лишь коммуникативных способностей. Из этого не следует ошибочность предположения Тьюринга, что "метод вопросов и ответов пригоден для того, чтобы охватить почти любую область человеческой деятельности, какую мы захотим ввести в рассмотрение" [95, с. 21]. Диалогом действительно возможно охватить самые разные сферы деятельности, и если ожидать от "Элизы" глубоких разумных ответов на сформулированные для нее проблемы, то ее антиинтеллектуальность проявится очень скоро.

Не случайно Дж. Вейзенбаум утверждает, что наилучших результатов "Элиза" достигает, когда ее принимают за врача-психотерапевта. Более того, по его же словам, "Элиза" пародирует психотерапевтическую систему Роджерса, в основе которой - повторение и переформулирование слов пациента [155]. Однако для того, чтобы успешно выдержать тест Тьюринга (в понимании самого Тьюринга), отнюдь не требуется осмысленное ведение беседы на узкоспециальные темы, а выполнение предложенной Тьюрингом цели - распознать пол партнера - не очень резко, по нашему мнению, отличается от беседы с психиатром - в обеих ситуациях моделирующая программа должна быть готова ответить на произвольный вопрос партнера.

При этом мы исходим не из "эвристической", по выражению А. А. Брудного [21], интерпретации теста Тьюринга, которая, разумеется, не встречает возражений, а из той, которая исходит от самого Тьюринга. Уже упоминалось о некоторых попытках усложнить критерий Тьюринга. Ниже будет показано, что по крайней мере некоторые из таких попыток не меняют принципиальной сути предложения Тьюринга. Подобная работа оправдана тем, что попытки такого рода не прекращаются. Развитие теста Тьюринга по существу предлагает академик В. М. Глушков (отдельные аспекты его выступления вызвали критику [55, 94]): "Критерий Тьюринга... остается в силе и подразумевает, что с машиной будут собеседовать люди серьезные и всерьез, месяц, год и на любые темы" [57]. Растягивание "игры в имитацию" на год исходит определенно не от Тьюринга. Да и едва ли можно многого ожидать от такого в основном количественного расширения теста без серьезных качественных изменений.

Следует отметить, что исследователи не связали полученные ими результаты [140] с удовлетворением критерия Тьюринга. Напротив, возвращаясь к ним, они заметили: "Очевидно, что ни одна беседа испытуемого с ЭВМ не выдержала бы теста Тьюринга, и столь же очевидно, что большинство испытуемых, оказавшись втянутыми в разговор с ЭВМ, вели его так же, как разговор с людьми" [137, с. 231]. Трудно согласиться с первой частью этого вывода. К нему скорее мог бы прийти сторонний наблюдатель, оценивающий диалог, но никак не участник диалога, о котором только и говорит Тьюринг. Так что авторы, очевидно, имели в виду то или иное усложнение критерия Тьюринга. Это представляется удивительным, ибо в их экспериментах продемонстрирована полная бесперспективность попыток распознать по поведению испытуемого, кто его собеседник: ЭВМ или человек. "...Если наши результаты получат обоснование,- пишут они,- то в исследованиях по применению ЭВМ для коммуникации на естественном языке не имеет значения, какая инструкция была дана испытуемым, ибо последние всегда будут реагировать так, как если бы говорили с людьми" [137, с. 235]. Эти слова звучат приговором не только тесту Тьюринга, но и самой его идее, как это ни грустно для его единомышленников.

Итак, критерий Тьюринга служит для тестирования коммуникативных способностей. Думается, не лря в эксперименте было предусмотрено, что ответы ЭВМ печатаются с "человеческой" скоростью, и иногда в них "проскальзывают" ошибки (например, пропускается интервал между словами [138, 140]). Для объяснения успеха "Элизы" надо обратиться к анализу взаимоотношений между партнерами коммуникации - какие аспекты коммуникативной техники необходимы для того, чтобы партнер признал разговор удовлетворительным, а какие аспекты менее обязательны. К сожалению, окончательный ответ на этот вопрос пока не в состоянии предложить ни одна из наук, изучающих человеческое

Могут быть отмечены лишь некоторые подходы к решению данной проблемы. Они связаны с интересом исследователей к прагматической стороне общения. Например, проводится анализ случаев аномального общения и выводятся те условия, отсутствие которых обессмысливает акт коммуникации [77]. Авторы этой работы выдвинули ряд постулатов нормального общения. Невыполнение в коммуникативном акте любого из этих постулатов делает общение аномальным. Анализ данной работы и некоторые предложения даны нами в [105, гл. 5]. Попытка выдвижения коммуникативных постулатов была предпринята и в рамках лингвистического направления, получившего название "генеративная семантика" [120]. Нельзя не признать плодотворной наметившуюся среди языковедов тенденцию изучения реального человеческого общения. В последнее время наблюдается устойчивый интерес лингвистов к прагматике (например, в социолингвистике), а также к исследованиям, пограничным между языкознанием и логикой (учение о пресуппозициях). По нашему мнению, на стыке этих направлений могут появиться перспективные методы исследования условий нормального общения, способные предложить ответы на некоторые вопросы, ставящиеся в настоящей работе.

Любопытно, что исследователи, проводившие эксперимент с "Элизой", пришли к сравнению речевого взаимодействия с игрой и попытались объяснить успешный результат их эксперимента с точки зрения правил игры. Они справедливо отмечают, что, кроме традиционно признаваемых фонологических, синтаксических и семантических правил, в коммуникации участвуют и другие правила, характеризующие взаимодействие между партнерами в коммуникативном акте. Например, в соответствии с определенными правилами производится смена ролей говорящего и слушающего. По другим правилам коммуникация оценивается как удовлетворительная или неудовлетворительная. Конечно, авторы работ [136, 138, 139] не ставили перед собой задачу вывести полный свод правил, характеризующих человеческое общение. Такая задача в настоящее время нереальна. Тем не менее исследователи, по-видимому, правы в том, что эти правила существуют и к тому же относительно идентичны у всех здоровых носителей каждого естественного языка. Это предположение позволяет выдвинуть гипотезу [137, 138]: если начальная стадия акта коммуникации удовлетворяет имплицитно известным индивидууму правилам взаимодействия, он уверяется в том, что и партнер сознает всю систему правил и следует ей. Если же в дальнейшем сообщения партнера окажутся плохо поддающимися интерпретации, это обычно не заставляет предположить, что он придерживается иных правил речевого общения. Эксперимент показал, что чаще ищутся другие объяснения девиантного речевого поведения [140].

Вся история подсказывает, что пользоваться естественным языком способно только человеческое существо: ни одному животному, никакому искусственному устройству это недоступно. Так что неудивительна реакция испытуемых, воспринявших ответы "Элизы" как исходящие от человека. А если отвечает человек, то он должен придерживаться общей для всех представителей рода человеческого системы коммуникативных правил. Отношение испытуемых к программе, отвечающей по-английски, можно сопоставить с отголосками столь обычного для наших предков мифологического отношения к миру. Как писал В. В. Иванов, "целый ряд фактов поведения человека становится понятным согласно гипотезе, по которой человек перерабатывает каждую получаемую его органами чувств последовательность сигналов так, как если бы она была осмысленным сообщением (т. е. человек исходит из установки на осмысленность сообщения, являющейся естественной для дешифровщика). К этому классу явлений относятся не только факты обычного языкового общения (где в качестве осмысленных воспринимаются даже заведомо бессмысленные сообщения), но и попытки интерпретировать явления природы в качестве знаков, особенно характерные для более ранних периодов человеческой истории" [45, с. 82]. Учитывая это, впору выдвинуть для объяснения успеха "Элизы" гипотезу о свойственной всем людям предпосылке осмысленности как неязыковых, так и (тем более!) языковых сообщений. В течение веков эта предпосылка была безусловно верной, но в будущем она может утратить свой статус, если получат большее распространение программы, подобные "Элизе".

Дж. Старкуэтером высказано мнение, что такие программы могут оказаться полезными для обучения студентов-медиков собеседованию с больными [89]. Удобство такого начинания - в доступности ЭВМ, в возможности многократно упражняться, причем режим разделения времени позволяет это делать десяткам студентов одновременно. Но, думается, для педагогических целей более пригодны специализированные программы типа программы Колби, ответы которой на вопросы психиатра эксперты не смогли отличить от ответов человека, страдающего шизофренией [118- 120]. "Элизе" же - программе универсальной - присущ некоторый недостаток. Всякий человеческий опыт - а коммуникативные навыки не составляют исключения - ограничен, так что автор сценария поневоле антиципирует такое коммуникативное поведение, с которым он знаком. Это-то ожидаемое поведение и становится нормой для ЭВМ. Если же в коммуникацию с такой программой вступит человек с несколько иными коммуникативными навыками, то очень вероятно, что диалог окончится неудачей. Аналогичное мнение высказывается в литературе [140]. Таким образом, обучение искусству разговора с пациентом нельзя полностью доверить ЭВМ, ибо такое обучение будет одностороннем.

Тут можно в качестве аналогии упомянуть нежелание Р. Гринблатта заявить созданную им шахматную программу МАКХАК для участия в соревнованиях среди машин. МАКХАК - сильнейшая, по всей видимости, из имеющихся шахматных программ - уже не один год играет с людьми в официальном заочном соревновании. По некоторым сведениям, она успешно сражается с игроками, чей рейтинг* достигает или даже превышает 1500. Это, конечно, очень далеко от гроссмейстерского класса (рейтинг не менее 2500), однако многие шахматисты-любители не достигают и такого уровня, и тем самым МАКХАК превосходит их по своей силе. Отметим, что в недавнее время с этой программой встретился экс-чемпион мира Р. Фишер, который выиграл все три сыгранные партии.

* (Официально принятый Международной шахматной федерацией (ФИДЕ) показатель спортивных результатов, достигнутых шахматистом. Вычисляется по специальной формуле и применяется, например, для установления норм, выполнение которых дает право на повышение спортивных званий.)

Отказ от встреч МАКХАКа с другими программами Р. Гринблатт объясняет следующим образом: "Если бы моей программе предстояло участвовать в машинном чемпионате (а сейчас она играет с людьми), то я желал бы ей успеха. Я надеюсь, что успех принесло бы извлечение выгоды из всех особенностей, характеризующих игру противников. В конечном счете это привело бы к развитию программы в таком направлении, которое иррелевантно для достижения моей конечной цели - успешной игры с людьми" [153, с. 26]. Р. Гринблатт справедливо полагает, что в каждой шахматной программе воплощен лишь ограниченный опыт ее разработчиков, а потому для роли наставника не годится ни отдельная программа, ни даже вся их совокупность. Мы не видим причины, по которой этот вывод нельзя было бы перенести на вопросно-ответные коммуникативные системы.

Наше утверждение, что критерий Тьюринга направлен на тестирование коммуникативных, а не интеллектуальных способностей, требует дополнительных рассуждений. Прежде всего надо ответить на вопрос, правомерно ли разрывать интеллект и речь. Нет нужды приводить многочисленные высказывания философов и психологов о глубокой связи между мышлением и речью. Так перед психолингвистикой встает одна из сложнейших научных задач: исследование пределов, подвижных границ взаимовлияния мышления и речи. Наиболее последовательно эта проблема поставлена в ряде работ Н. И. Жинкина, включающих в себя теоретический анализ, экспериментальные данные и наблюдения над речевой патологией [39, 40, 41, 42]. На них мы позволим себе вкратце остановиться.

"...Никому еще не удалось,- справедливо отмечает Н. И. Жинкин,- показать на фактах, что мышление осуществляется средствами только натурального языка. Это лишь декларировалось, но опыт обнаруживает другое" [41, с. 37]. Выделяя два блока - интеллекта и языка,- Н. И. Жинкин относит к первому три "подустройства": область системы понятий о действительности; область влияния эмоций и мотивов; область интеллектуальных операций. В блоке языка различаются такие "подустройства", как память, интонация и языковые операции [42]. Но самое интересное, что Н. И. Жинкину удается раскрыть механизм совместной слаженной работы обоих блоков в ходе коммуникации. Взаимодействие двух блоков обеспечивает лежащее между ними и связывающее их промежуточное образование - семантика. "Следует допустить,- осторожно писал Н. И. Жинкин,- существование специальной зоны, связывающей блоки интеллекта и языка. Это семантическая зона" [40, с. 14]. В том же году появилась другая работа того же автора, где приведенное допущение получило веское подтверждение [41]. Клиническое наблюдение за пациенткой, страдающей семантической афазией, позволило более отчетливо говорить о "семантическом фильтре", пограничном между языком и интеллектом. Этот фильтр призван охранять блок интеллекта от попадания туда бессмысленных сообщений [40].

В нашу задачу не входит рассмотрение устройства семантической зоны. Достаточно сказать, что она складывается в ходе обучения правильному использованию языка для выражения мыслительных образований. В работе Н. И. Жинкина [42] прослежен весь путь коммуникативного взаимодействия - от рождения плана, или замысла речи, до образования смысла высказанных слов в голове реципиента (адресата). Однако пас сейчас интересует не это. Нам хотелось бы извлечь из этого конспективного изложения тот вывод, что развитая психологическая теория вполне позволяет говорить отдельно о языке и об интеллекте, ни на минуту не забывая, конечно, об их взаимосвязи. Таким образом, получает теоретико-психологическое оправдание вывод о том, что критерий Тьюринга может быть отнесен к речевым, а не к интеллектуальным способностям.

Выше уже говорилось, что для целого ряда специалистов с самого начала было очевидно несовершенство предложения Тьюринга. Некоторых это побудило усовершенствовать процедуру "игры в имитацию". Остановимся на наиболее разработанной из таких попыток, предпринятой Р. Абельсоном [113]. Последний обратил внимание на то, что Тьюринг ничего не сказал о степени информированности игрока С: предупрежден ли он о возможности включения в эксперимент машинной программы? В случае положительного ответа на этот вопрос, как справедливо отмечает Абельсон, испытуемый (в роли игрока С, или судьи) изменит стратегию действий, т. е. будет стараться определить, в какой комнате находится ЭВМ, вместо того, чтобы выяснить, кто из игроков - мужчина, а кто - женщина. Пытаясь избежать этого, Абельсон сохранил основную идею Тьюринга, но разработал более строгие правила игры. В соответствии с ними игра длится много сеансов. Судье сообщается только то свойство, по наличию или отсутствию которого он должен идентифицировать своих двух адресатов (они могут отличаться не только полом, возрастом, но и в интеллектуальном отношении). В серии последовательных сеансов определяется процент правильных ответов судьи - базовый процент. В какие-то моменты вместо одного из адресатов в игру вступает ЭВМ, но судья этого не знает, так что для него ничего не изменилось. В таких сеансах процент правильных ответов судьи подсчитывается отдельно (машинная программа как бы "наследует" все свойства замененного ею игрока). Так определяется тестовый процент.

Если введение в игру ЭВМ не повлияло на успешность действий судьи, то это значит, что машинная программа удачно заменила испытуемого. Это можно сформулировать точнее: имитация прошла успешно, если как базовый, так и тестовый проценты превышают 50%, причем тестовый процент не отличается существенно (в статистическом смысле) от базового. Если машина успешно выполнит такой "расширенный тест Тьюринга" по целому ряду контрастных отличий (в том числе и интеллектуальных) , это будет означать, что ее нелегко отличить от человека.

Однако и расширенный тест Тьюринга (в редакции Абельсона) уже был выполнен. Это сделала программа К. М. Колби, моделирующая паранойю [117-120]. Выбор именно этого психического заболевания, отмечает Колби, был обусловлен тем, что в распознавании паранойи специалисты относительно едины. Что касается других болезней, то психиатры реже приходят к единому мнению. Эксперимент с программой Колби был проведен следующим образом. Восемь психотерапевтов проинтервьюировали посредством телетайпа троих пациентов - параноиков, вместо которых время от времени выступала ЭВМ. Врачи не знали о возможности такой замены. Они провели по два интервью длительностью 30-40 мин, после чего были оповещены, что собеседником могла быть машинная программа. Каждому психиатру предлагалось определить, в какой из четырех ситуаций он оказался: оба интервью были проведены с людьми; оба с ЭВМ; сначала с ЭВМ, потом - с человеком; сначала с человеком, потом с ЭВМ. Лишь двое специалистов из восьми ответили правильно - это следует признать случайным уровнем догадки.

Такая постановка эксперимента напоминает предложение Тьюринга. Расширение теста началось после первого этапа. Для этого были случайным образом выбраны 105 психиатров, которым отослали протоколы интервью, проведенных как с ЭВМ, так и с пациентом, с просьбой прислать свое заключение. Об участии ЭВМ их не предупреждали. Откликнулись 33 специалиста, которые в 43% случаев признали ЭВМ "страдающей" более тяжелой формой паранойи, чем реальный пациент. Эта цифра достаточно близка к 50%, так что психиатрам вновь не удалось различить человека и машинную программу.

Эксперимент продолжался. Вновь были случайным образом выбраны 100 психиатров. Им были посланы по два протокола интервью с просьбой определить, какое интервью было проведено с человеком, а какое - с машиной. На этот раз откликнулся 41 специалист, лишь 21 из которых ответил правильно (что составляет 51%). Здесь также результат не превышает уровня случайной догадки.

Далее было проверено предположение, что распознавание машинных ответов окажется по силам людям, хорошо знакомым с возможностями ЭВМ. Для этого протоколы взаимодействия с ЭВМ и с пациентом были разосланы 100 случайно выбранным членам Ассоциации по вычислительной технике (АСМ). Из 67 полученных ответов правильными оказались 32 ответа (48%), что должно быть признано случайным уровнем догадки. Таким образом, специалистам по вычислительной технике также не удалось определить, в каких протоколах зафиксировано взаимодействие с машинной программой, а в каких - с реальным пациентом. Этот результат совпадает с данными, полученными в рассмотренном выше исследовании [136-141], однако обладает большей доказательной силой, ибо подкреплен статистическим анализом [118, с. 92]. Аналогичный вывод может быть сделан и относительно выпадающих из контекста ответов ЭВМ. После выполнения вышеназванных тестов ("в духе Тьюринга", как отмечает Колби) разработанная программа была сознательно "ухудшена" - модифицирована таким образом, чтобы она выбирала конкретный ответ случайным образом из числа ранее генерированных ею ответов, т. е. независимо от заданного вопроса, Как и в исследовании [136-141], выпадающие из контекста реплики не повлияли на оценку взаимодействия модифицированной программы с психиатром: 35 специалистов из 69 (столько человек прислали ответы, всего же протоколы были разосланы 200 случайно выбранным членам Американской психиатрической ассоциации) не сумели отличить интервью, проведенное с подобной программой, от интервью с параноиком.

Мы не будем останавливаться на результатах опроса специалистов, проведенного Колби с целью выяснить, по каким параметрам расходятся или совпадают ответы, генерированные машинной программой, и ответы реальных пациентов. Данные такого рода могут быть использованы для усовершенствования конкретной разработанной программы, что не представляет для нас в данном случае интереса. Отметим лишь, что среди наиболее существенных расхождений (уровень значимости 0,001) выделяется фактор, связанный с лингвистической компетенцией программы, с худшим сравнительно с реальными пациентами пониманием ею высказываний на естественном языке. Не случайно в настоящее время улучшение языковой подготовки разработанной программы - центральная область усилий К. М. Колби и его коллег [145].

Так был выдержан теперь уже и расширенный тест Тьюринга. Стоит присмотреться к программе, которой удалось это сделать. Программу Колби роднит с программой Вейзенбаума исключительное внимание к языковому обеспечению взаимодействия. Хотя Колби делает попытку моделирования личности параноика, однако главное его внимание сосредоточено на построении адекватных ответов на вопросы психиатра. Можно сказать, что программа Колби моделирует прежде всего речевые реакции параноика, хотя в основу ее положена некоторая теоретическая модель параноидальных процессов. Как писал про эту программу Вейзенбаум, "нет оснований думать, что она может сказать нам что-либо о паранойе только потому, что она в некотором смысле отражает поведение параноика. Хотя простая пишущая машинка в некотором смысле отражает поведение застенчивого ребенка (печатается вопрос, на который не следует вообще никакого ответа), это нисколько не помогает нам понять природу застенчивости. Обоснованность модели должна проверяться на базе теории" [26, с. 52].

Отсюда напрашивается прежний вывод: программа, успешно выдержавшая расширенный тест Тьюринга, целиком осталась в русле коммуникативных процессом, никоим образом не затрагивая интеллект. В этом она ничем принципиально не отличается Кот "Элизы", так что расширение "игры в имитацию" не изменило принципиальной сути игры. Критерий Тьюринга, как утверждалось выше, тестирует лишь коммуникационные способности и ничего не показывает в плане наличия интеллекта. Думается, что всевозможные дальнейшие расширения этого критерия (если они последуют) не приведут к изменению его принципиальной природы. Тестировать интеллектуальные способности следует по-иному, и идея Тьюринга в этом помочь не сумеет, так что пора решительно отказаться от признания "игры в имитацию" (в разных ее вариантах) критерием интеллектуальной деятельности. Как это вытекает из статьи О. К. Тихомирова [94], отказ от критерия Тьюринга должен быть первым шагом на "пути использования психологических знаний для повышения эффективности работ по автоматизации умственного труда". Уже давно настало время сделать этот шаг.

В заключение - несколько замечаний о влиянии работ в области "искусственного интеллекта" на теорию коммуникации. Неожиданным следует признать сам факт, что практика "искусственного интеллекта" привела к постановке проблем, решение которых относится к компетенции специалистов по общению. Особенно любопытно, что проблемы эти оказались наименее разработанными во всем конгломерате наук, занимающихся вопросами коммуникации. Ведь серьезное изучение фатического общения еще даже не началось, да и о языковых (равно как и вне-языковых) конвенциях, или постулатах, которых придерживаются, сами того не замечая, все вступающие в коммуникацию индивиды, ученые только начали говорить.

Несомненно, эти проблемы всегда казались очень отвлеченными и далекими от практики. Теперь же сама практика как бы осветила их ярким прожектором и вынесла из глубокой тени на свет, привлекая к ним внимание специалистов. В этом мы усматриваем определенное теоретическое значение работ в области "искусственного интеллекта".

Вся проблематика "искусственного интеллекта" переживает в настоящее время трудный этап. Нередко говорят о кризисе, с которым столкнулись работы по "искусственному интеллекту". В нашу задачу не входит обсуждение этого вопроса. Однако мы считаем возможным отметить, что это научное направление заняло определенное место в исследовательском фронте и достаточно деятельно способствует синтезу разных наук. Помимо общеизвестного синтеза наук бионического направления, можно говорить и о воздействии работ по "искусственному интеллекту" на исследования человеческого общения, причем воздействие это выразилось в привлечении внимания к научным вопросам, казавшимся прежде весьма далекими от каких-либо практических применений. Так что можно усмотреть определенную заслугу исследований в области "искусственного интеллекта" в том, что они привлекают внимание специалистов к таким вопросам, которые оставались до сих пор на периферии интересов представителей тех наук, предметом которых является коммуникация между людьми.

предыдущая главасодержаниеследующая глава








© Злыгостев А.С., 2001-2019
При использовании материалов сайта активная ссылка обязательна:
http://informaticslib.ru/ 'Библиотека по информатике'
Рейтинг@Mail.ru
Поможем с курсовой, контрольной, дипломной
1500+ квалифицированных специалистов готовы вам помочь