НОВОСТИ   БИБЛИОТЕКА   ЮМОР   КАРТА САЙТА   ССЫЛКИ   О САЙТЕ  




предыдущая главасодержаниеследующая глава

Структура групп существительного

Простейшие группы существительного состоят лишь из определителей, прилагательных и существительных. Определителями являются слова наподобие артиклей* и местоимений, таких, как эта, та, эти, которые помогают определить, какой объект и как много объектов имеется в виду.

* (В английском языке это а и the, в русском языке артикли отсутствуют.- Прим. перев)

Есть целый ряд ограничений на составляющие групп существительных. Определитель, если он присутствует, идет первым. Затем идет прилагательное, если оно имеется, и, наконец, существительное. Обнаружив определитель, система синтаксического анализа групп существительного может заняться поиском либо прилагательного, либо существительного, но не другого определителя. Встретив существительные, система синтаксического анализа знает, что маловероятны какие-либо еще определители, прилагательные и существительные. Иногда существительное используется в качестве прилагательного, в этом случае оно называется классификатором, но в настоящий момент мы в такие детали вдаваться не будем.

Грамматика - это механизм описания языка

Среди многих схем представления ограничений, присущих языку, наиболее известными являются бесконтекстная грамматика, трансформационная грамматика и грамматика с расширенной сетью переходов. Все они представляют собой теории языка, поскольку содержат описания ограничений, определяющих, является ли некоторая последовательность слов приемлемым предложением или какой-то чепухой. В дальнейшем мы сосредоточим все внимание на грамматиках, представимых в виде расширенной сети переходов, поскольку они наиболее нам подходят. Прежде, однако, уместно бросить взгляд на другие грамматики, просто чтобы знать, что существуют и другие подходы.

Чтобы разобраться и в бес контекстной и трансформационной грамматиках, представьте себе черный ящик, имеющий выход, но не имеющий входа. На выходе появляются правильные английские предложения, сначала односложные, а затем постепенно все более и более длинные. Внутри ящика в типичной грамматике имеется

набор правил, каждое из которых воспринимает цепочку слов, модифицирует ее и выдает новый результат. Эти правила могут в значительной мере напоминать продукции, как показано в следующих примерах:

 R1 
 Если	присутствует символ S, 
 то	заменить S символами ПОДЛЕЖАЩЕЕ ГЛАГОЛ. 

 R2 
 Если	присутствует символ ПОДЛЕЖАЩЕЕ, 
 то	заменить ПОДЛЕЖАЩЕЕ символами ЭТОТ ПРО 
 ГРАММИСТ. 

 R3 
 Если	присутствует символ ГЛАГОЛ, 
 то	заменить ГЛАГОЛ символом ПРОГРАММИРУЕТ.

Предложения генерируются путем многократного применения этих правил к начальному стартовому символу S. В этом примере легко проследить действие правил, поскольку ни в одной точке к одному символу не применяется более одного правила. Таким образом, применяя правила R1, R2 и R3 в этом порядке, получаем следующие изменения:

ПОДЛЕЖАЩЕЕ ГЛАГОЛ 
ЭТОТ ПРОГРАММИСТ ГЛАГОЛ 
ЭТОТ ПРОГРАММИСТ ПРОГРАММИРУЕТ

Хотя в этих обозначениях может быть записана и большая грамматика, лингвисты привыкли использовать те или иные сокращенные обозначения. Это заведомо относится к так называемой бесконтекстной грамматике, правила которой отыскивают один символ и затем просто заменяют его другим. С использованием стандартных сокращений рассматриваемая грамматика может быть записана следующим образом:

Грамматика 1:	S → ПОДЛЕЖАЩЕЕ ГЛАГОЛ 
              ПОДЛЕЖАЩЕЕ → ЭТОТ ПРОГРАММИСТ 
              ГЛАГОЛ → ПРОГРАММИРУЕТ 

В следующей, несколько большей грамматике к одному и тому же символу применяется больше одного правила. Тогда могут возникнуть более интересные предложения.

Грамматика 2: S	→ 	ПОДЛЕЖАЩЕЕ ГЛАГОЛ 
              S → ПОДЛЕЖАЩЕЕ ГЛАГОЛ ДОПОЛНЕНИЕ 
              ПОДЛЕЖАЩЕЕ - ОПРЕДЕЛИТЕЛЬ СУЩЕСТВИТЕЛЬНОЕ 
              ДОПОЛНЕНИЕ → ОПРЕДЕЛИТЕЛЬ СУЩЕСТВИТЕЛЬНОЕ
              ОПРЕДЕЛИТЕЛЬ → НЕКИЙ 
              ОПРЕДЕЛИТЕЛЬ → ЭТОТ 
              СУЩЕСТВИТЕЛЬНОЕ → ЭВМ 
              СУЩЕСТВИТЕЛЬНОЕ  → ПРОГРАММИСТ 
              ГЛАГОЛ → ПРОГРАММИРУЕТ ГЛАГОЛ ЛЮБИТ

Такие бес контекстные грамматики могут на самом деле очень сильно разрастись, но в конце концов становится ясно, что для адекватного рассмотрения значительного подмножества естественного языка необходимы более общие правила. Популярное расширение состоит в том, чтобы нарастить части правил, связанные с ситуацией и действием таким образом, чтобы решение вопроса о применимости правила зависело более чем от одного символа и так, чтобы символы можно было менять местами, а также стирать или заменять. Такие более общие правила называются контекстно-зависимыми. Исследования, в которых используются такие правила, так называемые трансформационные грамматики, уводят нас на территорию, занимаемую в основном лингвистами. Вместо того чтобы отправиться туда, мы займемся представлением лингвистических фактов в грамматиках с расширенной сетью переходов, которые выглядят удобнее для создания программ, понимающих язык.

Рекурсивные сети переходов также могут хранить синтаксическую информацию

Сеть переходов представляет собой структуру, которая позволяет удобным образом охватить набор фактов, связанных с синтаксисом. В первой части рис. 6.6 приводится эквивалент для простых групп существительного в виде основной сети переходов. Каждый кружок представляет собой некоторое состояние, а помеченные дуги показывают, как слова конкретного типа вызывают переходы из одного состояния в другое. Переходы, связанные с определением, дают петлю назад к тому же состоянию, поскольку в группе существительного может быть сколько угодно прилагательных. Можно думать о приемлемой группе существительного как о множестве инструкций для перемещения вдоль некоторого пути от начального состояния к так называемому принимающему состоянию, представленному в виде двойного кружка. Вершина S3 представлена двойным кружком, потому что попадание в нее означает успех. Анализ завершен, цепочка слов, проходящая через эту сеть к принимающему состоянию, интерпретируется как группа существительного. Когда же последовательность слов ведет к состоянию, все переходы из которого несовместимы со следующим словом, то анализ заканчивается неудачей. Такая последовательность не может составлять простую группу существительного, как она здесь определена.

Рис. 6.6. Сеть переходов описывает грамматические ограничения. На первой диаграмме простая сеть переходов определяет группу существительного как определитель, любое число прилагательных и существительное. На второй диаграмме показано, что предложная группа состоит из предлога, за которым следует группа существительного. Метки при дугах, выделенные крупным шрифтом, подобны вызовам подпроцедур, обращающихся к упоминаемым сетям. На третьей диаграмме появляется рекурсия, поскольку дуга указывает на то, что за существительным, относящимся к группе существительного, может идти предложная группа
Рис. 6.6. Сеть переходов описывает грамматические ограничения. На первой диаграмме простая сеть переходов определяет группу существительного как определитель, любое число прилагательных и существительное. На второй диаграмме показано, что предложная группа состоит из предлога, за которым следует группа существительного. Метки при дугах, выделенные крупным шрифтом, подобны вызовам подпроцедур, обращающихся к упоминаемым сетям. На третьей диаграмме появляется рекурсия, поскольку дуга указывает на то, что за существительным, относящимся к группе существительного, может идти предложная группа

Предложная группа в сущности является группой существительного, которой предшествуют предлоги. Во второй части рис. 6.6 показано, как ее представить с использованием уже определенной структуры группы существительного. Заметьте, что дуги, помеченные именами групп, требуют успешного прохождения сети, а не присутствия некоторого слова. Принято имена групп показывать на дугах, выделяя их крупным шрифтом.

Очень часто описание, даваемое группой существительного, усиливается с помощью одной или более предложной группы, идущей за существительным, и еще более конкретизирующей его. Третья часть рис. 6.6 показывает такое обобщение. Пример, в котором подобная конструкция требуется: "Красная пирамида на большом блоке". Здесь содержится предложная группа "на большом блоке".

Поскольку группы существительного могут содержать предложные группы, а предложные группы могут содержать группы существительного, то их комбинация рекурсивна. Вложение может достигать произвольно большой глубины:

Красная пирамида
 на большом блоке 
  вблизи пустой коробки 
   около яркого красного куба... 

При прохождении сети переходов накапливаются факты

В словаре содержится необходимая информация о типе слова, чтобы можно было использовать группы слов при прохождении по путям, имеющимся в сети переходов. Естественно, в словаре содержится гораздо больше сведений, чем просто указание типа. Для понимания того, как осуществляет свою работу Робби, важны два других вида информации:

  • В словаре слов, помимо типа, содержатся и другие синтаксические характеристики.
  • Он также содержит фрагменты программ.

Рассмотрим сначала упомянутые характеристики. Они представляют собой такие свойства слов, которые определяют грамматическую роль слова, не строя никакого семантического образа. Обычными возможными вариантами для характеристики тип являются ОПРЕДЕЛИТЕЛЬ, СУЩЕСТВИТЕЛЬНОЕ, ГЛАГОЛ, ПРИЛАГАТЕЛЬНОЕ, ЧИСЛИТЕЛЬНОЕ, ЧАСТИЦА и ПРЕДЛОГ. Один из этих типов оказывается справедливым для каждого слова в предложении. Другие возможности для этой характеристики связаны с выбором между ЕДИНСТВЕННЫЙ и МНОЖЕСТВЕННЫЙ для существительных, между ЕДИНСТВЕННЫЙ, МНОЖЕСТВЕННЫЙ, ОПРЕДЕЛЕННЫЙ и НЕОПРЕДЕЛЕННЫЙ для определителей и НАСТОЯЩЕЕ, ПРОШЕДШЕЕ и ОПРЕДЕЛЕННАЯ и НЕОПРЕДЕЛЕННАЯ форма для глаголов.

Имеет смысл наделить характеристиками также и группы существительного. Эти характеристики должны вытекать из характеристик слов, которые в группе содержатся, поскольку только слова, а не группы слов входят в качестве элементов в наш словарь.

По большей части характеристики группы существительного соответствуют типам слов, которые появляются в группе существительного. Определитель и числительное являются двумя важными примерами. Мы уже встречались с типом слова определитель. Тип слова числительное, с которым мы еще не сталкивались, выделяет слово или группу слов, которые указывают на количество, как во фразе "три высокие пирамиды". Таким образом, термины определитель и числительное используются в двух смыслах. Для групп существительного определитель и числительное являются именами признаков, которые имеют значения; для отдельных слов тип является именем признака, возможными значениями которого являются, в частности, ОПРЕДЕЛИТЕЛЬ и ЧИСЛИТЕЛЬНОЕ.

  • ОПРЕДЕЛИТЕЛЬ может быть ОПРЕДЕЛЕННЫМ или НЕОПРЕДЕЛЕННЫМ в зависимости от того, относится ли эта группа существительного к чему-то определенному.
  • ЧИСЛИТЕЛЬНОЕ обычно принимает значения ЕДИНСТВЕННЫЙ или МНОЖЕСТВЕННЫЙ. В более общем случае в ячейке числа могут быть символы, такие, как НИ ОДНОГО, ВСЕ, РОВНО ТРИ или БОЛЬШЕ ЧЕМ ЧЕТЫРЕ.

Сети переходов выводят признаки в качестве побочного результата успешного прохождения. Отсюда и поступает информация о признаках групп существительного:


Очевидно, что признак числительное для групп существительного черпает и суммирует информацию из многих источников. Если группа существительного содержит слово, являющееся числительным, или группу таких слов, то эта информация обычно доминирует. В другом случае определитель или существительное могут по крайней мере указывать на единственное или множественное число. Определители, такие, как неопределенный артикль (а), это и та, указывают на единственное число, эти или те - на множественное. Определенный артикль (the) нейтрален*. Если признак числа определителя расходится с признаком числа существительного, то комбинация грамматически не верна. Только маленьким детям может сойти с рук употребление "этот блоки" или "эти пирамида".

* (Неопределенный артикль а используется, когда речь идет о каком-то одном, произвольном представителе некоторого класса предметов, например какой-либо карандаш, все равно какой. Определенный артикль the указывает на один или несколько вполне определенных представителей того или иного класса предметов.- Прим. перев.)

Расширенные переходы предписывают побочные результаты

Пометки, связанные с дугами, указывают на те действия, которые следует предпринять. Благодаря этим пометкам и тем последствиям, к которым приводит их наличие, расширенные сети переходов и отличаются от обычных. На рис. 6.7 показано, каким образом эти пометки расширяют сеть переходов для группы существительного. Как видно на рисунке, пометка на дуге определителя связана с проверкой того, является ли он определенным или неопределенным. После этого признак ОПРЕДЕЛЕННЫЙ или НЕОПРЕДЕЛЕННЫЙ пересылается в данную группу существительного и записывается в ячейку памяти, выделенную для признака определителя группы существительного. В то же самое время другая пометка на дуге определителя проверяет, указывает ли он на множественное или единственное число, и если указывает, то признак ЕДИНСТВЕННЫЙ или МНОЖЕСТВЕННЫЙ записывается в ячейку памяти, отведенную для признака числа группы существительного.

Рис. 6.7. Рекурсивные сети переходов становятся расширенными сетями переходов, когда определенные ячейки памяти заполняются после прохождения дуги, а обращения к ним производились до того
Рис. 6.7. Рекурсивные сети переходов становятся расширенными сетями переходов, когда определенные ячейки памяти заполняются после прохождения дуги, а обращения к ним производились до того

Конечно, пометка на дуге существительного также может повлиять на информацию в ячейке числа группы существительного, но только если там еще ничего не записано. Более конкретная информация, которая там уже может присутствовать, не должна быть при этом утеряна. Действия, таким образом, здесь носят условный характер, и пометка приводит не только к действию, но и проверке выполнения некоторого условия. Рекурсивная сеть переходов, которая допускает использование пометок, обеспечивающих запись, извлечение и проверку фактов, называется Расширенной Сетью Переходов или РСП.

Словарь Робби содержит фрагменты программ

Модель мира содержит много фактов о предметах. Эти факты соответствуют одному из трех следующих образцов:

  • Имя объекта, имя отношения и имя другого объекта.
  • Имя объекта, отношение ЯВЛЯЕТСЯ и имя класса.
  • Имя объекта, отношение, называющее свойство, и свойство.

Вот некоторые примеры:


В конце концов выяснится, каким образом эти факты можно записать в память так, чтобы можно было использовать образцы, подобные шаблонам, для их извлечения. Типичный образец для извлечения выглядит следующим образом:

 ?Х ИМЕЕТ-ЦВЕТ КРАСНЫЙ 

Эти образцы во всех отношениях подобны фактам, за исключением возможного наличия в них имен, начинающихся знаком вопроса. Это специальные имена, обозначающие, что на их месте может стоять все, что угодно, когда память просматривается в поисках данного образца. Нашему образцу соответствует например, такой факт:

 31415 ИМЕЕТ-ЦВЕТ КРАСНЫЙ 

поскольку 31415 находится в первой позиции и поскольку имена в образце, начинающиеся с ?, соответствуют всему, чему угодно.

Программы сопоставления с образцом позволяют организовать поиск, при котором несколько базисных образцов используются для формирования некоторого более общего требования. Вот пример, который отличается от фрагмента настоящей программы лишь в нескольких несущественных синтаксических деталях:


Эти четыре строчки указывают, что нужно найти все красные объекты, являющиеся опорами для пирамид. Делается это в два шага. Сначала эти образцы используются для извлечения из фактов в памяти всех потенциальных значений для X и Y. Затем все пары проверяются, чтобы посмотреть, какие из них одновременно удовлетворяют всем требованиям. Большая часть содержания программы прямо поступает из тех фрагментов программы, которые хранятся в памяти вместе с каждым прилагательным и существительным:


Проблема, таким образом, состоит в том, чтобы иметь программу, способную порождать другие программы, которая строила бы поисковые программы на основе таких фрагментов. После этого поисковые программы выдают имена предметов.

Существует множество различных способов обратить внимание на число подходящих комбинаций. Программа для группы существительного "красный предмет", который поддерживает три пирамиды" указывает, что должны быть найдены три пирамиды:


красный объект, который поддерживает эту пирамиду красный объект, который поддерживает три пирамиды красный объект, который поддерживает ровно три пирамиды красный объект, не поддерживающий пирамид



Таким образом, отдельные строки и извлекаются из словаря слов, и

признаки в ячейках успеха строятся из =, >, <, ВСЕ и целых чисел. Объединенные вместе в программно-подобную структуру, они позволяют отразить разнообразный смысл с точностью, ясностью и с большой экономностью.

Тогда очевидно, что перевод с "языка" групп существительного из мира кубиков на язык программ поиска может быть легким делом, при условии, что даны основные структуры и известно, как заполнять упомянутые ячейки. Простая программа способна выполнить эту работу. Посмотрим, что требуется знать такой программе.

Признаки группы определяют форму соответствующей программы


Эти образцы, поставляемые существительными и прилагательными, служат как бы кирпичами, а признаки, поставляемые другими словами,- цементом.

предыдущая главасодержаниеследующая глава








© Злыгостев А.С., 2001-2019
При использовании материалов сайта активная ссылка обязательна:
http://informaticslib.ru/ 'Библиотека по информатике'
Рейтинг@Mail.ru
Поможем с курсовой, контрольной, дипломной
1500+ квалифицированных специалистов готовы вам помочь