5.3. Результаты о неразрешимости [1986 Саломаа А. - Жемчужины теории формальных языков]

НОВОСТИ БИБЛИОТЕКА ЮМОР КАРТА САЙТА ССЫЛКИ О САЙТЕ

5.3. Результаты о неразрешимости

Используем теперь сведение к проблеме соответствия Поста, чтобы доказать, что теорему 5.6 нельзя распространить на OL-системы. В то же время мы докажем неразрешимость проблемы языковой эквивалентности для контекстно-свободных грамматик (см. гл. 2). Оба результата вытекают из приведенной ниже леммы 5.7.

Сентенциальной формой (sentential form) грамматики мы будем называть любое слово α, такое, что S⇒^*α для некоторого начального символа S. Таким образом, сентенциальные формы могут включать как терминалы, так и нетерминалы, в то время как язык L(G), порождаемый грамматикой 6, состоит только из слов в терминальном алфавите.

Лемма 5.7. Проблема, состоящая в выяснении того, порождают ли две данные контекстно-свободные грамматики одно и то же множество сентенциальных форм, неразрешима.

Доказательство. Будем рассуждать от противного, предполагая, что существует алгоритм, выясняющий, совпадают ли множества сентенциальных форм, порождаемые двумя контекстно-свободными грамматиками. Тогда этот алгоритм можно применить следующим образом для решения проблемы соответствия Поста, что и обнаружит ложность сделанного предположения.

Возьмем произвольный пример

g: ∑^*→∑₁^*, h: ∑^*→∑₁^*

проблемы соответствия Поста, где мы положили

∑ = (a₁, ... , a_m), ∑₁ = {b₁, ... , b_n}.

Рассмотрим три языка L, L_g и L_h над алфавитом ∑∪∑₁∪{#}. По определению L = ∑^*#∑^*₁. Язык L_g является подмножеством языка L, состоящим из всех слов L, за исключением слов вида

w#g(mi(w)), w≠λ,(5.9)

где mi(x) обозначает зеркальный образ (mirror image) слова x, т. е. x, записанное в обратном порядке. (Если x есть λ или состоит только из одной буквы, то mi(x) = x.) Язык L_h определен подобным же образом с заменой в (5.9) морфизма g на h.

Очевидно,

L = L_g∪L_h тогда и только тогда, когда E(g, h) = ∅).(5.10)

(Напомним, что E(g, h) считается пустым, если состоит лишь из пустого слова.) Опираясь на сделанное нами вначале предположение, построим теперь алгоритм, выясняющий, имеет ли место равенство L = L_g∪L_h. В силу (5.10) этот алгоритм применим также к проблеме соответствия Поста. Определим следующим образом две контекстно-свободные грамматики G₁ и G₂. Единственным начальным символом для обеих грамматик будет S₀, а нетерминальным (терминальным) алфавитом будет

{S₀, S₁, S₂, S₃, S⁴, A, B} (соответственно ∑∪∑₁∪{#}).

Ниже перечислены продукции грамматики G₁. В этом списке предполагается, что a пробегает ∑, a, b пробегает ₁.

где x (соответственно y) пробегает все слова над ∑₁ имеющих длину меньше |g(a)| (соответственно |h(a)|), включая пустое слово;

A→aS₂x,B→aS₂y,

где x (соответственно y) пробегает множество всех слов над ∑_i, имеющих длину |g(a)| (соответственно |h(a)|, но отличных от g(a) (соответственно h(a));

Продукции G₂ получаются из продукций G₁ заменой двух продукций S₁→# и S₃→# на продукцию S₄→#. Этим определение G₁ и G₂ завершается.

Теперь можно непосредственно проверить, что G₁ и G₂ порождают одни и те же сентенциальные формы, за возможным исключением слов, состоящих только из терминальных букв - терминалов. Поэтому, поскольку мы можем решить вопрос о совпадении множеств сентенциальных форм, порождаемых G₁ и G₂, мы можем также решить вопрос, верно ли, что L(G₁) = L(G₂).

Очевидно, что L(G₂) = L. В действительности L выводится по правилам G₂ с использованием только нетерминалов S₀ и S₄. В силу (5.10) и того факта, что мы можем разрешать проблему равенства L(G₁) = L(G₂), для завершения леммы 5.7 достаточно показать, что

L(G₁) = L_g∪L_h.(5.11)

Чтобы установить это равенство, покажем, что имеет место включение в обоих направлениях. Пусть слово w принадлежит L(G₁). Надо показать, что w∈L_g∪L_h. Это верно, если w=#. Поэтому предположим, что w≠#. Так как S₄ нельзя устранить, заключаем, что первая продукция, применявшаяся в выводе w, есть S₀→A или S₀→B. В силу симметричности ситуации достаточно рассмотреть первый случай и показать, что w принадлежит L_g. Последовательность различных нетерминалов, появляющихся в выводе w из A, должна быть одной из следующих:

(A, S₃), (A, S₁), (A, S₂, S₃).(5.12)

В каждом из этих случаев легко проверить, что w∈L_g. (Часть слова, идущая за центральным маркером #, в первом случае оказывается "слишком длинной", а во втором - "слишком короткой". Третий случай указывает на ошибку в сопоставлении a и g(a).)

Предположим, наоборот, что w∈L_g∪L_h, скажем w∈L_g. Если w∈#∑^*₁, то в грамматике G₁ слово w порождается с помощью продукции

S₀→#, S₀→A, A→S₃b, S₃→S₃b, S₃→#.

Таким образом, можно предположить, что

w = a_i₁ ... a_{i_k}#w', k≥1, w'∈∑^*₁, w'≠g (a_{i_k} ... a_i₁).

Пусть u - наибольшее натуральное число в отрезке 0≤u≤k, такое, что w' = w₁g(a_{i_u} ... a_i₁). Предположим сначала, что u = 0, т. е. w' нельзя представить в виде w' = w₁g (a_i₁) Если |w'|<|g(a_i₁)|, то слово w порождается продукциями.

S₀→A, A→a_i₁S₁w', S₁→aS₁, S₁→#.

Если |w'|≥g (a_i₁)|, то положим w' = w"x, где |x| = |g(a_i₁) и x≠g (a_i₁). Слово w может порождаться также продукциями

S₀→A, A→a_i₁S₂x, S₂→aS₂, S₂→S₃, S₃→S₃b, S₃→#.

Теперь предположим, что u = k. В этом случае w' имеет вид

w' = w₁g(a_{i_k} ... a_{i_i}).

Кроме того, w₁≠λ, так как в противном случае слово w не принадлежало бы языку L_g. Теперь w может порождаться продукциями

S₀→A, A→aAg(a), A→S₃b, S₃→S₃b, S₃→#.

Предположим, наконец, что 1≤u<k. Тогда существует такое слово w₁, что

w' = w₂g(a_{i_u} ... a_i₁),

но не существует такого слова w₂, что

w' = w₂g(a_{1_u+1}...a_{i_i}).(5.13)

Если |w₁|<|g (a_{i_u+1})|, то w порождается продукциями

S₀→A, A→aAg(a), A→a_{i_u+1}S₁w₁, S₁→aS₁, S₁→#.

В противном случае w₁ можно записать в виде w₁ = w₃x, где |x| = |g(a_{i_u+1})| и x≠g(a_{i_u+1}). (Напомним, что w' нельзя представить в виде (5.13).) Теперь слово w порождается продукциями

S₀→A, A→aAg(a), A→a_{i_u+1}S₂x, S₂→aS₂, S₂→S₃, S₃→S₃b, S₃→#.

Итак, мы показали, что во всех случаях слово w принадлежит L(G₁).▫

Приведенное доказательство показывает, что в общем случае мы не в состоянии решить проблему равенства множеств сентенциальных форм, порождаемых грамматиками G₁ и G₂ (поскольку не существует соответствующего алгоритма). Грамматики G₁ и G₂ можно преобразовать в OL-системы, добавляя к ним продукции c→c для каждого терминального символа c. Следовательно, проблема языковой эквивалентности для OL-систем неразрешима. (В действительности она остается неразрешимой даже для частного класса OL-систем, а именно для систем, имеющих вид G₁ и G₂. Такие OL-системы, например, не используют λ-продукций.)

Но приведенное выше доказательство показывает также неразрешимость проблемы L(G₁) = L(G₂), когда G₁ и G₂ рассматриваются как контекстно-свободные грамматики. Следовательно, проблема языковой эквивалентности для контекстно-свободных грамматик неразрешима. Из наших рассуждений в действительности следует, что эта проблема остается неразрешимой даже для линейных грамматик, когда ни в одной продукции правая часть не содержит более одного нетерминала.

Таким образом, королларием^* леммы 5.7 является следующий результат.

^* (Под королларием теоремы здесь подразумевается утверждение, вытекающее не только из формулировки этой теоремы, но и из ее доказательства (этим королларий отличается от следствия). - Прим. перев.)

Теорема 5.8. Проблема языковой эквивалентности для OL-систем неразрешима. Проблема языковой эквивалентности для контекстно-свободных грамматик также неразрешима.

Оценки и отзывы на https://ozersklust.com помогут сделать правильный выбор.

ПОИСК:

© Злыгостев А.С., 2001-2019
При использовании материалов сайта активная ссылка обязательна:
http://informaticslib.ru/ 'Библиотека по информатике'