Gramática de concatenação de intervalo

Predefinição:Reciclagem Gramática de concatenação de intervalo, em tradução livre de range concatenation grammar (RCG), é uma gramática formal desenvolvida por Pierre Boullier ^[1] em 1998 como uma tentativa de representar uma série de fenômenos da linguagem natural, como os números chineses e embaralhamento de palavras alemãs, que não pertencem às linguagens moderadamente sensíveis ao contexto (tradução livre de Mildly context-sensitive languages^[2]).

De um ponto de vista teórico, qualquer linguagem pode ser analisada em tempo polinomial se, e somente se, pertencer ao subconjunto de RCG chamado gramáticas de Concatenação de Intervalo Positivo (tradução livre de positive range concatenation grammars).^[3]

Embora projetada como uma variante das Gramáticas de Movimento Literal de Groenink (sigla LMG), as RCGs tratam o processo gramático mais como prova do que produção. Enquanto LMGs produzem uma cadeia final de um predicado inicial, RCGs focam em reduzir o predicado inicial (que implica na cadeia final) para a cadeia vazia, que constitui a prova do pertencimento da cadeia final à linguagem.

Descrição

Definição Formal

Uma gramática de Concatenação de Intervalo Positivo - tradução livre de positive range concatenation grammar, PRCG - é uma tupla $G = (N, T, V, S, P)$ , onde:

$N$ , $T$ e $V$ são conjuntos disjuntos finitos de (respectivamente) predicados, simbolos teminais e variáveis. Cada nome de predicado tem uma aridade associada dada pela função $d i m : N \to ℕ ∖ {0}$ .
$S \in N$ é o início do predicado e verifica $d i m (S) = 1$ .
$P$ é um conjunto finito de cláusulas da forma $ψ_{0} \to ψ_{1} \dots ψ_{m}$ , onde os $ψ_{i}$ são predicados da forma $A_{i} (α_{1}, \dots, α_{d i m (A_{i})})$ com $A_{i} \in N$ e $α_{i} \in (T \cup V)^{⋆}$ .

Uma gramática de Concatenação de Intervalo Negativo - tradução livre de Negative Range Concatenation Grammar, NRCG - é definida como uma PRCG, mas com o adicional de que alguns predicados ocorrendo no lado direito das cláusulas podem ter a forma $\overline{A_{i} (α_{1}, \dots, α_{d i m (A_{i})})}$ . Estes predicados são chamados predicados negativos.

Uma gramática de Concatenação de Intervalo é ou positiva ou negativa. Embora PRCGs sejam tecnicamente NRCGs, dizemos que essas gramáticas são de intervalos negativos ou positivos enfatizar a ausência ou presença de predicados negativos.

Um intervalo no palavra $w \in T^{⋆}$ são alguns $⟨ l, r ⟩_{w}$ , com $0 \leq l \leq r \leq n$ , onde $n$ é o comprimento de $w$ . Dois intervalos $⟨ l_{1}, r_{1} ⟩_{w}$ and $⟨ l_{2}, r_{2} ⟩_{w}$ podem ser concatenados sse $r_{1} = l_{2}$ , então nós temos: $⟨ l_{1}, r_{1} ⟩_{w} \cdot ⟨ l_{2}, r_{2} ⟩_{w} = ⟨ l_{1}, r_{2} ⟩_{w}$ .

Para uma palavra $w = w_{1} w_{2} \dots w_{n}$ , com $w_{i} \in T$ , a notação pontuada para intervalos é: $⟨ l, r ⟩_{w} = w_{1} \dots w_{l - 1} ∙ w_{l} \dots w_{r - 1} ∙ w_{r} \dots w_{n}$ .

Reconhecimento de cadeias

Como LMGs, cláusulas de RCG tem o esquema geral $A (x_{1}, . . ., x_{n}) \to α$ , onde em uma RCG, $α$ é, ou a cadeia vazia ou uma cadeia de predicados. Os argumentos $x_{i}$ consistem de cadeias de símbolos terminais e/ou símbolos de variáveis, padrão o qual corresponde com os valores do argumento atual como no LMG. Variáveis adjascentes constituem uma família de correspondências em partições, então esse argumento $x y$ , onde duas variáveis, correnpondem a cadeias de litais $a b$ em três modos diferentes: $x = ϵ, y = a b; x = a, y = b; x = a b, y = ϵ$ .

Termos predicados vêm de duas formas, positiva (que produz a cadeia vazia em caso de sucesso), e negativa (que produz a cadeia vazia em caso de falha ou se termos positivos não produzem a cadeia vazia). Termos negativos são denotados da mesma forma que os positivos, com uma barra sob si, como em $\overline{A (x_{1}, . . ., x_{n})}$ .

A re-escrita da semântica para RCGs é bastante simples, idêntica à semântica correspondente de LMGs. Dado uma cadeia de predicado $A (α_{1}, . . ., α_{n})$ , onde os símbolos $α_{i}$ são cadeias finais, se há uma regra $A (x_{1}, . . ., x_{n}) \to β$ na gramática que corresponde à cadeia de predicado , a cadeia de predicado é substituida por $β$ , substituindo as variáveis correspondentes em cada $x_{i}$ .

Por exemplo, dada uma regra $A (x, a y b) \to B (a x b, y)$ , onde $x$ and $y$ são símbolos de variáveis e $a$ e $b$ são símbolos terminais, a cadeia de predicado $A (a, a b b)$ pode ser re-escrita como $B (a a b, b)$ , porque $A (a, a b b)$ corresponde a $A (x, a y b)$ onde $x = a, y = b$ . Da mesma forma, se houvesse uma regra $A (x, a y b) \to A (x, x) A (y, y)$ , $A (a, a b b)$ poderiamos re-escrever como $A (a, a) A (b, b)$ .

A prova/reconhecimento de uma cadeia $α$ é feita mostrando que $S (α)$ produz a cadeias vazia. Para os passos de re-escrita individuais, quando multiplas correspondecias alternativas de variáveis são possíveis, qualquer re-escrita que pode guiar a prova por inteiro é considerada.

Exemplo

RCGs são capazes de reconhecer uma linguagem de índice não-linear ${w w w : w \in {a, b}^{*}}$ como segue:

Sejam x, y, and z símbolos de variáveis:

$S (x y z) \to A (x, y, z)$

$A (a x, a y, a z) \to A (x, y, z)$

$A (b x, b y, b z) \to A (x, y, z)$

$A (ϵ, ϵ, ϵ) \to ϵ$

A prova para abbabbabb é então

$S (a b b a b b a b b) \Rightarrow A (a b b, a b b, a b b) \Rightarrow A (b b, b b, b b) \Rightarrow A (b, b, b) \Rightarrow A (ϵ, ϵ, ϵ) \Rightarrow ϵ$

Ou, usando a mais correta "notação pontuada" para intervalos:

$S (∙ a b b a b b a b b ∙) \Rightarrow A (∙ a b b ∙ a b b a b b, a b b ∙ a b b ∙ a b b, a b b a b b ∙ a b b ∙) \Rightarrow A (a ∙ b b ∙ a b b a b b, a b b a ∙ b b ∙ a b b, a b b a b b a ∙ b b ∙)$ $\Rightarrow A (a b ∙ b ∙ a b b a b b, a b b a b ∙ b ∙ a b b, a b b a b b a b ∙ b ∙) \Rightarrow A (ϵ, ϵ, ϵ) \Rightarrow ϵ$

References

Predefinição:Linguagens formais e gramáticas

[boullier1998-1] Predefinição:Citar livro

[boullier1999-2] Predefinição:Citar livro

[Kallmeyer2010-3] Predefinição:Citar livro citing http://mjn.host.cs.st-andrews.ac.uk/publications/2001d.pdf

[1]

[2]

[3]

Gramática de concatenação de intervalo

Índice

Descrição

Definição Formal

Reconhecimento de cadeias

Exemplo

References

Menu de navegação

Gramática de concatenação de intervalo

Descrição

Definição Formal

Reconhecimento de cadeias

Exemplo

References

Menu de navegação

Pesquisa