Un alfabet (\(\Sigma\)) és un conjunt finit d’elements (símbols), habitualment caràcters alfanumèrics.
Un mot és una llista de símbols d’un alfabet. El mot buit (llista de longitud 0) el denotarem amb el meta-símbol \(\lambda\). Utilitzarem \(u\), \(v\), \(w\), \(u_1\), … per denominar paraules.
\(\Sigma = \{a, b\}\)
Paraules: ab, bbb, a, \(\lambda\)
Longituds: |ab|=2, |bbb|=3, |a|=1, |\(\lambda\)|=0
Extenem la notació de les longituds per a occurències d’un mot dins d’un altre: \(|u|_w\)
\(|ab|_a=1\), \(|bbb|_b=3\), \(|bbb|_{bb}=2\)
Per referir-nos al símbol i-éssim del mot u utilitzarem: u[i]
ab[1] = a, ab[2] = b
Amb la operació producte (\(u\cdot v\) o \(uv\)) representem la concatenació de dues paraules. Per exemple:
\((ab)\cdot(bbb) = abbbb\)
Element neutre: \(u\cdot\lambda=\lambda\cdot u=u\)
Associativitat: \(u\cdot(v\cdot w)=(u\cdot v)\cdot w\)
Amb \(\Sigma^*\) representem el conjunt de tots els mots possibles que podem construir amb l’alfabet \(\Sigma\). Exemple per a \(\Sigma = \{a, b\}\):
\(\Sigma^*={\lambda, a, b, aa, ab, ba, bb, …}\)
Un llenguatge sobre l’alfabet \(\Sigma\) és un subconjunt qualsevol \(L^* \subseteq \Sigma^*\). Per exemple:
-
Paraules sobre l’alfabet {a, b} i de longituds múltiples de 2:
\(\{w \in \{a, b\}^* / |w| \in \dot{2}\} = \{\lambda, aa, ab, ba, bb, aaaa, …\}\) -
Paraules amb algun símbol «a»:
\(\{w \in \{a,b\}^* / \exists w_1,w_2 : w = w_1aw_2\} = \{w \in \{a, b\}^* / |w|_a \ge 1\}\) -
Paraules tals que tota ocurrència d’«a» ve seguida d’una occurència de «b»:
\(\{w \in \{a,b\}^* / \forall w_1, w_2 : (w=w_1aw_2 \Rightarrow \exists w_2^1 : w_2 = bw_2^1) = \)
\( = \{w \in \{a, b\}^* / |w|_{aa}=0\land(w=\lambda \lor \exists w’ : w=w’b)\}\)
Denotem el llenguatge que conté només el mot buit amb \(\Lambda=\{\lambda\}\) (\(\Lambda \neq \emptyset\)).
Definim la concatenació de dos llenguatges:
\(L_1\cdot L_2 = \{w_1\cdot w_2 / w_1 \in L_1 \land w_2 \in L_2\}=\) \(\{w / \exists w_1 \in L_1, w_2 \in L_2 : (w=w_1w_2)\}\)
Exemples:
\(\{a,bb\}\cdot\{b,ba\} = \{ab, aba, bbb, bba\}\)
Element neutre: \(\Lambda\cdot L = L \cdot \Lambda = L\)
No funciona amb el conjunt buit: \(\emptyset\cdot L=L\cdot \emptyset = \emptyset\)
Associativitat: \(L_1(L_2L_3)=(L_1L_2)L_3\)
Definim l’exponenciació de paraules:
\(w^n=w\cdot w\cdot \cdot\cdot\cdot \cdot w\)
Exemples:
\(w^2=ww\) \(w^1=w\) \(w^0=\lambda\)
Es compleix que: \(w^n=w\cdot w^{n-1}\), \(n\ge 1\).
Ídem per a l’exponenciació de llenguatges.
Definim també l’operació \(L^*\) (clausura de Kleene) d’un llenguatge. Aquesta dóna com a resultat un nou llenguatge que conté aquelles paraules que es poden obtenir a base d’escollir un nombre finit de paraules d’L i concatenar-les.
\(
\begin{array}{ll}L^*
& = \{w_1\cdot w_2\cdot \cdot\cdot\cdot \cdot w_n / w_1, w_2, …, w_n \in L\} \\
& = \{L^0\cup L^1\cup L^2\cup …\}\\
& = \prod_{n=0}^{\infty}L^n\\
\end{array}
\)
(Les paraules d’\(L^*\) són concatencions de 0, 1, 2, … paraules d’L.)
Per exemple:
\(\{a\}^* = \{\lambda, a, aa, aaa, …\}\)
\(\{ab\}^* = \{\lambda, ab, abab, ababab, …\}\)
\(\{a, bb\}^* = \{\lambda, a, bb, aa, abb, bba, bbbb, …\}\)
\(\{w\in\{a,b\}^* / |w| \in \dot{2}\}^* = \{w\in\{a,b\}^* / |w| \in \dot{2}\}\)
De forma semblant definim l’operació \(L^+\), la qual no obliga a incloure el mot buit.
\(L^+ = L^1\cup L^2\cup…\)
\(L^* = L^+ \cup \{\lambda\}\)
\(\lambda \in L^+ \Leftrightarrow \lambda \in L\)
Denominem el revessat d’un mot \(w\): \(w^R\). Exemple:
\((aabab)^R=babaa\)
El revessat de la concatenació de dues paraules correspon al revessat de les dues paraules:
\((uv)^R=v^Ru^R\)
També tenim el revessat d’un llenguatge:
\(L^R = \{w^R / w \in L\} = \{w | w^R \in L\}\)
\((L_1L_2)^R=L_2^RL_1^R\)
Per exemple:
\(\{aw | w \in \{a, b\}^*\}^R = \{wa | w \in \{a,b\}^*\}\)
Definim un morfisme com una funció que transforma paraules d’un alfabet a un altre:
\(\sigma: \Sigma_1^* \rightarrow \Sigma_2^*\)
Commutativa amb la concatenació: \(\sigma(uv) = \sigma(u)\sigma(v)\)
\(\sigma(a_1a_2\cdot\cdot\cdot a_n)=\sigma(a_1)\sigma(a_2)\cdot\cdot\cdot\sigma(a_n)\)
\(\sigma(\lambda)=\lambda\)
Gràcies a la commutativitat, tenim prou per definir un morfisme amb definir la imatge dels símbols de l’alfabet, ja que llavors l’imatge de qualsevol mot es pot calcular en termes de les imatges dels símbols.
Per exemple:
\(\sigma: \{a, b, c\}^* \rightarrow \{0, 1\}^*\)
\(\sigma(a) = 0\), \(\sigma(b)=11\), \(\sigma(c)=\lambda\)
\(\begin{array}{ll}
\sigma(accbacb)
& = \sigma(a)\sigma(c)\sigma(c)\sigma(b)\sigma(a)\sigma(c)\sigma(b) \\
& = 0\lambda\lambda110\lambda11 \\
& = 011011
\end{array}
\)
Per a un llenguatge L:
\(\sigma: \Sigma_1^* \rightarrow \Sigma_2^*\)
\(L \subseteq \Sigma_1^*\) \(\sigma(L)=\{\sigma(w) / w \in L\}\)
\(L \subseteq \Sigma_2^*\) \(\sigma^{-1}(L) = \{w / \sigma(w) \in L\}\)
\(\sigma(L_1L_2) = \sigma(L_1)\sigma(L_2)\)
Una regla de reescriptura (o substitució) és un parell de paraules \(u\rightarrow v\). Per exemple, la regla \(ab \rightarrow bba\) substitueix tota ocurrència d’«ab» per «bba».
Representem una substitució de la forma \(w_1uw_2 \rightarrow_{u\rightarrow v} w_1vw_2\). Per exemple:
\(a\underline{ab}ab \rightarrow_{ab\rightarrow bba} a\underline{bba}ab\)
Si R és un conjunt de regles, podem indicar que \(w\) es transforma en \(w’\)…
\(w\rightarrow_R w’\) | \(w\rightarrow_R^* w’\) | \(w\rightarrow_R^+ w’\) | \(w\rightarrow_R^i w’\) |
aplicant 1 regla d’R | aplicant 0 o mes substitucions amb regles d’R | aplicant 1 o més substitucions amb regles d’R | aplicant \(i\) substitucions amb regles d’R |
Aquests apunts estan basats en els vídeos de Teoria de la Computació de Guillem Godoy (UPC).
No comments
© Siegfried-Angel Gevatter Pujals, 2011. |
Permalink |
License |
Post tags: formal-grammar, language-theory, theory-of-computation, universitat