5.2 Endliche Automaten

Grammatiken erlauben es uns, gewisse Formate zu beschreiben. Das reicht uns aber nicht: wir wollen Daten parsen, im engen Sinne also eine grammatische Ableitung rekonstruieren und allgemein die Struktur eines gegebenen Wortes herausarbeiten. Ein bescheideneres Ziel ist es, für ein gegebenes Wort zu entscheiden, ob es sich überhaupt aus einer Grammatik ableiten lässt. Für reguläre Grammatiken gibt es hierfür die endlichen Automaten. Sie können endliche Automaten verstehen als ein eingeschränktes Modell eines Rechners; oder als Blaupause für einen effizienten Algorithmus, um reguläre Grammatiken zu parsen.

Hier sehen Sie ein Beispiel für einen endlichen Automaten über dem Alphabet $Σ = {x, y, z}$ . Die Idee ist, dass der Automat ein Wort $α$ Zeichen für Zeichen einliest. Die Pfeile zwischen den Kreisen (den Zuständen des Automaten) zeigen an, in welchen neuen Zustand beim Lesen eines Zeichen gewechselt werden muss. Der Pfeil "aus dem Nichts", hier der von links nach $S$ , zeigt den Startzustand an, in welchem der Automat beginnt.

Um zu zeigen, wie der Automat ein Eingabewort verarbeitet, nehmen wir das Beispiel $α = y x z x x y y$ .

In diesem Beispiel endet der Automat im Zustand $Y$ . Sie sehen, dass der Zustand $X$ mit einem doppelten Rand markiert ist: dies symbolisiert, dass $X$ ein akzeptierender Endzustand ist. Wenn der Automat ein Wort $α$ abgearbeitet hat, akzeptiert er es, wenn er in einem akzeptierenden Endzustand gelandet ist; ansonsten lehnt er es ab. In unserem Beispiel sehen wir also, dass der Automat das Eingabewort $y x z x x y y$ ablehnt.

Definition 5.2.1 (Endlicher Automat, Finite State Machine). Ein endlicher Automat besteht aus einem endlichen Eingabealphaet

Σ

, einer endlichen Menge

Q

von Zuständen, einem Startzustand

q_{s t a r t} \in Q

, einer Menge

F \subseteq Q

von akzeptierenden Endzuständen und einer Zustandsübergangsfunktion

\begin{array}{r} δ : Q \times Σ \to Q . \end{array}

Formal gesehen ist also ein Automat ein Quintupel

M = (Σ, Q, q_{s t a r t}, F, δ)

Die Idee ist, dass der Automat im Zustand $q_{s t a r t}$ startet und nun in jedem Schritt ein weiteres Zeichen des Eingabewortes liest. Wenn er im Zustand $q$ ist und das Zeichen $x$ liest, so wechselt er in den Zustand $δ (q, x)$ . Statt $δ (q, x) = q^{'}$ verwenden wir die leichter zu lesende Schreibweise $q \overset{x}{\to} q^{'} .$ Wenn das Wort zu Ende ist, dann akzeptiert der Automat, wenn er in einem akzeptierenden Zustand angekommen ist, also in $F$ .

Beispiel 5.2.2 Betrachten wir den endlichen Automaten

und stellen ihn gemäß Definition 4.2.1 als Quintupel

M = (Σ, Q, q_{s t a r t}, F, δ)

dar mit

\begin{aligned} Σ & = {x, y, z} \\ Q & = {S, X, Y} \\ q_{s t a r t} & = S \\ F & = {X} . \end{aligned}

Um noch die Zustandsübergangsfunktion $δ$ darzustellen, müssen wir uns überlegen, wie wir Funktionen überhaupt darstellen. Da $δ$ eine endliche Funktion ist, können wir einfach alle Eingabewert-Ausgabewert-Paare hinschreiben, am Besten in einer Tabelle, so wie wir es bereits bei Booleschen Funktionen mit Wahrheitstabellen getan haben. $δ$ ist also

\begin{array}{r} \begin{array}{ccc} q & σ & δ (q, x) \\ S & x & X \\ S & y & S \\ S & z & S \\ X & x & X \\ X & y & Y \\ X & z & S \\ Y & x & Y \\ Y & y & Y \\ Y & z & Y \end{array} \end{array}

Da die Funktion $δ$ bei jedem endlichen Automaten genau zwei Eingabeparameter hat, können wir es eventuell übersichtlicher als zweidimensionale Tabelle darstellen:

\begin{array}{r} \begin{array}{cccc} x & y & z \\ S & X & S & S \\ X & X & Y & S \\ Y & Y & Y & Y \end{array} \end{array}

Diese zwei Tabellen dienen in diesem Beispiel aber nur dazu, noch einmal zu illustrieren, was ich damit meine, wenn ich sage, dass $δ$ eine Funktion von $Q \times Σ$ nach $Q$ ist. Wenn Sie selbst an endlichen Automaten rumbasteln, empfehle ich Ihnen, die Funktion $δ$ graphisch mit Kreisen und Pfeilen darzustellen, so wie wir es oben getan haben:

Das ist eine völlig legitime Notation für eine Funktion $δ : Q \times Σ \to Q$ und genau so formal wie die Tabellenschreibweise.

Definition 5.2.3 (Erweiterte Zuständsübergangsfunktion). Für einen endlichen Automaten

(Σ, Q, q_{s t a r t}, F, δ)

definieren wir die erweiterte Zustandsübergangsfunktion

\hat{δ} : Q \times Σ^{*} \to Q

rekursiv wie folgt:

\begin{aligned} \hat{δ} (q, ϵ) & = q \\ \hat{δ} (q, x α) & = \hat{δ} (δ (x), α) . \end{aligned}

\hat{δ} (q, α) = q^{'}

heißt also, dass der Automat, wenn er sich im Zustand

q

befindet und das Wort

α

abarbeitet, er danach im Zustand

q^{'}

landet. Wir schreiben auch kompakt

q \overset{α}{\to} q^{'} .

Definition 5.2.4 (Akzeptierte Sprache). Sei

M = (Σ, Q, q_{s t a r t}, F, δ)

ein endlicher Automat. Die von

M

akzeptierte Sprache ist

\begin{array}{r} L (M) := {α \in Σ | \hat{δ} (q_{s t a r t}, α) \in F} . \end{array}

Beispiel 5.2.5 Der endliche Automat, den wir oben bereits eingeführt haben:

akzeptiert die Sprache aller

α \in {x, y, z}

, die auf

x

enden und nicht die Buchstabenfolge

x y

enthalten.

Übungsaufgabe 5.2.1 Ändern Sie den Automaten aus dem letzten Beispiel so ab, dass die Bedingung "die auf $x$ enden" entfällt, er also alle Wörter akzeptiert, die die Folge

x y

nicht enthalten.

Übungsaufgabe 5.2.2 Zeichnen Sie einen Automaten für die Sprache aller Wörter über

{a, b, c, d}

, die die Folge

a, b, c, d

enthalten.

Übungsaufgabe 5.2.3 Zeichnen Sie einen Automaten für die Sprache aller Wörter über

{a, b, c, d}

, die genau vier

a

enthalten.

Endliche Automaten zu regulären Grammatiken

Wenn wir einen endlichen Automaten gegeben haben, dann können wir leicht eine entsprechende reguläre Grammatik dazu bauen, indem wir alle Pfeile einfach in Produktionen übersetzen. Für den Automaten

würde dies beispielsweise die folgenden Produktionen ergeben:

\begin{aligned} S & \to y S | z S | x X \\ X & \to x X | z S | y Y \\ Y & \to x Y | y Y | z Y \end{aligned}

und, weil

X

ein akzeptierender Zustand ist,

\begin{aligned} X & \to ϵ \end{aligned}

Dies geht ganz allgemein:

Theorem 5.2.6 Sei

M = (Σ, Q, q_{s t a r t}, F, δ)

ein endlicher Automat. Dann gibt es eine reguläre Grammatik

G = (Σ, N, P, S)

mit

L (G) = L (M)

Wir nehmen dies als Anlass, um mal wieder einen Induktionsbeweis im Detail durchzuführen.

Beweis. Wir setzen

N = Q

und

S = q_{s t a r t}

und führen für jeden Zustandsübergang, der von

δ

beschrieben wird, eine Ableitungsregel ein:

\begin{aligned} q_{1} \overset{x}{\to} q_{2} & wird zur Produktion q_{1} \to x q_{2} \end{aligned}

Hiermit erhalten wir eine "Zwischengrammatik"

G^{'}

. Die endgültige Grammatik

G

erhalten wir, indem wir für jeden akzeptierenden Zustand

q \in N

die Produktion

\begin{array}{r} q \to ϵ \end{array}

einführen. Wir zeigen nun per Induktion:

Behauptung 5.2.7 Sei

α \in Σ^{*}

und

q, q^{'} \in Q

. Dann gilt

q \overset{α}{\to} q^{'}

genau dann, wenn

q \Rightarrow^{*} α q^{'}

in Grammatik

G^{'}

gilt.

Bevor wir diese Behauptung beweisen, achten Sie auf die Bedeutung der Symbole. Der einfache Pfeil in $q \overset{α}{\to} q^{'}$ beschreibt die Arbeitsweise des endlichen Automaten, dass nämlich das Verarbeiten von $α$ den Automaten vom Zustand $q$ in den Zustand $q^{'}$ führt. Der doppelte Pfeil in $q \Rightarrow^{*} α q^{'}$ sagt aus, dass aus dem Nichtterminalsymbol $q$ in der Grammatik $G$ in möglicherweise mehreren Schritten die Wortform $α q^{'}$ abgeleitet werden kann. Der Pfeil $\to$ "lebt" also im Automaten $M$ , der Pfeil $\Rightarrow^{*}$ lebt in der Grammatik $G^{'}$ .

Beweis. Wir verwenden Induktion über die Länge des Wortes

α

Induktionsbasis. Wenn $α = ϵ$ gilt, also $α$ die Länge 0 hat, dann gilt $q \overset{ϵ}{\to} q^{'}$ genau dann, wenn $q = q^{'}$ ist. Wie kann nun $q \Rightarrow^{*} ϵ q^{'}$ in $G^{'}$ gelten? Beachten Sie, dass jede Produktion in $G^{'}$ ein Terminalsymbol erzeugt; $q \Rightarrow^{*} ϵ q^{'}$ kann also nur gelten, wenn keine Produktion erfolgt ist und somit $q = q^{'}$ gilt. Wir sehen: beide Aussagen sind äquivalent zu $q = q^{'}$ und somit auch äquivalent zueinander.

Induktionsschritt. Wenn $α$ die Länge $n + 1$ hat, so schreiben wir $α = x β$ für ein Wort $β \in Σ^{*}$ der Länge $n$ . Per Induktionshypothese können wir nun davon ausgehen, dass für alle $q_{1}, q_{2} \in Q$ die Aussage $q_{1} \overset{β}{\to} q_{2}$ genau dann gilt, wenn $q_{1} \Rightarrow^{*} β q_{2}$ gilt. Unser Ziel ist es, zu zeigen, dass die beiden folgenden Aussagen äquivalent sind:

$q \overset{x β}{\to} q^{'}$ im endlichen Automaten $M$ ,
$q \Rightarrow^{*} x β q^{'}$ in der Grammatik $G^{'}$ .

Wir müssen beide Richtungen zeigen, also zeigen, dass aus Aussage (1) die Aussage (2) folgt und umgekehrt.

Aus (1) folgt (2). Nehmen wir also an, dass $q \overset{x β}{\to} q^{'}$ gilt und bezeichnen $q_{1} := δ (q, x)$ . Es gilt also $q \overset{x}{\to} q_{1} \overset{β}{\to} q^{'}$ Der erste Teil, also $q \overset{x}{\to} q_{1}$ , bedeutet, dass wir in $G^{'}$ die Produktion $q \to x q_{1}$ eingeführt haben. Auf den zweiten Teil, also $q_{1} \overset{β}{\to} q^{'}$ , können wir die Induktionshypothese anwenden und schließen, dass $q_{1} \Rightarrow^{*} β q^{'}$ gilt. Nun können wir mit dem Nichtterminal $q$ beginnen, die Produktion $q \to x q_{1}$ anwenden und dann mit $q_{1}$ fortfahrend die Wortform $β q^{'}$ ableiten, also $q \Rightarrow x q_{1} \Rightarrow^{*} x β q^{'} .$ Dies zeigt die erste Richtung.

Aus (2) folgt (1). Nun nehmen wir an, dass $q \Rightarrow^{*} x β q^{'}$ gilt. Untersuchen wir die erste Produktion, die in dieser Ableitung verwendet worden ist. Alle Produktionen in $G^{'}$ erzeugen ein Terminalsymbol, also muss es eine Produktion der Form $q \to x q_{1}$ gewesen sein. Die Ableitung hat also die Form $\begin{array}{r} q \Rightarrow x q_{1} \Rightarrow^{*} x β q^{'}, \end{array}$ wir können also aus $q_{1}$ die Wortform $β q^{'}$ ableiten: $q_{1} \Rightarrow^{*} β q^{'}$ . Auf diese Erkenntnis wenden wir die Induktionshypothese an und schließen, dass $q_{1} \overset{β}{\to} q^{'}$ gilt. Die Produktionsregel $q \to x q_{1}$ kann nur in $G^{'}$ eingeführt worden sein, weil $δ (q, x) = q_{1}$ , also $q \overset{x}{\to} q_{1}$ . Somit sehen wir, dass $q \overset{x}{\to} q_{1} \overset{β}{\to} q^{'}$ gilt, also zusammengenommen $q \overset{x β}{\to} q^{'}$ . Dies zeigt die zweite Richtung.

Hiermit endet der Induktionsbeweis.

◻

Wir haben nun die Behauptung bewiesen. Als nächstens betrachten wir die Grammatik $G$ und behaupten, dass $L (G) = L (M)$ gilt. Sei $α \in Σ$ , dann behaupten wir also, dass wir folgenden zwei Aussagen äquivalent sind:

$q_{s t a r t} \overset{α}{\to} q^{'}$ für einen Zustand $q^{'} \in F$ ,
$q_{s t a r t} \Rightarrow^{*} α$ in Grammatik $G$ .

Wenn nun also $q_{s t a r t} \overset{α}{\to} q^{'}$ gilt und $q^{'} \in F$ , dann wissen wir von der obigen Behauptung, dass es in $G^{'}$ die Ableitung $q_{s t a r t} \Rightarrow^{*} α q^{'}$ gibt. Da $q^{'} \in F$ ist, enthält $G$ die Produktion $q^{'} \to ϵ$ , und somit können wir in $G$ die Ableitung $q_{s t a r t} \Rightarrow^{*} α q^{'} \Rightarrow α$ machen.

In der anderen Richtung, wenn $q_{s t a r t} \Rightarrow^{*} α$ in Grammatik $G$ gilt, dann betrachten wir den letzten Ableitungsschritt. Da $α$ keine Nichtterminalsymbole enthält, muss im letzten Ableitungsschritt ein Nichtterminalsymbol verschwunden sein. Die einzigen Produktionen in $G$ bei denen das Nichtterminal verschwindet, sind von der Form $q^{'} \to ϵ$ , wenn $q^{'}$ im Automaten $M$ ein akzeptierender Endzustand ist. Sei nun also $q^{'} \to ϵ$ die Produktion, die im letzten Ableitungsschritt angewendet worden ist. Es gilt also $q_{s t a r t} \Rightarrow^{*} α q^{'} \Rightarrow α$ . Beachten Sie nun weiter, dass all jene Produktionen, die in $G$ aber nicht in $G^{'}$ sind, die Form $q^{'} \to ϵ$ haben, also das Nichtterminalsymbol verschwinden lassen; es kann in einer Ableitung also nur eine solche Produktion angewandt worden sein, und das ganz zum Schluss. Das heißt: die Ableitung $q_{s t a r t} \Rightarrow^{*} α q^{'}$ verwendet ausschließlich $G^{'}$ -Produktionen. Somit können wir die oben gezeigte Behauptung anwenden und folgern, dass $q_{s t a r t} \overset{α}{\to} q^{'}$ gilt. Dies ist genau Punkt 1, den wir zeigen wollten. $◻$

Beachten Sie, dass dieser Beweis eigentlich gar nicht so schwierig ist, wie er hier aussieht. Ich habe ihn absichtlich sehr formal und ausführlich geschrieben, um Ihnen das Prinzip des Induktionsbeweises ins Gedächtnis zu rufen.

Übungsaufgabe 5.2.4 Schreiben Sie zu folgendem Automaten über dem Alphabet

Σ = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}

eine äquivalente reguläre Grammatik:

und beschreiben Sie die Sprache in eigenen Worten.

Reguläre Grammatiken zu endlichen Automaten?

Im letzten Abschnitt haben wir gesehen, wie wir zu einem gegebenen endlichen Automaten recht einfach eine äquivalente reguläre Grammatik schreibne können. Es drängt sich die Frage auf: geht das auch umgekehrt? Versuchen wir es. Zu jedem "Grammatik-Pfeil" $X \to a Y$ bauen wir uns einen "Automaten-Pfeil" $X \overset{a}{\to} Y$ .

Beispiel 5.2.8 Betrachten wir die reguläre Grammatik aus dem vorherigen Kapitel 4.1:

\begin{aligned} S & \to ϵ | a S | b T \\ T & \to ϵ | b T . \end{aligned}

Versuchen wir, daraus einen endlichen Automaten zu bauen. Als Zustandsmenge nehmen wir die Menge nichtterminaler Symbole ${S, T}$ , als Startzustand das Startsymbol $S$ . Zustandsübergänge ergeben sich aus den Produktionsregeln, wobei wir für Produktionen der Form $A \to ϵ$ den Zustand $A$ zu einem Endzustand machen. Also:

Wie Sie sehen, ist das nicht ganz korrekt. Als erstes fällt ins Auge, dass alle Zustände akzeptierende Endzustände sind. Als zweites fällt uns auf, dass es bei $T$ für das Eingabesymbol $a$ keinen ausgehenden Pfeil gibt. Der Funktionswert $δ (T, a)$ ist also undefiniert. Der Grund hierfür ist, dass, wenn erst mal ein $b$ vorgekommen ist, eben kein $a$ mehr vorkommen darf. Die Definition eines endlichen Automaten verlangt aber, dass $δ$ eine Funktion ist, also für alle Eingabewerte definiert ist. Wir lösen das, indem wir einen sogenannten Fehlerzustand (Trap State) einführen, der im Prinzip den Zustand lehne das Wort ab, egal, was noch kommt versinnbildlicht:

Dies ist nun unser endlicher Automat

M

mit

L (M) = L (G)

Beispiel 5.2.9 Betrachten wir die reguläre Grammatik aus dem vorherigen Kapitel 4.1:

\begin{aligned} A & \to 0 A | 1 A | 1 B \\ B & \to 0 C | 1 C \\ C & \to 0 D | 1 D \\ D & \to 0 E | 1 E \\ E & \to ϵ \end{aligned}

Wobei wir aus dem vorherigen Beispiel lernen und einen Fehlerzustand einführen:

Leider ist diese Lösung auch nicht korrekt: jetzt gibt es zu viele Pfeile! Aus dem Zustand $A$ gehen zwei Pfeile mit $1$ beschriftet hinaus. Wenn wir uns vor Augen halten, was die von $G$ erzeugte Sprache ist, so wird das Problem klarer: $G$ erzeugt die Sprache aller Wörter über ${0, 1}$ , deren viertletztes Zeichen eine 1 ist. Die Herausforderung ist nun: wenn der Automat eine 1 liest, dann weiß er nicht, ob das jetzt schon das viertletzte Zeichen ist oder nicht; er weiß also nicht, ob er im Zustand $A$ bleiben soll oder weiter zum Zustand $B$ gehen soll.

Um mit Fällen wie dem eben geschilderten umgehen zu können, erweitern wir die Definition des endlichen Automaten in nächsten Kapitel zu einem nichtdeterministischen endlichen Automaten.