Info

Wenn Sie Automaten angeben, tun Sie dies immer in Form eines Zustandsgraphen. Andere Formen der Darstellung (z.B. als Liste von Übergängen) werden nicht gewertet, da sie sehr viel aufwändiger zu korrigieren sind. Vergessen Sie nicht, im Zustandsgraph Start- und Endzustände zu markieren.

FSK3-1 Konstruktion von NFAs (2 Punkte)

Verwenden Sie in dieser Aufgabe nur NFAs ohne ε-Übergänge

a) Geben Sie einen NFA an, der die folgende Sprache $L$ über dem Alphabet $Σ = {a, b}$ akzeptiert:

L = {u v w ∣ v, w \in Σ^{*}, v \in {bab, aa}}

Wörter dürfen nicht auf pfad stehen, nur Buchstaben

graph LR
id-1(( )) --> id0((z0))
id0((z0)) --a,b--> id0((z0))
id0((z0)) --a,b--> id1((z1))
id1((z1)) --bab,aa--> id2(((z2)))
id2(((z2))) --a,b--> id2(((z2)))

b) Viele Programmiersprachen erlauben nur Variablennamen, die Regeln wie diese erfüllen:

Aufgabenstellung

Ein Variablenname kann Unterstriche, kleine und große Buchstaben (a–z, A–Z) und Ziffern enthalten.

Ein Variablenname muss mindestens ein Zeichen enthalten.

Ein Variablenname darf nicht mit einer Ziffer anfangen.

„_“ ist kein Variablenname.

Geben Sie einen NFA an, der genau die Variablennamen erkennt, die diesen Regeln folgen.

Für die Übersicht führe ich ein paar Variablen hinzu:

$c = Buchstaben (a-z,A-Z)$
$z = Ziffer$
$u = Unterstrich (_)$

graph LR
id-1(( )) --> id0(((z0)))
id0((z0)) --c--> id1(((z1)))
id1(((z1))) --c,z,u--> id1(((z1)))

id0((z0)) --u--> id2((z2))
 id2((z2)) --c,z,u--> id3(((z3)))
 id3(((z3))) --c,z,u--> id3(((z3)))

z0 kein Endzustand weil mindestens ein Wort drin sein muss
- Beispielname für z0: ""
z1 Endzustand Variablenname mit mindestens einem Buchstaben
- Beispielname für z1: “a” und danach rekursiv eventuell : “asdf123”
z2 kein Endzustand weil nur Unterstrich
- Beispielname für z2: ”_” → nicht erlaubt
z3 ist ein Endzustand, da unterstrich am Anfang aber danach Zeichen folgt
- Beispielname für z3: “_a” danach rekursiv “_asdf123”

c) Sei $n$ eine natürliche Zahl, $Σ_{n} = {0, \dots, n}$ und

Note

$L_{n} = {w \in Σ_{n}^{*} ∣ i \in Σ_{n}, #_{i} (w) = i}$
Das heißt, die Sprache $L$ enthält genau die Wörter $w$ , für die gilt: Es gibt eine Zahl $i \in {0, \dots, n}$ sodass das Wort $w$ das Symbol $i$ genau $i$ -mal enthält.

Z.B. ist $2012323 \in L_{3}$ , da dieses Wort genau 1-mal das Symbol 1 enthält. Ebenso ist $20311233 \in L_{3}$ , da dieses Wort genau 2-mal das Symbol 2 enthält. Hingegen ist $0112223 \in / L_{3}$ .

Geben Sie für jedes $n$ einen NFA $A_{n}$ an, der $L_{n}$ erkennt. Beschreiben Sie ausnahmsweise $A_{n}$ nicht durch einen Zustandsgraph, sondern geben Sie die Zustandsmenge, Start- und Endzustände und Übergänge (in Abhängigkeit von $n$ ) explizit an. Geben Sie außerdem den Zustandsgraph von $A_{3}$ an.

Gedankengang:

$2012323 \in L_{3}$ weil alle jede Ziffer kommt weniger als 2 mal vor $L_{3} = {0, 1, 2}$
$0112223 \in / L_{3}$ weil die 2 drei-mal vorkommt $3 \in / L_{3}$

Summary

Definition des NFA $A_{n}$

Für die Definition eines Nichtdeterministischen Endlichen Automaten (NFA), der die Sprache $L_{n}$ erkennt, gehen wir wie folgt vor:

Zustandsmenge:

Die Zustandsmenge $Q$ von $A_{n}$ besteht aus allen möglichen Zählerkonfigurationen für jedes Symbol in $Σ_{n}$ , die angeben, wie oft jedes Symbol bis zu einem bestimmten Punkt im Wort erschienen ist. Zusätzlich gibt es einen besonderen Startzustand $q_{0}$ und Fehlerzustände für unerlaubte Symbolzählungen.

Jeder Zustand $q$ in $Q$ kann durch ein Tupel $(c_{0}, c_{1}, \dots, c_{n})$ repräsentiert werden, wobei $c_{i}$ die Anzahl des Symbols $i$ in $Σ_{n}$ ist, das bis jetzt gelesen wurde. Jedes $c_{i}$ kann Werte von 0 bis $n$ annehmen, wobei Werte größer als $n$ zu einem Fehlerzustand führen.

Startzustand:

Der Startzustand ist $q_{0} = (0, 0, \dots, 0)$ , was bedeutet, dass noch kein Symbol gelesen wurde.

Akzeptierende Zustände:

Ein Zustand $(c_{0}, c_{1}, \dots, c_{n})$ ist ein akzeptierender Zustand, wenn genau eine der Zählungen $c_{i} = i$ ist und alle anderen $c_{j}$ (für $j \neq = i$ ) kleiner als $j$ sind. Das heißt, genau ein Symbol $i$ kommt genau $i$ -mal vor, und kein anderes Symbol kommt öfter vor, als es seine Ziffer erlaubt.

Übergänge:

Von jedem Zustand $(c_{0}, c_{1}, \dots, c_{n})$ gibt es einen Übergang zum Zustand $(c_{0}, c_{1}, \dots, c_{i} + 1, \dots, c_{n})$ beim Lesen des Symbols $i$ . Wenn $c_{i} + 1 > n$ , führt der Übergang in einen Fehlerzustand.

Fehlerzustände:

Fehlerzustände werden erreicht, wenn eine Zählung $c_{i}$ größer als $n$ wird. Alle Übergänge von Fehlerzuständen führen wieder in Fehlerzustände.

Zustandsgraph für $A_{3}$

Für den speziellen Fall von $n = 3$ erstellen wir einen Zustandsgraphen:

Zustände: Jeder Zustand ist ein Tupel $(c_{0}, c_{1}, c_{2}, c_{3})$ , wobei jedes $c_{i}$ von 0 bis 3 reichen kann. Zustände, in denen $c_{i} > i$ sind nicht Teil unseres Automaten.

Akzeptierende Zustände: Zustände wie $(0, 1, 0, 0)$ , $(0, 0, 2, 0)$ und $(0, 0, 0, 3)$ .

Startzustand: $(0, 0, 0, 0)$

Übergänge: Basierend auf der obigen Beschreibung.

Lassen Sie uns eine detaillierte grafische Darstellung des Nichtdeterministischen Endlichen Automaten $A_{3}$ erstellen, der die Sprache $L_{3}$ erkennt. Diese Visualisierung wird die Zustandsmenge, akzeptierende Zustände, Startzustand und Übergänge für $n = 3$ enthalten. Beachten Sie, dass ich zur Vereinfachung nur relevante Teile des Automaten zeige, da die vollständige Darstellung sehr umfangreich wäre.

Hier ist die grafische Darstellung von $A_{3}$ :

Zustandsgraph von $A_{3}$

Zustände:

Jeder Zustand ist ein Tupel $(c_{0}, c_{1}, c_{2}, c_{3})$ , wobei $c_{i}$ die Anzahl der Male darstellt, dass das Symbol $i$ gelesen wurde. Nur diejenigen Zustände, bei denen keine $c_{i}$ die Bedingung $c_{i} > i$ erfüllt, sind gültig.

Fehlerzustände sind solche, bei denen mindestens ein $c_{i} > i$ .

Startzustand:

Der Startzustand ist $(0, 0, 0, 0)$ .

Akzeptierende Zustände:

$(0, 1, 0, 0)$ : Symbol 1 kommt genau einmal vor.

$(0, 0, 2, 0)$ : Symbol 2 kommt genau zweimal vor.

$(0, 0, 0, 3)$ : Symbol 3 kommt genau dreimal vor.

Übergänge:

Von jedem Zustand $(c_{0}, c_{1}, c_{2}, c_{3})$ gibt es Übergänge zu $(c_{0} + 1, c_{1}, c_{2}, c_{3})$ , $(c_{0}, c_{1} + 1, c_{2}, c_{3})$ , $(c_{0}, c_{1}, c_{2} + 1, c_{3})$ und $(c_{0}, c_{1}, c_{2}, c_{3} + 1)$ beim Lesen der entsprechenden Symbole 0, 1, 2, bzw. 3. Übergänge, die zu ungültigen Zuständen führen, werden nicht gezeigt.

FSK3-2 Entfernen von $ϵ$ -Übergängen und Potenzmengenkonstruktion (2 Punkte)

a) Sei $A_{1}$ der folgende NFA über dem Alphabet ${a, b, c}$ :

graph LR
    start(( )) --> z0((Z0))
    z0((Z0)) -->|ε| z1((Z1))
    z0((Z0)) -->|a| z2((Z2))
    z1((Z1)) -->|b| z2((Z2))
    z2((Z2)) -->|c| z1((Z1))
    z2((Z2)) -->|ε| z3(((Z3)))
    z3(((Z3))) -->|ε| z0((Z0))

Aufgabenstellung

Geben Sie einen NFA $A_{1}^{'}$ ohne $ϵ$ -Übergänge mit $L (A_{1}^{'}) = L (A_{1})$ an. Verwenden Sie den Algorithmus zum Entfernen von $ϵ$ -Übergängen aus der Vorlesung. Geben Sie die Zwischenschritte Ihrer Berechnung an. Das erlaubt uns, Ihnen für Folgefehler Teiilpunkte zu geben.

Alle Knoten die von $z_{0}$ ausgehend mit dem leeren Wort erreicht werden können sind Startzustände und müssen behandelt werden. Dies ist nur bei $z_{1}$ der Fall.

Muss mit einem Zeichen aus $Σ$ beginnen und dann nur noch Epsilon Ketten. Kann von jedem Knoten Anfangen nicht nur von Startzuständen.

$ϵ$ - Übergänge implizieren nicht das $ϵ$ in der Sprache ist

z_{0} \to a z_{2} z_{2} \to ϵ z_{3} z_{3} \to ϵ z_{0} z_{0} \to ϵ z_{1}

Kann vereinfacht werden zu:

z_{0} \to a z_{2} z_{0} \to a z_{3} z_{0} \to a z_{0} z_{0} \to a z_{1}

Da der Pfad mit mit $z_{0} \to a z_{2}$ beginnt, darf $z_{0} \to ϵ z_{1}$ zu $z_{0} \to a z_{1}$ vereinfacht werden

Nun das gleiche für $z_{1}$

z_{1} \to b z_{2} z_{2} \to ϵ z_{3} z_{3} \to ϵ z_{0} z_{0} \to ϵ z_{1}

Kann vereinfacht werden zu:

z_{1} \to b z_{2} z_{1} \to b z_{3} z_{1} \to b z_{0} z_{1} \to b z_{1}

Leeren Knoten zu Z0 un Z1 sind Startknoten

graph LR
    start(( )) --> z0((Z0))
	    z0((Z0)) --a-->z2((Z2))
	    z0((Z0)) --a-->z3(((Z3)))
	    z0((Z0)) --a-->z0((Z0))
	    z0((Z0)) --a-->z1((Z0))
	start2(( )) --> z1((Z1))
	    z1((Z1)) --b-->z2((Z2))
	    z1((Z1)) --b-->z3(((Z3)))
	    z1((Z1)) --b-->z0((Z0))
	    z1((Z1)) --b-->z1((Z1))
	z2((Z2)) --c-->z1((Z1))

b) Der folgende NFA $A_{2}$ über einem Alphabet $Σ = {a, e, u}$ kann verwendet werden, um in einem Text nach den Zeichenfolgen $a e$ und $u e$ zu suchen.

graph LR
    start(( )) --> z0((Z0))
    z0((Z0)) -->|Σ| z0((Z0))
    z0((Z0)) -->|a| z1((Z1))
    z1((Z1)) -->|e| z2(((Z2)))
    z0((Z0)) -->|u| z3((Z3))
    z3((Z3)) -->|e| z4(((Z4)))

Aufgabenstellung

Die Suche wird wesentlich beschleunigt, wenn wir $A_{2}$ in einen DFA umwandeln. Verwenden Sie deshalb die Potenzmengenkonstruktion, um einen DFA $A_{2}^{'}$ mit $L (A_{2}^{'}) = L (A_{2})$ zu konstruieren. Geben Sie außer dem Zustandsgraph von $A_{2}^{'}$ auch die Rechenschritte an, die Sie bei der Potenzmengenkonstruktion ausgeführt haben. Das erlaubt uns, Ihnen bei Folgefehlern noch Teilpunkte zu geben.

Start	$\to$	Ziel
${0}$	$a$	${0, 1}$
${0}$	$u$	${0, 2}$
${0}$	$Σ \ {a, u}$	${0}$
${0, 1}$	$a$	${0, 1}$
${0, 1}$	$u$	${0, 3}$
${0, 1}$	$e$	${0, 2}$
${0, 1}$	$Σ \ {a, u}$	${0}$
${0, 3}$	$a$	${0, 1}$
${0, 3}$	$u$	${0, 3}$
${0, 3}$	$e$	${0, 4}$
${0, 3}$	$Σ \ {a, u}$	${0}$
${0, 2}$	$a$	${0, 1}$
${0, 2}$	$u$	${0, 3}$
${0, 2}$	$Σ \ {a, u}$	${0}$
${0, 4}$	$a$	${0, 1}$
${0, 4}$	$u$	${0, 3}$
${0, 4}$	$Σ \ {a, u}$	${0}$

graph TD
    start(( )) --> q0{{"0"}}
    q0 -->|a| q01{{"0, 1"}}
    q0 -->|u| q03{{"0, 3"}}
    q0 -->|"Σ \ {a, u}"| q0

    q01 -->|a| q01
    q01 -->|u| q03
    q01 -->|e| q02{{"0, 2"}}
    q01 -->|"Σ \ {a, u, e}"| q0

    q03 -->|a| q01
    q03 -->|u| q03
    q03 -->|e| q04{{"0, 4"}}
    q03 -->|"Σ \ {a, u, e}"| q0

    q02 -->|a| q01
    q02 -->|u| q03
    q02 -->|"Σ \ {a, u}"| q0

    q04 -->|a| q01
    q04 -->|u| q03
    q04 -->|"Σ \ {a, u}"| q0

Ich werde den Inhalt des Bildes, das eine Textseite zum Thema Tokenizer zeigt, in Markdown-Format umwandeln, wobei mathematische Ausdrücke in LaTeX (mit $ für Inline und $$ für Display-Modus) und Code in Code-Blöcke eingefügt werden.

FSK3-3 Tokenizer

Aufgabenstellung
Ein Einsatzgebiet für endliche Automaten sind Tokenizer. Diese werden verwendet, um den Quelltext einer Programmiersprache in syntaktische Einheiten (Tokens) zu zerlegen. Ein Token ist beispielsweise ein Schlüsselwort, ein Bezeichner oder ein Operator.

Zum Beispiel wird das Programm
if (x==y) {z=x;}
zerlegt in
"if" "(" "x" "==" "y" ")" "{" "z" "=" "x" "}" ";"
In dieser Aufgabe erstellen wir einen Tokenizer, indem wir die möglichen Tokens als reguläre Sprache auffassen.

a) Um alle Schritte sinnvoll per Hand rechnen zu können, arbeiten wir mit einem reduzierten Alphabet ( $Σ$ statt $Σ$ oder {}, weniger Buchstaben aus dem Alphabet, nur eine Ziffer, …):

Σ = \{a, x, o, [, ], -, '\,'\}

Um das erste Token aus einem String zu identifizieren, wird A vom Anfang des Strings aus laufen gelassen. Wenn der Lauf nie in einen Endzustand kommt, meldet der Tokenizer einen Fehler. Ansonsten wird die letzte Position, in welcher der Automat in einem Endzustand war, als Token-Ende genommen.

Zum Beispiel ist bei Eingabe $^{'} == aa [^{'}$ der Lauf

q_{0} \to = q_{2} \to = q_{2} \to a q_{m} \to a q_{m} \to [q_{m}

Da $q_{2}$ akzeptierend ist (aber $q_{m}$ nicht), ist das erkannte Token $^{'} = =^{'}$ .

Notieren Sie bei folgenden Strings die Zustände, die A bei Verarbeitung dieser Strings annehmen wird (die Läufe) und geben Sie je die Ausgabe des Tokenizers an. Bezüglich der Ausgabe reicht es, sofern der Tokenizer keinen Fehler zurückgibt, nur das erste erkannte Token anzugeben.

aa==aa:

Pfad: $q_{0} \to a q_{4} \to a q_{4} \to = q_{5} \to = q_{m} \to a q_{m} \to a q_{m}$
Erkanntes Token: aa

a[0]:

Pfad: $q_{0} \to a q_{4} \to [q_{m} \to 0 q_{m} \to] q_{m}$
Erkanntes Token: a

a[[[[]:

Pfad: $q_{0} \to a q_{4} \to [q_{m} \to [q_{m} \to [q_{m} \to [q_{m} \to [q_{m} \to] q_{m}$
Erkanntes Token: a

”a[0]“ax”:

Pfad: $q_{0} \to " q_{5} \to a q_{5} \to [q_{5} \to 0 q_{5} \to] q_{7} \to " q_{5} \to a q_{5} \to x q_{7}$
Erkanntes Token: "a[0]"ax"

”a=[0]“ax”:

Pfad: $q_{0} \to " q_{5} \to a q_{5} \to = q_{m} \to [q_{m} \to 0 q_{m} \to] q_{m} \to " q_{m} \to a q_{m} \to x q_{m}$
Kein erkannter Token: Fehler

”a[0]“a=x”:

Pfad: $q_{0} \to " q_{5} \to a q_{5} \to [q_{5} \to 0 q_{5} \to] q_{7} \to " q_{5} \to a q_{m} \to = q_{m} \to x q_{m}$
Erkannter Token: "a[0]"

b) Bestimmen Sie asymptotisch (in O-Notation), wie viele Schritte der Tokenizer Automat braucht, um ein Token aus einem String der Länge $n$ zu extrahieren

O(n), da die Verarbeitung von einem Zeichen ( O(1) ) ist und zweimal über den String gelaufen werden muss: Einmal zur Verarbeitung des Strings und einmal bei der Suche nach dem letzten Zustand, der ein Endzustand ist. (Man kann sich den jeweils letzten Endzustand natürlich auch merken, dann muss man nur einmal über den String laufen. Das ändert aber an der asymptotischen Laufzeit nichts.)

c) Um mehrere Tokens zu extrahieren, wird das gefundene Token von dem String entfernt und wieder von vorne ein Token gesucht. Wenn der verbleibende String leer ist, ist der Tokenizer fertig.

Beispiel: Bei der oben genannten Eingabe aa[ mit dem ersten Token , ist der Reststring nach dem Entfernen aa[, das zweite Token dann also aa.

Zerlegen Sie mit diesem Algorithmus den String a=“ax0”aa[0]=a in alle Tokens.

String: `a:="ax0"aa[0]=a`

Automat für `a:="ax0"aa[0]=a`

Pfad: $q_{0} \to a q_{4} \to : q_{7} \to " q_{m} \to a q_{m} \to x q_{m} \to 0 q_{m} \to " q_{m} \to a q_{m} \to a q_{m} \to [q_{m} \to 0 q_{m} \to] q_{m} \to = q_{m} \to a q_{m}$
Token: a
Reststring: "ax0"aa[0]=a

Automat für `:="ax0"aa[0]=a`

Pfad: $q_{0} \to : q_{2} \to = q_{m} \to " q_{m} \to a q_{m} \to x q_{m} \to 0 q_{m} \to " q_{m} \to a q_{m} \to a q_{m} \to [q_{m} \to 0 q_{m} \to] q_{m}$
Token: :=
Reststring: "ax0"aa[0]=a

Automat für `"ax0"`

Pfad: $q_{0} \to " q_{5} \to a q_{5} \to x q_{5} \to 0 q_{5} \to " q_{7}$
Token: "ax0"
Reststring: aa[0]=a

Automat für `aa`

Pfad: $q_{0} \to a q_{4} \to a q_{4} \to [q_{m} \to 0 q_{m} \to] q_{m} \to = q_{m} \to a q_{m}$
Token: aa
Reststring: [0]=a

Automat für `[`

Pfad: $q_{0} \to [q_{1} \to 0 q_{m} \to] q_{m} \to = q_{m} \to a q_{m}$
Token: [
Reststring: 0]=a

Weitere Token

0
- Pfad: $q_{0} \to 0 q_{3} \to] q_{m} \to = q_{m} \to a q_{m}$
- Token: 0
- Reststring: ]=a
]
- Pfad: $q_{0} \to] q_{1} \to = q_{m} \to a q_{m}$
- Token: ]
- Reststring: =a
=
- Pfad: $q_{0} \to = q_{2} \to a q_{m}$
- Token: =
- Reststring: a

Abschluss

a
- Pfad: $q_{0} \to a q_{4}$
- Token: a
- Reststring: \epsilon

Liste der Tokens:

", =, "ax0", aa, [, 0, ], =, a

d) Tatsächlich müssen wir den String nicht verändern, sondern, wenn ein Token gefunden wurde, nur den Automaten an der nächsten Position im String starten. Wir „kürzen“ den String also in $O (1)$ . Wie viele Schritte brauchen wir dann asymptotisch, um alle Tokens aus einem String der Länge $n$ zu finden?

Hinweis

Es ist nicht $O (n)$ . Man könnte das Verfahren aber optimieren, um eine Laufzeit von $O (n)$ zu erreichen

Um alle Tokens in einem String der Länge $n$ zu finden, indem wir einen Automaten verwenden, der an jeder Position im String startet, betrachten wir die folgenden Schritte:

Initialisierung: Der Automat startet an der Position 0 im String.
Durchlauf: Für jede Position $i$ im String (von 0 bis $n - 1$ ) startet der Automaten neu und versucht, ein Token zu erkennen.
Token-Erkennung: Sobald ein Token erkannt wird, wird der Automat an der nächsten Position im String gestartet. Die Länge des erkannten Tokens kann variieren.
Ende: Der Prozess endet, wenn der Automat an einer Position kein Token mehr erkennen kann oder das Ende des Strings erreicht ist.

Analyse der Laufzeit:

In jedem Schritt startet der Automat neu und durchläuft den Teilstring, der beginnt an der aktuellen Position bis zum Ende des Strings. Die maximale Anzahl von Schritten, die der Automat in einem Durchlauf machen kann, ist proportional zur Länge des Strings, also $O (n)$ für jeden Startpunkt.
Da der Automat an jeder von $n$ Positionen im String startet, beträgt die Gesamtzahl der Schritte $n \times O (n) = O (n^{2})$ .

Optimierung (Zusatz)

Optimierung: Um die Laufzeit auf $O (n)$ zu optimieren, können wir folgende Techniken anwenden:

Überlappende Durchläufe vermeiden: Anstatt den Automaten jedes Mal von vorne zu starten, können wir den verbleibenden Teil des Strings nach dem Erkennen eines Tokens weiterverarbeiten. Dies bedeutet, dass der Automat direkt an der Stelle fortsetzt, an der das letzte Token endete.

Vorverarbeitung des Strings: Durch die Verwendung von Datenstrukturen wie Suffixbäumen oder Suffixarrays können wir die Suche nach Tokens effizienter gestalten, da diese Strukturen es ermöglichen, schnell zu überprüfen, ob ein bestimmter Teilstring ein gültiges Token ist.

Durch die Anwendung dieser Optimierungen können wir die Anzahl der benötigten Schritte auf $O (n)$ reduzieren, was eine effiziente Lösung für das Problem darstellt.

FSK3-4 Umgedrehte Sprache (0 Punkte)

Aufgabenstellung

Sei $T$ die Funktion, die aus einem NFA $A = (Z, Σ, δ, S, E)$ einen NFA $T (A) = (Z, Σ, δ_{0}, E, S)$ erzeugt, wobei $p \in δ_{0} (q, a) \Leftrightarrow q \in δ (p, a)$ .

a) Automaten $B = T (A)$ berechnen

Gegeben ist der folgende Automat ( A ):

graph LR
start(( ))--> q0((q0))
q0((q0)) --a,b--> q0((q0))
q0((q0)) --a-->q1((q1))
q1((q1)) --a,b-->q2((q2))
q2((q2)) --a,b-->q3(((q3)))

Automat B:

graph LR
start(( ))--> q3((q3))
q0((q0)) --a,b--> q0((q0))
q3((q3)) --a,b-->q2((q2))
q2((q2)) --a,b-->q1((q1))
q1((q1)) --a-->q0(((q0)))

b) Geben Sie einen DFA C mit L(B) = L(C) an. (Sie dürfen die Potenzmengenkonstruktion nutzen, müssen aber nicht.)

Fast wie in b), aber $q_{1}$ benötigt noch einen ausgehenden Übergang mit $b$ . Darum Müllzustand hinzufügen.

graph LR
start(( ))--> q3((q3))
q0((q0)) --a,b--> q0((q0))
q3((q3)) --a,b-->q2((q2))
q2((q2)) --a,b-->q1((q1))
q1((q1)) --a-->q0(((q0)))
q1((q1)) --b-->qm(((qm)))
qm(((qm))) --a,b--> qm(((qm)))

c) Zeigen Sie: Für jeden NFA $A$ ist $L (T (A)) = {\overline{w} ∣ w \in L (A)}$ . Dabei steht $w$ wie in der Vorlesung für das rückwärts gelesene Wort $w$ .

Wir zeigen für alle $q, p \in Z$ und alle $w \in Σ^{*}$ :

q \in δ (p, w) ⟺ p \in δ^{'} (q, w)

durch Induktion über die Länge $∣ w ∣$ . Zur Erinnerung: Für $X \subseteq Z, a \in Σ, w \in Σ^{*}$ und $z \in Z$ gilt

δ (X, ϵ) = X, δ (X, a w) = δ (z \in X ⋃ δ (z, a), w), δ^{'} (z, w) := δ^{'} ({z}, w)

Basis:

$w = ϵ$ : Die Definition von $δ$ liefert sofort $δ (q, ϵ) = {q} = δ^{'} (q, ϵ)$

Schritt:

$a_{1} \cdot \dots \cdot a_{n} \to a_{1} \cdot \dots \cdot a_{n + 1}$ :

q g.d.w. g.d.w. g.d.w. g.d.w. \in \hat{δ} (p, a_{n + 1} \cdot \dots \cdot a_{1}) \exists z \in Z : z \in δ (p, a_{n + 1}) \land q \in \hat{δ} (z, a_{n} \cdot \dots \cdot a_{1}) \exists z \in Z : z \in δ (p, a_{n + 1}) \land z \in \hat{δ^{'}} (q, a_{1} \cdot \dots \cdot a_{n}) \exists z \in Z : p \in δ^{'} (z, a_{n + 1}) \land z \in \hat{δ^{'}} (q, a_{1} \cdot \dots \cdot a_{n}) p \in \hat{δ^{'}} (q, a_{1} \cdot \dots \cdot a_{n + 1}) (Definition von \hat{δ}) (mit IH) (Definition von δ^{'}) (Definition von δ^{'})

Schließlich zeigen wir die Behauptung:

\overline{w} g.d.w. g.d.w. g.d.w. \in L (A) \exists q \in E, p \in S : q \in \hat{δ} (p, \overline{w}) \exists q \in E, p \in S : p \in \hat{δ^{'}} (q, w) w \in L (T (A)) (mit Gleichung (1))

Erklärung

Der gegebene Beweis zeigt die Äquivalenz der Sprachen eines nichtdeterministischen endlichen Automaten (NFA) $A$ und seines transformierten Automaten $T (A)$ . Die Transformation besteht darin, die Übergangsfunktion $δ$ so zu ändern, dass sie Wörter rückwärts akzeptiert. Hier wird gezeigt, dass das Rückwärtslesen eines Wortes in $A$ dem Vorwärtslesen in $T (A)$ entspricht.

Der Beweis nutzt eine Induktion über die Länge eines Wortes $w$ und verwendet eine umgekehrte Übergangsfunktion $δ^{'}$ , die im rückwärts transformierten Automaten $T (A)$ verwendet wird. Der Hauptansatz besteht darin, die Äquivalenz der Übergänge zwischen den Zuständen in $A$ und $T (A)$ für alle Zustände $q, p \in Z$ und alle Wörter $w \in Σ^{*}$ zu zeigen.

Basisfall

Der Basisfall betrachtet das leere Wort $ϵ$ . Die Übergangsfunktion $δ$ eines jeden NFA definiert, dass $δ (q, ϵ) = {q}$ . Da $δ^{'}$ analog definiert ist, gilt auch $δ^{'} (q, ϵ) = {q}$ . Damit ist der Basisfall bestätigt: Für das leere Wort bleibt man im gleichen Zustand, sowohl in $A$ als auch in $T (A)$ .

Induktionsschritt

Im Induktionsschritt wird die Behauptung von Wörtern der Länge $n$ auf Wörter der Länge $n + 1$ erweitert. Wir betrachten ein Wort $a_{n + 1} \cdot \dots \cdot a_{1}$ . Der Beweis geht davon aus, dass der Übergang von einem Zustand $p$ zu einem Zustand $q$ in $A$ mittels des Wortes $a_{n + 1} \cdot \dots \cdot a_{1}$ einem Übergang in $T (A)$ entspricht, wenn das Wort $a_{1} \cdot \dots \cdot a_{n + 1}$ betrachtet wird. Durch die Induktionshypothese und die Definition der Übergangsfunktion $δ^{'}$ wird gezeigt, dass diese beiden Übergänge äquivalent sind.

Zusammenfassung des Beweises

Der Beweis schließt mit dem Nachweis, dass ein Wort $w$ von $A$ akzeptiert wird, wenn und nur wenn das rückwärts gelesene Wort $\overline{w}$ von $T (A)$ akzeptiert wird. Dies geschieht durch den Zusammenhang der anfänglichen und endgültigen Zustände und deren Erreichbarkeit über die Übergangsfunktionen $δ$ und $δ^{'}$ .

Durch diesen Beweis wird etabliert, dass $L (T (A)) = {\overline{w} ∣ w \in L (A)}$ gilt. Dies bedeutet, dass die Sprache von $T (A)$ genau aus den umgekehrten Wörtern der Sprache von $A$ besteht, was zeigt, dass das Rückwärtslesen der Wörter in $A$ äquivalent zum Vorwärtslesen in $T(A) ist.

🎓 MyUniNotes

Explorer

FSK-ÜB-3

FSK3-1 Konstruktion von NFAs (2 Punkte)

a) Geben Sie einen NFA an, der die folgende Sprache L über dem Alphabet Σ={a,b} akzeptiert:

b) Viele Programmiersprachen erlauben nur Variablennamen, die Regeln wie diese erfüllen:

c) Sei n eine natürliche Zahl, Σn​={0,…,n} und

Definition des NFA An​

Zustandsmenge:

Startzustand:

Akzeptierende Zustände:

Übergänge:

Fehlerzustände:

Zustandsgraph für A3​

Zustandsgraph von A3​

FSK3-2 Entfernen von ϵ-Übergängen und Potenzmengenkonstruktion (2 Punkte)

a) Sei A1​ der folgende NFA über dem Alphabet {a,b,c}:

b) Der folgende NFA A2​ über einem Alphabet Σ={a,e,u} kann verwendet werden, um in einem Text nach den Zeichenfolgen ae und ue zu suchen.

FSK3-3 Tokenizer

a) Um alle Schritte sinnvoll per Hand rechnen zu können, arbeiten wir mit einem reduzierten Alphabet (Σ statt Σ oder {}, weniger Buchstaben aus dem Alphabet, nur eine Ziffer, …):

aa==aa:

a[0]:

a[[[[]:

”a[0]“ax”:

”a=[0]“ax”:

”a[0]“a=x”:

b) Bestimmen Sie asymptotisch (in O-Notation), wie viele Schritte der Tokenizer Automat braucht, um ein Token aus einem String der Länge n zu extrahieren

c) Um mehrere Tokens zu extrahieren, wird das gefundene Token von dem String entfernt und wieder von vorne ein Token gesucht. Wenn der verbleibende String leer ist, ist der Tokenizer fertig.

String: a:="ax0"aa[0]=a

Automat für a:="ax0"aa[0]=a

Automat für :="ax0"aa[0]=a

Automat für "ax0"

Automat für aa

Automat für [

Weitere Token

Abschluss

Liste der Tokens:

FSK3-4 Umgedrehte Sprache (0 Punkte)

a) Automaten B=T(A) berechnen

Automat B:

b) Geben Sie einen DFA C mit L(B) = L(C) an. (Sie dürfen die Potenzmengenkonstruktion nutzen, müssen aber nicht.)

c) Zeigen Sie: Für jeden NFA A ist L(T(A))={w∣w∈L(A)}. Dabei steht w wie in der Vorlesung für das rückwärts gelesene Wort w.

Basis:

Schritt:

Schließlich zeigen wir die Behauptung:

Basisfall

Induktionsschritt

Zusammenfassung des Beweises

Graph View

Table of Contents

Backlinks

a) Geben Sie einen NFA an, der die folgende Sprache $L$ über dem Alphabet $Σ = {a, b}$ akzeptiert:

c) Sei $n$ eine natürliche Zahl, $Σ_{n} = {0, \dots, n}$ und

Definition des NFA $A_{n}$

Zustandsgraph für $A_{3}$

Zustandsgraph von $A_{3}$

FSK3-2 Entfernen von $ϵ$ -Übergängen und Potenzmengenkonstruktion (2 Punkte)

a) Sei $A_{1}$ der folgende NFA über dem Alphabet ${a, b, c}$ :

b) Der folgende NFA $A_{2}$ über einem Alphabet $Σ = {a, e, u}$ kann verwendet werden, um in einem Text nach den Zeichenfolgen $a e$ und $u e$ zu suchen.

a) Um alle Schritte sinnvoll per Hand rechnen zu können, arbeiten wir mit einem reduzierten Alphabet ( $Σ$ statt $Σ$ oder {}, weniger Buchstaben aus dem Alphabet, nur eine Ziffer, …):

b) Bestimmen Sie asymptotisch (in O-Notation), wie viele Schritte der Tokenizer Automat braucht, um ein Token aus einem String der Länge $n$ zu extrahieren

String: `a:="ax0"aa[0]=a`

Automat für `a:="ax0"aa[0]=a`

Automat für `:="ax0"aa[0]=a`

Automat für `"ax0"`

Automat für `aa`

Automat für `[`

a) Automaten $B = T (A)$ berechnen

c) Zeigen Sie: Für jeden NFA $A$ ist $L (T (A)) = {\overline{w} ∣ w \in L (A)}$ . Dabei steht $w$ wie in der Vorlesung für das rückwärts gelesene Wort $w$ .