4 (Population-Based) Optimization (14pts)

Einleitung:

Diese Aufgabe befasst sich mit population-basierter Optimierung. Es wird eine spezielle Art der Optimierung vorgestellt, die als simplified firefly optimization (vereinfachte Glühwürmchen-Optimierung) bekannt ist. Im Folgenden werden die Definitionen erklärt, bevor konkrete Fragen dazu beantwortet werden.

Definition 6 (Optimization (shortened)):

Sei $X$ ein beliebiger Zustandsraum und $T$ eine Zielmenge mit totaler Ordnung $\leq$ . Eine totale Funktion $τ : X \to T$ wird als target function bezeichnet. Optimierung (Minimierung/Maximierung) bedeutet, nach einem $x \in X$ zu suchen, sodass $τ (x)$ optimal (minimal/maximal) ist. Wenn nichts anderes angegeben ist, wird von einer Minimierung ausgegangen.

Ein Optimierungslauf der Länge $g + 1$ ist eine Sequenz von Zuständen $(x_{t})_{0 \leq t \leq g}$ , wobei $x_{t} \in X$ für alle $t$ ist.

Sei $E : X \times (X \to T) \to X$ eine möglicherweise randomisierte oder nicht-deterministische Funktion, sodass der Optimierungslauf $(x_{t})_{0 \leq t \leq g}$ durch wiederholtes Anwenden von $E$ aufgerufen wird:

x_{t + 1} = E ((x_{u})_{0 \leq u \leq t}, τ) f \overset{u}{¨} r alle t, 1 \leq t \leq g,

wobei $x_{0}$ extern gegeben ist (z.B. $x_{0} = def 42$ ) oder zufällig ausgewählt wird (z.B. $x_{0} \sim X$ ). Ein Optimierungsprozess ist das Tupel $(X, T, τ, E, (x_{t})_{0 \leq t \leq g})$ .

Definition 7 (Population-based optimization):

Sei $X$ ein Zustandsraum. Sei $T$ eine Zielmenge mit totaler Ordnung $\leq$ . Sei $τ : X \to T$ eine Ziel-Funktion. Ein Tupel $E = (X, T, τ, E, (X_{t})_{0 \leq t \leq g})$ ist ein population-basierter Optimierungsprozess, wenn $X_{t} \subseteq P (X)$ eine Population von $N$ Individuen ist und $E : P (X)^{g} \times (X \to T) \to P (X)$ eine möglicherweise randomisierte, nicht-deterministische oder weiter parametrisierte Funktion ist, sodass der Optimierungsprozess $E$ durch wiederholtes Aufrufen von $E$ ausgeführt wird:

X_{t + 1} = E ((X_{u})_{0 \leq u \leq t}, τ)

wobei $X_{0}$ extern gegeben ist oder zufällig ausgewählt wird.

Algorithm 1 (Simplified Firefly Optimization):

Die vereinfachte Glühwürmchen-Optimierung basiert auf der Beobachtung, dass Glühwürmchen vom Licht anderer Glühwürmchen angezogen werden. Hierbei bedeutet ein stärkeres Licht, dass ein Glühwürmchen eine bessere Fitness oder Qualität hat. Glühwürmchen bewegen sich also in Richtung der “helleren” Glühwürmchen, um bessere Lösungen zu finden.

Algorithmus:

Sei $E = (X, T, τ, E, (X_{t})_{0 \leq t \leq g})$ ein population-basierter Optimierungsprozess. Wir nehmen an $X = [- 10, 10] \subseteq R$ und $T = [0, 100] \subseteq R$ für die Minimierung. Für $x \in / [- 10, 10]$ nehmen wir an, dass $τ (x) = \infty$ ist. Der Prozess $E$ folgt der vereinfachten Glühwürmchen-Optimierung, wenn $E$ definiert ist als:

E ((X_{t})_{0 \leq t \leq g}) = X_{t + 1} = {x_{t} + β \cdot (x_{t}^{*} - x_{t}) : x_{t} \in X_{t} mit τ (x_{t}) > τ (x_{t}^{*})} \cup {x_{t} : τ (x_{t}) \leq τ (x_{t}^{*})}

wobei $X_{t} = {x_{t}^{i}}_{i = 1}^{n}$ die Positionen von $n$ Glühwürmchen zur Zeit $t$ sind, $β$ ein fixer Schrittweitenparameter ( $β \in (0, 1] \subset R$ ), und $x_{t}^{*}$ das beste Individuum zur Zeit $t$ ist, d.h.:

x_{t}^{*} = ar g x \in X_{t} min τ (x)

(a) Erklärung:

Frage: Algorithm 1 basiert auf der Beobachtung, dass Glühwürmchen vom Licht anderer Glühwürmchen angezogen werden. Es wird angenommen, dass Glühwürmchen sich stärker in Richtung der helleren Glühwürmchen bewegen. Wie wird dieses Verhalten im Algorithmus dargestellt und welcher Wert im Algorithmus entspricht (vielleicht umgekehrt) der Lichtintensität? (4pts)

Antwort:

Die Anziehung zu stärkerem Licht wird durch den Positions-Update-Term dargestellt:

x_{t}^{i} \leftarrow x_{t}^{i} + β \cdot (x_{t}^{*} - x_{t}^{i})

Hierbei wird die Stärke durch den Parameter $β$ reguliert. Die Lichtintensität ist dabei umgekehrt proportional zum Zielwert $τ$ , d.h. Glühwürmchen bewegen sich in Richtung niedrigerer $τ$ -Werte, weil niedrigere $τ$ -Werte (bei einem Minimierungsproblem) eine bessere Fitness darstellen, was gleichbedeutend mit einer höheren Lichtintensität ist.

(b) Berechnung der Firefly Optimierung:

Frage: Sei die Ziel-Funktion $τ (x) = (x - 2)^{2}$ . Angenommen, wir haben die Startpositionen $X_{0} = {0, 4, 6}$ und den Schrittweitenparameter $β = 0.5$ . Führe die simplified firefly optimization für zwei Zeitschritte aus (d.h. berechne $X_{1}$ und $X_{2}$ ). Gib das globale Optimum von $τ$ an und ob es innerhalb von zwei Optimierungsschritten erreicht wird. (10pts)

Berechnung:

Startpositionen $X_{0}$ :
- Firefly 1: $x_{1} = 0$ mit $τ (x_{1}) = (0 - 2)^{2} = 4$
- Firefly 2: $x_{2} = 4$ mit $τ (x_{2}) = (4 - 2)^{2} = 4$
- Firefly 3: $x_{3} = 6$ mit $τ (x_{3}) = (6 - 2)^{2} = 16$
Wähle das beste Glühwürmchen: Das beste Glühwürmchen $x_{1}^{*} = x_{1} = 0$ , da $τ (x_{1}) = 4$ der niedrigste Wert ist.

Schritt 1 (Berechnung von $X_{1}$ ):

Firefly 1 und Firefly 2 bleiben an ihren Positionen, da $τ (x_{1}) = τ (x_{2}) = 4$ .
Firefly 3 bewegt sich in Richtung Firefly 1: $x_{3} \leftarrow x_{3} + β \cdot (x_{1} - x_{3}) = 6 + 0.5 \cdot (0 - 6) = 3$

Neue Positionen $X_{1}$ : $X_{1} = {0, 4, 3}$

Schritt 2 (Berechnung von $X_{2}$ ):

Firefly 1 bewegt sich in Richtung Firefly 3: $x_{1} \leftarrow x_{1} + β \cdot (x_{3} - x_{1}) = 0 + 0.5 \cdot (3 - 0) = 1.5$
Firefly 2 bewegt sich in Richtung Firefly 3:

\cdot (3 - 4) = 3.5 $$

Firefly 3 bleibt an seiner Position, da $τ (x_{3}) = 1$ der beste Wert ist.

Neue Positionen $X_{2}$ : $X_{2} = {1.5, 3.5, 3}$

Ergebnis:

Das globale Optimum $τ (x^{*}) = 0$ wird für $x^{*} = 2$ erreicht. Allerdings erreichen wir dieses Optimum nicht innerhalb der zwei Optimierungsschritte. Der beste Wert nach zwei Schritten ist $τ (x_{3}) = 1$ bei $x_{3} = 3$ .

Erklärung der Schritte:

Startpositionen: Zunächst werden die Startpositionen der Glühwürmchen berechnet und ihre Fitness-Werte basierend auf der Ziel-Funktion $τ (x) = (x - 2)^{2}$ bestimmt.
Wähle das beste Glühwürmchen: Das Glühwürmchen mit dem niedrigsten Fitness-Wert wird als das beste Glühwürmchen gewählt. Dies ist das Glühwürmchen, zu dem sich alle anderen Glühwürmchen bewegen.
Positionsupdate: Jedes Glühwürmchen, das nicht das beste ist, bewegt sich in Richtung des besten Glühwürmchens basierend auf der Formel für das Positionsupdate.
Zweite Iteration: Der Prozess wird wiederholt, und das Ergebnis wird erneut berechnet.

Zusammenfassend zeigt diese Simulation, dass das globale Optimum nicht innerhalb von zwei Optimierungsschritten erreicht wurde, aber die Glühwürmchen haben sich dem Optimum angenähert.

6 Evolutionary Computing (12pts)

In dieser Aufgabe betrachten wir ein evolutionäres Optimierungsproblem. Wir verwenden ein parallelogrammförmiges Gehege für Emus, das mithilfe eines evolutionären Algorithmus optimiert werden soll. Zuerst betrachten wir die Definition eines population-basierten Optimierungsalgorithmus und gehen dann zu einer speziellen Optimierungsaufgabe über.

Algorithm 2 (typical evolutionary algorithm):

Ein evolutionärer Algorithmus ist ein population-basierter Optimierungsprozess. Gegeben sei $E = (X, T, ϕ, E, (X_{u})_{0 \leq u \leq t})$ als population-based optimization process. Dieser Prozess verwendet folgende Operatoren:

Selection: Es gibt zwei Selektionsfunktionen:
- $σ_{N}^{survivors}$ : Wählt $N$ Individuen aus, die überleben.
- $σ_{N}^{parents}$ : Wählt $N$ Eltern-Individuen aus, die für die Rekombination verwendet werden.
Mutation: Die Mutationsfunktion verändert ein Individuum zufällig.
Recombination: Kombiniert zwei Eltern-Individuen, um ein neues Kind-Individuum zu erzeugen.
Migration: Ein optionaler Schritt, bei dem neue Individuen zur Population hinzugefügt werden.

Der Prozess $E$ setzt sich durch eine typische evolutionäre Optimierung fort, wenn $E$ definiert ist als:

E ((X_{u})_{0 \leq u \leq t}, ϕ) = X_{t + 1} = σ_{N}^{survivors} (X_{t}) \cup mutate_{M}^{ρ} (recombine^{σ_{2}^{parents} C} (X_{t})) \cup migrate^{N} (),

wobei $M$ die Anzahl der Mutanten, $C$ die Anzahl der Kinder und $H$ die Anzahl der Migranten in jeder Generation ist.

Aufgabenbeschreibung:

Wir starten einen Emu-Farm. Unsere Zoologen haben herausgefunden, dass Emus es vorziehen, in parallelogrammförmigen Gehegen zu leben. Wir haben 1000 Zaunstücke zur Verfügung, um ein ideales Parallelogramm zu bauen. Unser Ziel ist es, ein parallelogrammförmiges Gehege zu entwerfen, das sowohl das Vorliebenmodell der Emus als auch die physischen Einschränkungen berücksichtigt (z.B. die Anzahl der verfügbaren Zaunstücke).

Unsere Zoologen haben uns eine Funktion $μ$ bereitgestellt, die die Emu-Präferenz für ein bestimmtes Parallelogramm berechnet:

μ : N \times N \times A \to M

$l$ : Die Länge einer Seite des Parallelogramms in Zaunstücken.
$m$ : Die Länge der anderen Seite des Parallelogramms in Zaunstücken.
$α$ : Der Winkel zwischen den Seiten (in Grad).
$μ (l, m, α)$ gibt die Zufriedenheit der Emus in diesem Gehege an.

(a) Target function:

Frage: Gib eine totale Ziel-Funktion $τ : Z \times Z \times A \to R$ an, die die Präferenz der Emus maximiert, aber gleichzeitig Lösungen bestraft, die nicht genug Zaunstücke verwenden, um ein gültiges Parallelogramm zu bauen. Gib an, ob $τ$ maximiert oder minimiert wird. (6pts)

Lösung:

Um ein gültiges Parallelogramm zu bauen, müssen die Längen $l$ , $m$ und der Winkel $α$ bestimmten Bedingungen entsprechen. Die Gesamtanzahl der Zaunstücke darf maximal 1000 betragen. Die Ziel-Funktion $τ$ maximiert die Präferenz der Emus, bestraft aber ungültige Konfigurationen durch negative Werte:

τ (l, m, α) = {μ (l, m, α) - \infty wenn l \geq 1 \land m \geq 1 \land 2 l + 2 m \leq 1000, sonst .

Die Bedingung $2 l + 2 m \leq 1000$ stellt sicher, dass das Parallelogramm innerhalb der verfügbaren Zaunstücke gebaut wird.
Wenn diese Bedingung erfüllt ist, maximieren wir $μ (l, m, α)$ , die Emu-Präferenz.
Wenn die Bedingung nicht erfüllt ist, wird $τ = - \infty$ gesetzt, um diese Lösung unbrauchbar zu machen.

Interpretation:

Die Funktion $τ$ wird maximiert, da wir die Emu-Präferenz maximieren wollen.
Wenn ein Parallelogramm mit gültigen Maßen gebaut werden kann, maximieren wir $μ$ .
Wenn die Lösung ungültig ist, wird sie durch $- \infty$ bestraft.

(b) Beautiful recombination function:

Frage: Gib eine “schöne” Rekombinationsfunktion an, die auf zwei Lösungskandidaten $x_{1}, x_{2} \in X$ aufgerufen werden kann und die folgenden Eigenschaften besitzt: (6pts)

Das erzeugte Kind enthält Informationen von beiden Eltern.
Jede Information im Kind hat die gleiche Chance, von einem der beiden Elternteile zu stammen.
Wenn beide Eltern gültige Parallelogramme darstellen, dann ist auch das Kind ein gültiges Parallelogramm.

Lösung:

Die Rekombination kombiniert die Seitenlängen $l$ und $m$ sowie den Winkel $α$ der beiden Eltern zufällig, um ein Kind zu erzeugen, das gültig bleibt, wenn die Eltern gültige Parallelogramme darstellen.

recombine ((l_{1}, m_{1}, α_{1}), (l_{2}, m_{2}, α_{2})) = (l, m, α)

wobei:

$i \sim {1, 2}, j \sim {1, 2} ∖ {i}$ ,
$l = l_{i}$ , $m = m_{j}$ , $α = α_{j}$ .

Interpretation:

Die Seitenlängen $l$ und $m$ sowie der Winkel $α$ werden zufällig aus den beiden Eltern gewählt, sodass jede Eigenschaft die gleiche Wahrscheinlichkeit hat, von einem der Eltern zu stammen.
Wenn beide Eltern valide Parallelogramme darstellen (d.h. sie verwenden insgesamt nicht mehr als 1000 Zaunstücke), dann bleibt auch das Kind ein valides Parallelogramm.

Warum ist diese Rekombination “schön”?

Elterninformationen: Das Kind enthält Informationen von beiden Eltern, da $l$ , $m$ und $α$ aus verschiedenen Elternteilen zufällig ausgewählt werden.
Zufälligkeit: Jede Eigenschaft des Kindes hat die gleiche Chance, von einem der Eltern zu stammen, da $l$ , $m$ und $α$ zufällig von den Eltern übernommen werden.
Gültigkeit: Wenn beide Eltern valide Parallelogramme darstellen, bleibt auch das Kind ein valides Parallelogramm, da die Rekombination sicherstellt, dass die Seitenlängen und der Winkel von den Eltern übernommen werden.

Zusammenfassung:

Diese Aufgabe behandelt den Aufbau eines parallelogrammförmigen Geheges für Emus mithilfe eines evolutionären Algorithmus. Die Ziel-Funktion $τ$ maximiert die Zufriedenheit der Emus, während sie gleichzeitig Lösungen bestraft, die nicht die richtige Anzahl an Zaunstücken verwenden. Die Rekombinationsfunktion kombiniert Eigenschaften der Eltern, um sicherzustellen, dass das Kind sowohl valide als auch eine Mischung aus den Elterninformationen ist.

7 Mix-Up: Optimization for Soups (8pts)

Diese Aufgabe behandelt die Optimierung einer Suppe mithilfe eines simulierten Annealing-Algorithmus. Wir betrachten eine Situation, in der ein optimaler Zustand für die Suppe gefunden werden muss, und verwenden dazu das Konzept der Nachbarschaftsfunktion und eines simulierten Abkühlungsprozesses.

Algorithm 3 (Simulated Annealing):

Ein Simulated Annealing (SA) Algorithmus wird verwendet, um Optimierungsprobleme zu lösen. Gegeben sei $D = (X, T, τ, E, (x_{u})_{0 \leq u \leq t})$ als Optimierungsprozess. Wir definieren die Nachbarschaft $n e i g hb ors : X \to P (X)$ , die eine Menge von Nachbarn eines Zustands $x \in X$ liefert.

Zusätzlich wird eine Temperaturfunktion $k : N \to R$ eingeführt, die die Temperatur für jeden Zeitschritt bestimmt. Eine Funktion $A : T \times T \times R \to [0, 1]$ liefert die Akzeptanzwahrscheinlichkeit, gegeben durch zwei Zielwerte und eine Temperatur. Typischerweise verwenden wir:

A (Q (x), Q (x^{'}), k (t)) = e^{- \frac{Q ( x ^{'} ) - Q ( x )}{k ( t )}}

wobei $T \in R$ die Temperatur ist. Der Prozess setzt sich mittels Simulated Annealing fort, wenn $E$ definiert ist als:

x_{t + 1} = {x_{t}^{'} x_{t} wenn τ (x_{t}^{'}) \leq τ (x_{t}) oder τ (x_{t}^{'}) > τ (x_{t}) und r \leq A (τ (x_{t}), τ (x_{t}^{'}), k (t)), sonst .

wobei $x_{t}^{'} \sim n e i g hb ors (x_{t})$ zufällig ausgewählt wird und $r \sim P$ zufällig für jeden Aufruf von $E$ gezogen wird.

(a) Aufgabe:

Gegeben ist die Suppe $C^{'} = (X^{'}, R^{'}, A^{'})$ aus Aufgabe 5b. Für eine Australien-Ausstellung in unserem Zoo möchten wir einen optimalen Anfangszustand $X_{0}^{t}$ der Suppe wählen, sodass alle Aspekte der australischen Tierwelt (wie durch $C^{'}$ definiert) gezeigt werden können. Die Präferenzen für die Ausstellung sind in einer Ziel-Funktion $τ : X^{' t} \to R$ kodiert, die minimiert werden soll.

Lösung:

Um minimale Lösungen für $τ^{t}$ zu finden, möchten wir einen Optimierungsprozess $A = (X^{'}, R^{'}, τ^{t}, E, (x_{t})_{0 \leq t \leq g})$ verwenden, der mittels Simulated Annealing fortgesetzt wird. Wir geben den Zustandsraum $X^{'}$ für das Simulated Annealing und eine geeignete Funktion $n e i g hb ors$ an, sodass $A$ potenziell jeden möglichen Anfangszustand der Suppe aus jedem Anfangssuppenkandidaten erreichen kann, mit der richtigen Anzahl an Iterationen und Wahl der Parameter.

X^{'} = P (X)

Die Nachbarschaftsfunktion ist definiert als:

n e i g hb ors (X) = {X ∖ {x} : x \in X} \cup {X \cup {x} : x \in X} \cup {X \cup {kan g a roo (x)} : x \in X}

Erklärung:

Die Nachbarschaftsfunktion $n e i g hb ors (X)$ enthält drei Möglichkeiten:
- Entfernen eines Elements $x$ aus $X$ : Dies hilft, Kandidatenlösungen zu reduzieren.
- Hinzufügen eines Elements $x$ zu $X$ : Dies hilft, neue Elemente in die Lösung aufzunehmen.
- Hinzufügen eines “Kängurus” zur Suppe (rekursives Hinzufügen von Varianten): Dies fügt speziell australische Tiere hinzu, die für das Szenario von Bedeutung sind.

Diese Nachbarschaftsfunktion erlaubt es uns, über genügend Iterationen jeden möglichen Zustand zu erreichen, indem Elemente hinzugefügt oder entfernt werden.

(b) Nachbarschaftsfunktion und Komplexität:

Frage: Erkläre kurz, warum es viel komplexer ist, eine einfach ausführbare Nachbarschaftsfunktion für Suppen im künstlichen Chemieprozess $C^{'}$ aus Aufgabe 5b zu geben, als für die Suppen im künstlichen Chemieprozess $C$ aus Aufgabe 5a. (2pts)

Lösung:

Der Zustandsraum $X^{'}$ ist unendlich, daher ist das Sampling daraus (wie es im Simulated Annealing notwendig ist) nicht praktikabel oder sehr ineffizient (es würde beispielsweise viele Varianten von rekursiven Kängurus erzeugen). Im Vergleich dazu ist $X$ ein sehr kleiner, endlicher Zustandsraum, was das Sampling und die Anwendung der Nachbarschaftsfunktion viel einfacher und schneller macht.

Zusammenfassung:

In Teil (a) haben wir eine Nachbarschaftsfunktion definiert, die es ermöglicht, im Zustandsraum zu navigieren und potenziell jeden möglichen Suppenzustand zu erreichen.
In Teil (b) wurde die Komplexität des künstlichen Chemieprozesses $C^{'}$ im Vergleich zu $C$ erläutert. Der unendliche Zustandsraum von $X^{'}$ erschwert die einfache Anwendung der Nachbarschaftsfunktion, während $X$ durch seine Endlichkeit wesentlich einfacher zu handhaben ist.

🎓 MyUniNotes

Explorer

Exam - 2024 - NaCo

4 (Population-Based) Optimization (14pts)

Einleitung:

Definition 6 (Optimization (shortened)):

Definition 7 (Population-based optimization):

Algorithm 1 (Simplified Firefly Optimization):

Algorithmus:

(a) Erklärung:

Antwort:

(b) Berechnung der Firefly Optimierung:

Berechnung:

Schritt 1 (Berechnung von $X_{1}$ ):

Schritt 2 (Berechnung von $X_{2}$ ):

Ergebnis:

Erklärung der Schritte:

6 Evolutionary Computing (12pts)

Algorithm 2 (typical evolutionary algorithm):

Aufgabenbeschreibung:

(a) Target function:

Lösung:

(b) Beautiful recombination function:

Lösung:

Zusammenfassung:

7 Mix-Up: Optimization for Soups (8pts)

Algorithm 3 (Simulated Annealing):

(a) Aufgabe:

Lösung:

(b) Nachbarschaftsfunktion und Komplexität:

Lösung:

Zusammenfassung:

Graph View

Table of Contents

Backlinks

🎓 MyUniNotes

Explorer

Exam - 2024 - NaCo

4 (Population-Based) Optimization (14pts)

Einleitung:

Definition 6 (Optimization (shortened)):

Definition 7 (Population-based optimization):

Algorithm 1 (Simplified Firefly Optimization):

Algorithmus:

(a) Erklärung:

Antwort:

(b) Berechnung der Firefly Optimierung:

Berechnung:

Schritt 1 (Berechnung von X1​):

Schritt 2 (Berechnung von X2​):

Ergebnis:

Erklärung der Schritte:

6 Evolutionary Computing (12pts)

Algorithm 2 (typical evolutionary algorithm):

Aufgabenbeschreibung:

(a) Target function:

Lösung:

(b) Beautiful recombination function:

Lösung:

Zusammenfassung:

7 Mix-Up: Optimization for Soups (8pts)

Algorithm 3 (Simulated Annealing):

(a) Aufgabe:

Lösung:

(b) Nachbarschaftsfunktion und Komplexität:

Lösung:

Zusammenfassung:

Graph View

Table of Contents

Backlinks

Schritt 1 (Berechnung von $X_{1}$ ):

Schritt 2 (Berechnung von $X_{2}$ ):