diff --git a/Semester_2/Einheit_04/Grundlagen-Probabilistische_Algorithmen.ipynb b/Semester_2/Einheit_04/Grundlagen-Probabilistische_Algorithmen.ipynb new file mode 100644 index 0000000000000000000000000000000000000000..38cce4ed5c496d423627b12b7a513c115a26f8e3 --- /dev/null +++ b/Semester_2/Einheit_04/Grundlagen-Probabilistische_Algorithmen.ipynb @@ -0,0 +1,700 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "id": "e7ac2738-e0bb-4c7f-a03f-10fa7ec5b71e", + "metadata": { + "tags": [] + }, + "source": [ + "# <font color='blue'>**Probabilistische Algorithmen**</font>\n", + "\n", + "## **<font color='blue'>Zufallszahlen</font>** \n", + "\n", + "Die Abbildung der Zufälligkeit in einem Algorithmus wird durch die Nutzung von **Zufallszahlen** realisiert. Leider sind Zufallszahlen auf einem **deterministischen Computer** nicht wirklich zufällig, deshalb spricht man auch von Pseudo-Zufallszahlen. \n", + "Üblicherweise werden Zufallszahlen in Form von Folgen generiert, deren Wertebereich durch die verwendeten Datentypen begrenzt ist. \n", + "Bei gleichen **Startbedingungen** ergeben sich jedoch immer die gleichen Zahlenfolgen. \n", + "Solche Zahlenfolgen sollten grundsätzlich immer im Hinblick auf ihre Verteilung - z.B. Gleichverteilung - überprüft werden. \n", + "\n", + "### **<font color='blue'>Lineares Modulo-Kongruenzverfahren}</font>** \n", + "\n", + "Ein Standardverfahren zur Bestimmung von Zufallszahlen \n", + "ist das lineare Modulo-Kon\\-gru\\-enz\\-verfahren (LCM). \n", + "Hier ist die Zahlenfolge durch die Rekursion \n", + "\n", + "\\begin{equation}\n", + "\\begin{split}\n", + "x _{n+1} \\;=\\; & (\\;a \\; x_n + c \\;) \\;\\text{mod}\\; m \\\\\n", + "&\\text{mit} \\;\\; m > 0\\;, \\;\\;\\; 2<a<m \\;\\;\n", + "\\text{und}\\;\\; 0 \\leq c < m \\;\\;\\;\n", + "\\text{sowie}\\;\\;\\; m, a, c \\in \\mathbb{N}\n", + "\\end{split}\n", + "\\end{equation}\n", + "\n", + "definiert. Die aus einem Startwert $x_0$ \n", + "entstehenden Folgen besitzen die Periodenlänge $m$\n", + "und enthalten die Zahlen $ 0, ..., m-1 $.\n", + "Oftmals wird $ m = 2^b $ gesetzt, wobei $b$ die \n", + "Wortlänge des verwendeten Datentyps ist. \n", + "Als wichtige Bedingungen für eine Gleichverteilung \n", + "dürfen $c$ und $m$ keine gemeinsamen Primfaktoren haben, \n", + "was durch die Wahl einer großen Primzahl entweder \n", + "für $c$ oder für $m$ gewährleistet wird, \n", + "und $a-1$ muss ein Vielfaches des Produkts der Primfaktoren von $m$ sein.\n", + "\n", + "Als einfaches Beispiel sei hier die Folge angegeben für \n", + "\n", + "\\begin{equation}\n", + "\\begin{split}\n", + "a = 13 = & (2 \\cdot 2 \\cdot 3+1) , \\;\\; c = 1, \\;\\; \n", + "m = 16 = (2 \\cdot 2 \\cdot 2 \\cdot 2) \\;\\;\\;\n", + "\\text{und}\\;\\;\\; x_0 = 0 \\;\\; : \\\\ \\\\\n", + "\\rightarrow \\;\\;\\; & 0, 1, 14, 7, 12, 13, 10, 3, 8, 9, 6, 15, 4, 5, 2, 11,\\;\\;\\; 0, 1, 14, 7, \\; ... \\\\\n", + "\\end{split}\n", + "\\end{equation}\n", + "\n", + "Man erkennt die Periodizität nach $m=16$ Zahlen und \n", + "die Tatsache, dass jede Zahl des Wertebereichs \n", + "je Peridode genau einmal auftritt. \n", + "\n", + "Eine Klassen-Implementierung könnte wie folgt mit $a = 526 \\; (=3*5*5*7+1)$, $c = 121441 $ (Primzahl) und $m = 7441875 \\; (=3*3*3*3*3*5*5*5*5*7*7)$\n", + "aussehen: \n" + ] + }, + { + "cell_type": "code", + "execution_count": 50, + "id": "4900139a-9b1e-4ea0-a06b-7c1a75d55f1a", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "data": { + "text/plain": [ + "[0.0625,\n", + " 0.875,\n", + " 0.4375,\n", + " 0.75,\n", + " 0.8125,\n", + " 0.625,\n", + " 0.1875,\n", + " 0.5,\n", + " 0.5625,\n", + " 0.375,\n", + " 0.9375,\n", + " 0.25,\n", + " 0.3125,\n", + " 0.125,\n", + " 0.6875,\n", + " 0.0,\n", + " 0.0625,\n", + " 0.875,\n", + " 0.4375,\n", + " 0.75]" + ] + }, + "execution_count": 50, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "class Random:\n", + "\n", + " def __init__( self, seed, m=526, a=121441, c=7441875 ):\n", + " self.current = seed\n", + " self.m = m\n", + " self.a = a \n", + " self.c = c \n", + " \n", + " def random(self):\n", + " self.current = ( self.a * self.current + self.c ) % self.m\n", + " return self.current / self.m\n", + "\n", + "rand = Random(0,m=16,a=13,c=1,) \n", + "[rand.random() for i in range(20)]" + ] + }, + { + "cell_type": "markdown", + "id": "e4cb460b-a786-48c7-8b4c-9ea8e006b406", + "metadata": {}, + "source": [ + "\n", + "Für viele Programmiersprachen stehen aber auch Bibliotheksfunktionen zur Verfügung. \n", + "Die **Python-Funktion** `random.seed(a=None)` initialisiert den \n", + "Zufallszahlengenerator mit dem seed-Wert `a`, während der wiederholte Aufruf von \n", + "random.random() die eigentliche Folge liefert." + ] + }, + { + "cell_type": "code", + "execution_count": 51, + "id": "9617f503-227d-488b-b20b-529bb1f2d506", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[0.8444218515250481, 0.7579544029403025, 0.420571580830845, 0.25891675029296335, 0.5112747213686085, 0.4049341374504143, 0.7837985890347726, 0.30331272607892745, 0.4765969541523558, 0.5833820394550312]\n" + ] + } + ], + "source": [ + "import random\n", + "random.seed(a=0)\n", + "print( [random.random() for i in range(10)] )" + ] + }, + { + "cell_type": "markdown", + "id": "dfe9c6f0-fef8-4359-8b4b-79be71e091f1", + "metadata": { + "tags": [] + }, + "source": [ + "Möchte man Zufallszahlen im Intervall $[a,b)$ erzeugen, so empfiehlt es sich die Operation \n", + "\n", + "\n", + " x = a + (b-a) * random()\n", + "\n", + "auszuführen. Wichtig ist hierbei, \n", + "dass bei den Operationen alle Operanden\n", + "Gleitkommazahlen sind." + ] + }, + { + "cell_type": "code", + "execution_count": 3, + "id": "41915ab5-da68-403b-8bb2-f6120aeb24e1", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[16.88772796878589, 19.093176751828867, 16.974452210201353, 12.212161941402083, 18.79117350101749, 16.206988141223086, 11.331642201163177, 15.49033482059635, 18.920116396859395, 18.997928139729595]\n" + ] + } + ], + "source": [ + "import random\n", + "a = 10. \n", + "b = 20.\n", + "print( [ a + (b-a) * random.random() for i in range(10) ] )" + ] + }, + { + "cell_type": "markdown", + "id": "d024bdde-545c-4c2a-916f-ab80e3717c1e", + "metadata": { + "tags": [] + }, + "source": [ + "## **<font color='blue'>Optimierung</font>** \n", + "\n", + "Optimierungsprobleme werden mittels Monte-Carlo-Methoden durch die Vorgabe der Entwurfs- oder Entscheidungsparameter - zusammengefaßt im Vektor $ X = [x_1, x_2, ... , x_n] $ - über Zufallszahlen behandelt. \n", + "In welchem Bereich die einzelnen Variablen $x_i$ zufällig gewählt werden hängt natürlich von der Problemstellung ab. \n", + "Varianten ergeben sich auch dadurch, dass die Zufallszahlen für $x_i$ aus dem gesamten Wertebereich gewählt werden können oder dass auf einen vorhandenen Wert für $x_i$ eine zufällige Abweichung $\\Delta x_i$ aufaddiert wird.\n", + "\n", + "Für jeden zufälligen Vektor $X$ werden dann die Ziel- bzw. Gütefunktion $Q(X)$ bestimmt und die Gleichheit- und Ungleichheitsrestriktionen in der Form:\n", + "\n", + "\\begin{equation}\n", + " R(X) = 0 \\qquad \\text{und} \\qquad U(X) > 0 \n", + "\\end{equation}\n", + "\n", + "im Hinblick auf die Zulässigkeit des Vektors $X$ ausgewertet. \n", + "Beispielsweise kann bei einem zu optimierenden Bauteil die Zielfunktion die Masse sein und die Restriktionen das Einhalten der zulässigen Spannungen beschreiben. \n", + "\n", + "Aus dem betrachteten Satz an zufälligen Vektoren $X$ wird abschließend die Lösung herausgesucht, die das Gütekriterien unter (bestmöglicher) Einhaltung der Restriktionen am besten erfüllt.\n", + "Gegebenenfalls kann die so gefundene Lösung Ausgangspunkt weiterer Verfahren (z.B. lokale Suche) sein oder auch einer Wiederholung des Verfahrens, wenn ein Startvektor durch zufällig gewählte $\\Delta x_i$ modifiziert wird. \n", + "\n", + "Diese Methodik eignet sich bei schwierig zu differenzierenden Gütefunktionen, bei denen andere, z.B. gradientenbasierte Verfahren versagen würden. \n", + "Darüberhinaus ist sie in der Lage globale Minima oder Maxima zumindest annähernd zu finden. Wichtig ist dabei eine ausreichend große Anzahl an Zufallsvektoren, um die Wahrscheinlichkeit einer richtigen Lösung zu erhöhen. \n", + "\n" + ] + }, + { + "cell_type": "markdown", + "id": "3e3d1714-626d-4be4-a351-7742b86f4d2c", + "metadata": { + "tags": [] + }, + "source": [ + "## **<font color='blue'>Genetische Verfahren</font>**\n", + "\n", + "Genetische Verfahren versuchen, die Schritte einer sukzessiven, stochastischen Veränderung der Vektoren $X$ zur Findung von verbesserten Lösungen am Ablauf der biologischen Evolution zu orientieren. \n", + "Daher finden sich die Begrifflichkeiten der Evolutionbiologie bei den Elementen der genetischen Verfahren wieder. \n", + "Der Vektor $X$ wird **Genom** eines Individuum bezeichnet, seine Elemente als **Chromosomen**. \n", + "\n", + "* **Population**, Menge möglicher Lösungen\n", + "* **Chromosom**, eine mögliche Lösung für ein Individuum \n", + "* **Genotyp**, Elemente enthalten in Chromosomen\n", + "* **Phenotyp**, Wert eines Gentyps \n", + "\n", + "\n", + "\n", + "Die Mischung der Genome verschiedener Individuen (Eltern) wird als **Rekombination** bzw. **Crossover** bezeichnet und führt zum Generieren von Kindern.\n", + "Die zufällige Veränderung eines Genoms erfolgt hier im Rahmen der **Mutation**.\n", + "Welche Individuen ausgewählt werden, um Kinder zu erzeugen oder um am nächsten Entwicklungsschritt teilzunehmen, wird bei einer **Selektion** entschieden. \n", + "\n", + "\n", + "### **<font color='blue'>Genereller Ablauf</font>**\n", + "\n", + "Der schematische Gesamtablauf beginnt mit einer ersten Population, einer Anzahl an Individuen, deren Chromosome initialisiert, d.h. mit zufälligen Werten belegt und bewertet werden. \n", + "Aus dieser Population werden Individuen als Eltern für eine Rekombination selektiert.\n", + "Die Rekombination liefert die Kindergeneration, aus der einige Individuen einer Mutation unterworfen werden. \n", + "Der Bewertung der neuen Individuen folgt das Zusammenführen mit der Elterngeneration. \n", + "Ein weitere Selektion reduziert diese vergrößerte Population auf die Anzahl der Individuen der Ausgangspopulation, indem die am schlechtesten bewerteten Individuen entfernt werden. \n", + "Diese Population dient dann als Ausgang für den nächsten Evolutionsschritt, der wieder mit einer Selektion von Eltern beginnt. \n", + "Dieser Evolutionsprozess ist iterativ und wird fortgeführt bis ein Abbruchkriterium erfüllt wird (maximale Zahl der Schritte, keine Verbesserung der Lösung). \n", + "\n", + "\n", + "\n", + "### **<font color='blue'>Verfahrenselemente</font>**\n", + "\n", + "Die genetischen Verfahren gehen zum einen auf die \n", + "**Evolutionsstrategien** von Rechenberg und \n", + "zum anderen auf die **genetische Algorithmen** von John Henry Holland zurück.\n", + "Mit Evolutionsstrategien wurden ursprünglich ingenieurtechnische Problemen behandelt.\n", + "Mit genetischen Algorithmen wurde versucht die grundsätzliche Struktur, \n", + "mit der in der natürlichen Evolution Informationen gespeichert und verarbeitet werden, \n", + "auf die Computeralgorithmen zu übertragen. \n", + "Genetische Algorithmen gehen genauer auf die natürlichen Gegebenheiten \n", + "der natürlichen Evolution ein, \n", + "wenngleich die Unterschiede der Evolutionsstrategien und \n", + "der genetischen Algorithmen nur in Verfahrensdetails zu erkennen sind: \n", + "\n", + "#### **<font color='blue'>Codierung</font>**\n", + "Bei Evolutionsstrategien werden die Individuen mit realzahl-codierten Parametersätzen dargestellt, während bei den genetischen Algorithmen meist eine binäre Codierung stattfindet.\n", + "\n", + "Beispiele der Codierung: \n", + "\n", + "\n", + "\n", + "#### **<font color='blue'>Bewertung</font>**\n", + "\n", + "Beurteilung der Individuen wird in erster Linie durchgeführt, um die **Qualität einer möglichen Lösung** zu bewerten. Hierzu wird eine **Bewertungsfunktion** bzw. **Qualitätsfunktion** ausgewertet. Bei den genetischen Algorithmen kommt noch zusätzlich eine Bewertung im Hinblick auf eine Teilnahme an einer Rekombination durchgeführt. Hierzu wird eine **Fitnessfunktion** herangezogen, die sich von der Qualitätsfunktion unterscheiden kann. \n", + "\n", + "#### **<font color='blue'>Selektion</font>**\n", + "\n", + "Eine Selektion wird an zwei Stellen durchgeführt: \n", + "eine Auswahl von **Individuen zur Erzeugung neuer Individuen**\n", + "und eine Auswahl zur **Bildung der nächsten Generation**. \n", + "Während bei **Evolutionsstrategien** die Elterselektion vollkommen zufällig geschieht (Zufallswahl), \n", + "wird bei **genetischen Algorithmen** eine Selektion mit einer zur Bewertung mittels der Fitnessfunktion proportionalen Wahrscheinlichkeit ausgeführt (Turnierauswahl, Rouletteauswahl). \n", + "Dies führt dazu, dass hoch bewertete Individuen ihre Erbinformationen mit größerer Wahrscheinlichkeit verbreiten können als durchschnittlich oder schlecht bewertete Individuen.\n", + "\n", + "* **Zufallswahl / Random Selection**, eine Methode zur zufälligen Auswahl von Chromosomenpaaren aus den Elternchromosomen, ohne dass die Fitnesswerte eine Rolle spielen. Einfach ausgedrückt: Es werden nur Zufallswerte erzeugt, um das Elternchromosom auszuwählen.\n", + "\n", + "* **Turnierauswahl / Tournament selection**, bei dieser Auswahlmethode wird eine Auswahl auf der Grundlage von Fitnesswerten getroffen. \n", + "Die Auswahl beginnt damit, dass mittels einer zufälligen Wahl mehrere potenzielle Eltern ausgewählt werden, aus denen das Elternteil mit dem besten Fitnesswert ausgewählt wird.\n", + "\n", + "* **Rouletteauswahl / Roulette wheel selection**, die Anwendung dieser Auswahlmethode basiert auf der Wahrscheinlichkeit eines jeden Chromosoms. Die Größe des Anteils der Chromosomen im Roulettekessel hängt vom Fitnesswert ab. Die Auswahl erfolgt, indem ein Zufallswert aus dem Bereich aller Fitnesswerte gezogen wird.\n", + "\n", + "Zur Bildung der nächsten Generation ist grundsätzlich nur eine Einfachselektion eines Individuums möglich, bei der Auswahl von Eltern aber auch eine Mehrfachselektion.\n", + "Bei der Selektion zur Bildung der nächsten Generation wird die Bewertungsfunktion herangezogen. \n", + "Verfahrensunterschiede ergeben sich durch ein vollständiges Ersetzen der Population durch die besten, neu erzeugten Kinder oder durch die Auswahl der am besten beurteilten Individuen aus der Gemeinschaft von Eltern und Kindern. \n", + "\n", + "#### **<font color='blue'>Rekombination</font>**\n", + "\n", + "Die Rekombination spielt bei den genetischen Algorithmen \n", + "eine wichtigere Rolle als bei den Evolutionsstrategien. \n", + "Das Rekombinationsverfahren bzw. Crossover-Verfahren\n", + "dient dazu, den **Suchraum schneller und zielgerichteter zu durchschreiten**, \n", + "als dies durch zufälliges Suchen möglich wäre.\n", + "\n", + "Zum Austausch der Erbinformationen sind (mindestens) zwei Elter-Chromosomen\n", + "notwendig und resultieren in zwei neuen Chromosomen.\n", + "\n", + "Das einfachste Verfahren ist das **One-Point-Crossover** \n", + "bzw. die **1-Punkt-Kreuzung**. \n", + "Hierbei übernimmt ein Nachkomme $X_c$ bis zu einer \n", + "zufällig gewählten Bruchstelle $k$ die ersten Chromosomen\n", + "von Elter $X_a$ und die restlichen vom Elter $X_b$. \n", + "**Elter** ist die nur in der Genetik übliche Singularform von Eltern).\n", + "Ein zweites Kind $X_d$ entsteht durch das komplementäre Vorgehen: \n", + "\n", + "\\begin{equation}\\;\\;\n", + "\\begin{matrix} \n", + "X_a = [ x_{1\\,a},... , x_{k\\,a}, x_{k+1\\,a},... , x_{n\\,a}] \\\\\n", + "X_b = [ x_{1\\,b},... , x_{k\\,b}, \\; x_{k+1\\,b},... , x_{n\\,b}]\n", + "\\end{matrix} \n", + " \\;\\;\\;\\; \\rightarrow \\;\\;\\;\\;\n", + "\\begin{matrix} \n", + "X_c = [ x_{1\\,a},... , x_{k\\,a}, \\; x_{k+1\\,b},... , x_{n\\,b}]\\\\\n", + "X_d = [ x_{1\\,b},... , x_{k\\,b}, \\; x_{k+1\\,a},... , x_{n\\,a}]\n", + "\\end{matrix} \n", + "\\end{equation}\n", + "\n", + "<img src=\"./Pics/Cross-Over-1.gif\" width=\"40%\" height=\"40%\">\n", + "\n", + "Mit dieser Vorgehensweise werden benachbarte Informationen, \n", + "die in den Sequenzen $[ x_{1\\,a},... , x_{k\\,a}]$ usw. \n", + "enthalten sind auf die Kinder übertragen. \n", + "Verallgemeinerungen sind die $n$-Punkt-Kreuzungen \n", + "wie z.B. die **2-Punkt-Kreuzung** mit einer \n", + "zweiten Bruchstelle.\n", + "\n", + "<img src=\"./Pics/Cross-Over-2.gif\" width=\"40%\" height=\"40%\">\n", + "\n", + "\n", + "Demgegenüber steht das **Uniform-Crossover** bzw. die **Zufallsschablone**. \n", + "Hier übernimmt der Nachkomme $X_c$ die Informationen $i$ von $X_a$ \n", + "mit der Wahrscheinlichkeit von $p = 0,5$ ansonsten von $X_b$.\n", + "Ein zweites Kind $X_d$ entsteht durch die komplementäre Übernahme.\n", + "\n", + "\\begin{equation}\n", + "X_c = [ x_{1\\,c},... , x_{i\\,c}, ... , x_{n\\,c}] \n", + "\\qquad \\text{mit} \\quad \n", + " x_{i\\,c} = \n", + "\\begin{cases}\n", + "x_{i\\,a} & \\text{mit} \\; p = 0,5 \\; , \\\\\n", + "x_{i\\,b} & \\text{sonst.}\n", + "\\end{cases}\n", + "\\end{equation}\n", + "\n", + "Die Quell und Zielindizes können auch zufällig gewählt werden: \n", + "\n", + "<img src=\"./Pics/Cross-Over-3.gif\" width=\"40%\" height=\"40%\">\n", + "\n", + "#### **<font color='blue'>Mutation</font>**\n", + "\n", + "Die Mutation dient in erster Linie der Vermeidung zu schneller Konvergenz und der Überwindung lokaler Optima.\n", + "Bei Evolutionsstrategien besitzt die Mutation eine wichtige Rolle, da die Evolutionsstrategien meist auf der Verdoppelung der Individuen basiert.\n", + "Durch die Mutation der Kopien entsteht ein neues Individuum mit einem modifizierten Variablensatz (Genen). \n", + "Die Modifikation erfolgt in der Regel ungerichtet, d.h. jede Information $x_i$ wird unabhängig verändert.\n", + " \n", + "Die Mutation erfolgt bei Evolutionsstrategien nach dem Prinzip der statistischen Normalverteilung, wodurch geringfügige Änderungen des Erbguts mit größerer Wahrscheinlichkeit auftreten als große. \n", + "Zur Bestimmung einer Mutation $x_m$ wird auf den Vektor des Nachkommens $X_c$ ein Vektor von unabhängigen Gauß-verteilten Zufallszahlen \n", + "mit dem Mittelwert 0 und der Standardabweichung $\\sigma$ aufaddiert:\n", + "\n", + "\\begin{equation}\n", + " X_m = [ x_{1\\,m},... , x_{i\\,m}, ... , x_{i\\,m}] \n", + "\\qquad \\text{mit} \\quad\n", + " x_{i\\,m} = x_{i\\,c} + N(0,\\sigma_i) \\; . \n", + "\\end{equation}\n", + "\n", + "Die Streuung der einzelnen Parameter ist problemabhängig. \n", + "Um nun möglichst schnell das Optimum zu erreichen, gibt es Techniken, die Streuungen $\\sigma_i$ in Abhängigkeit von Erfolg oder Misserfolg der Mutationen anzupassen.\n", + "\n", + "Für genetische Algorithmen mit ihrer binären Codierung ($x_i \\in \\{0,1\\}$) wird die Mutation meist durch ein Negieren des Chromosoms bei einer vorgegebenen Wahrscheinlichkeit durchgeführt: \n", + "\n", + "\\begin{equation}\n", + "X_m = [ x_{1\\,m},... , x_{i\\,m}, ... , x_{n\\,m}] \n", + "\\qquad \\text{mit} \\quad\n", + " x_{i\\,m} = \n", + "\\begin{cases}\n", + "\\urcorner x_{i\\,m} & \\text{mit z.B. } p = 1/n \\; , \\\\\n", + "x_{i\\,m} & \\text{sonst.}\n", + "\\end{cases}\n", + "\\end{equation}\n", + "\n", + "$\\urcorner$ ist darin der Negationsoperator, \n", + "der hier aus einer $0$ eine $\\urcorner 0 = 1 $ macht \n", + "und umgekehrt: $\\urcorner 1 = 0 $.\n", + "\n", + "<img src=\"./Pics/Mutation-1.gif\" width=\"40%\" height=\"40%\"> <img src=\"./Pics/Mutation-2.gif\" width=\"40%\" height=\"40%\">\n", + "\n", + "Ein-und Multi-Punkt-Mutation \n", + "\n", + "<img src=\"./Pics/Mutation-3.gif\" width=\"40%\" height=\"40%\">\n", + "\n", + "Austausch-Mutation / Swap-Muatation\n", + "\n", + "### **<font color='blue'>Grundarten</font>**\n", + "\n", + "Betrachtet man die Populationsgröße und die Zahl der Kinder, die in jeder Generation erzeugt werden, unterscheidet man folgende Varianten, deren Nomenklatur typisch für die Evolutionstrategien ist: \n", + "\n", + "* $(1+1)$ <br>\n", + "In jeder Generation besteht die Population aus **einem Individuum**.\n", + "Aus dem Elter wird 1 neues Individuum durch **Kopieren** generiert und anschließend **mutiert**. \n", + "Der fittere der beiden Individuen wird in die nächste Generation übernommen.\n", + "(vgl. Monte-Carlo-Methoden, Simulated Annealing)\n", + "\n", + "* $(\\mu\\,/\\,\\rho+1)$ <br> \n", + "In jeder Generation besteht die Population aus $\\mu$ **Individuen**.\n", + "Per Zufall werden $\\rho$ **Eltern** ausgewählt und mit ihnen per Rekombination 1 **Kind** generiert und mutiert. \n", + "Das am **wenigsten fitte Individuum** wird aus den $\\mu+1$ Individuen entfernt. \n", + "Die verbliebenen bilden die neue Generation.\n", + "\n", + "* $(\\mu\\,/\\,\\rho+\\lambda)$ <br>\n", + "Wie eben besteht eine Population aus $\\mu$ **Individuen**.\n", + "Es werden $\\lambda$ **Kinder** aus jeweils $\\rho$ **Eltern** generiert und mutiert, wobei $\\lambda \\geq \\mu$. \n", + "Die $\\mu$ **fittesten Individuen von Eltern und Kindern** bilden dann wieder die nächste Generation.\n", + "\n", + "* $(\\mu\\,/\\,\\rho,\\lambda)$ <br>\n", + "Wieder besteht eine Population aus $\\mu$ **Individuen**.\n", + "Mit ihnen werden $\\lambda$ **Kinder** durch Rekombination aus jeweils $\\rho$ **Eltern** generiert und mutiert, wobei wieder $\\lambda \\geq \\mu$ ist. \n", + "Die $\\mu$ **fittesten Kinder** bilden die nächste Generation.\n", + "Da die Eltern nicht mehr in der nächsten Generation enthalten sind,\n", + "kann es keine unsterblichen Individuen geben.\n", + "Jedoch können dadurch auch Generationen entstehen, \n", + "die schlechter sind als ihre Vorgänger. \n", + "\n", + "* $[\\mu'\\,/\\,\\rho'\\#\\lambda' (\\mu\\,/\\,\\rho\\#\\lambda)^\\gamma]$ mit $\\# \\in [+,]$ <br>\n", + "Grundsätzlich lassen sich auch mehrere Populationen **parallel** behandeln. \n", + "Bei der Nomenklatur bezieht sich dann die innere **Klammerebene** auf die Individuen der **einzelnen Population**, die äußere auf die **verschiedenen Populationen**. \n", + "Dies bedeutet, dass aus $\\mu'$ **Elternpopulationen** $\\lambda'$ **Kinderpopulationen** - ggf. durch Rekombination aus jeweils $\\rho'$ **Populationen** - erzeugt werden. \n", + "Die Kinderpopulationen verhalten sich dann für $\\gamma$ **Generationen** nach der Art $(\\mu/\\rho\\#\\lambda)$, wobei $\\#$ gleich $+$ oder $,$ sein kann. \n", + "Abschließend werden die $\\mu'+\\lambda'$ bzw. $\\lambda'$ Populationen bewertet und die besten $\\mu'$ wieder für den nächsten Schritt als Menge der Ausgangspopulationen herangezogen. \n" + ] + }, + { + "cell_type": "markdown", + "id": "4ff7fd2d-b88d-40b0-a2ac-2ebb4590e2fd", + "metadata": { + "tags": [] + }, + "source": [ + "## **<font color='blue'>Rucksackproblem</font>**" + ] + }, + { + "cell_type": "code", + "execution_count": 41, + "id": "ebffe1ed-4a60-45b8-9a29-26e63694d6e0", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "gen\tnevals\tmax\tavg \n", + "0 \t44 \t805\t595.818\n", + "1 \t42 \t840\t694.818\n", + "2 \t40 \t887\t755.614\n", + "3 \t40 \t902\t806.864\n", + "4 \t40 \t940\t829.205\n", + "5 \t42 \t937\t856.886\n", + "6 \t42 \t965\t886.182\n", + "7 \t37 \t965\t899.886\n", + "8 \t38 \t967\t923.091\n", + "9 \t41 \t965\t943.273\n", + "10 \t42 \t965\t948.114\n", + "11 \t40 \t965\t955.818\n", + "12 \t40 \t965\t960.841\n", + "13 \t40 \t965\t964.25 \n", + "14 \t42 \t965\t958.068\n", + "15 \t41 \t965\t961.523\n", + "16 \t37 \t965\t956.068\n", + "17 \t41 \t965\t960.568\n", + "18 \t37 \t965\t957.273\n", + "19 \t42 \t965\t959.318\n", + "20 \t42 \t965\t962.045\n", + "21 \t44 \t965\t961.136\n", + "22 \t39 \t965\t960.045\n", + "++ Brute-Force Permutationen: 484\n", + "-- Bestes Individuum : [1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1]\n", + "-- Beste Fitness : 967.0\n" + ] + }, + { + "data": { + "image/png": "\n", + "text/plain": [ + "<Figure size 640x480 with 1 Axes>" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "from deap import base, creator, tools, algorithms\n", + "\n", + "import random\n", + "import numpy \n", + "import matplotlib.pyplot as plt\n", + "\n", + "random.seed( 42 ) # Für reproduzierbar zufällige Zahlen\n", + "\n", + "# item, weight, value\n", + "if False: \n", + " items = [ ( \"A\", 100, 40 ), \n", + " ( \"B\", 50, 35 ), \n", + " ( \"C\", 45, 18 ), \n", + " ( \"D\", 20, 4 ), \n", + " ( \"E\", 10, 10 ), \n", + " ( \"F\", 5, 2 ) ] \n", + " maxCapacity = 100\n", + "else: \n", + " items = [ (\"map\", 9, 150),\n", + " (\"compass\", 13, 35),\n", + " (\"water\", 153, 200),\n", + " (\"sandwich\", 50, 160),\n", + " (\"glucose\", 15, 60),\n", + " (\"tin\", 68, 45),\n", + " (\"banana\", 27, 60),\n", + " (\"apple\", 39, 40),\n", + " (\"cheese\", 23, 30),\n", + " (\"beer\", 52, 10),\n", + " (\"suntan cream\", 11, 70),\n", + " (\"camera\", 32, 30),\n", + " (\"t-shirt\", 24, 15),\n", + " (\"trousers\", 48, 10),\n", + " (\"umbrella\", 73, 40),\n", + " (\"waterproof trousers\", 42, 70),\n", + " (\"waterproof overclothes\", 43, 75),\n", + " (\"note-case\", 22, 80),\n", + " (\"sunglasses\", 7, 20),\n", + " (\"towel\", 18, 12),\n", + " (\"socks\", 4, 50),\n", + " (\"book\", 30, 10) ]\n", + " maxCapacity = 400\n", + "\n", + "NBR_ITEMS = len( items )\n", + "\n", + "# Definition der Fitness-Funktion \n", + "def getKnapsackValue(zeroOneList):\n", + " totalWeight = totalValue = 0\n", + " for i in range(len(zeroOneList)):\n", + " item, weight, value = items[i]\n", + " if totalWeight + weight <= maxCapacity:\n", + " totalWeight += zeroOneList[i] * weight\n", + " totalValue += zeroOneList[i] * value\n", + " return totalValue, \n", + "\n", + "\n", + "# Konstanten des genetischen Algorithmus\n", + "POPULATION_SIZE = 2*NBR_ITEMS \n", + "MAX_GENERATIONS = 1*NBR_ITEMS \n", + "P_CROSSOVER = 0.9 # Wahrscheinlichkeit der Rekombination \n", + "P_MUTATION = 0.1 # Wahrscheinlichkeit der Mutation \n", + "HALL_OF_FAME_SIZE = 1\n", + "\n", + "\n", + "# Neue Klasse \"Fitness\", abgeleitet von base.Fitness, mit Attribut weights \n", + "# Fitness ist die Maximierung des Gesamtgewichts\n", + "creator.create( \"FitnessMax\", base.Fitness, weights=(1.0,))\n", + "\n", + "# Neue Klasse \"Individual\", abgeleitet von \"list\", mit Attribut fitness.\n", + "creator.create( \"Individual\", list, fitness=creator.FitnessMax)\n", + "\n", + "# Initalisieren eine neue Toolbox \n", + "toolbox = base.Toolbox()\n", + "\n", + "# Registrieren des Attribut-Generatorfunktion randint() unter \"attr_item\" : Liefert zufällig 0 oder 1\n", + "toolbox.register( \"zeroOrOne\", random.randint, 0, 1 )\n", + "\n", + "# Registrieren einer Individuum-Generatorfunktion unter \"individualCreator\" : initRepeat(container, func, n)\n", + "toolbox.register( \"individualCreator\", tools.initRepeat, creator.Individual, toolbox.zeroOrOne, NBR_ITEMS )\n", + "\n", + "# Registrieren einer Populations-Generatorfunktion unter \"populationCreator\" : initRepeat(container, func, n), d.h. n muss beim Aufruf gegeben werden. \n", + "toolbox.register( \"populationCreator\", tools.initRepeat, list, toolbox.individualCreator )\n", + "\n", + "# Registrieren der Fitness-Berechung unter \"evaluate\"\n", + "toolbox.register( \"evaluate\", getKnapsackValue)\n", + "\n", + "# Registrieren der Selektion : Tournament mit Turniergröße 3\n", + "toolbox.register( \"select\", tools.selTournament, tournsize=3 )\n", + "\n", + "# Registrieren der Rekombination Single-point crossover:\n", + "toolbox.register( \"mate\", tools.cxTwoPoint )\n", + "\n", + "# Registrieren der Mutation FlipBit : indpb Wahrscheinlichkeit des Flips\n", + "toolbox.register( \"mutate\", tools.mutFlipBit, indpb=1.0/NBR_ITEMS )\n", + "\n", + "\n", + "# Gesamtablauf\n", + "def main():\n", + "\n", + " # Erzugen einer initialen Population (Generation 0)\n", + " population = toolbox.populationCreator( n=POPULATION_SIZE )\n", + "\n", + " # Definition des Statistik-Objects\n", + " stats = tools.Statistics( lambda ind: ind.fitness.values )\n", + " stats.register( \"max\", numpy.max )\n", + " stats.register( \"avg\", numpy.mean )\n", + "\n", + " # Definition des Hall-of-Fame Objekts\n", + " hof = tools.HallOfFame(HALL_OF_FAME_SIZE)\n", + "\n", + " # perform the Genetic Algorithm flow with hof feature added:\n", + " population, logbook = algorithms.eaSimple( population, toolbox, \n", + " cxpb=P_CROSSOVER, mutpb=P_MUTATION,\n", + " ngen=MAX_GENERATIONS, \n", + " stats=stats, halloffame=hof, verbose=True)\n", + "\n", + " # print best solution found:\n", + " best = hof.items[0]\n", + " print( \"++ Brute-Force Permutationen:\", NBR_ITEMS**2 ) \n", + " print( \"-- Bestes Individuum : \", best )\n", + " print( \"-- Beste Fitness : \", best.fitness.values[0] )\n", + "\n", + " # extract statistics:\n", + " maxFitnessValues, meanFitnessValues, nevals = logbook.select( \"max\", \"avg\", \"nevals\" )\n", + " \n", + " for i in range(1,len(nevals)): \n", + " nevals[i] = nevals[i-1] + nevals[i]\n", + "\n", + " # plot statistics:\n", + " #sns.set_style(\"whitegrid\")\n", + " plt.plot( maxFitnessValues, color='red' )\n", + " plt.plot( meanFitnessValues, color='green' )\n", + " plt.plot( nevals, color='blue' )\n", + " plt.xlabel( 'Generation' )\n", + " plt.ylabel( 'Max / Average Fitness' )\n", + " plt.title( 'Max and Average fitness over Generations' )\n", + " plt.grid()\n", + " plt.show()\n", + "\n", + "\n", + "if __name__ == \"__main__\":\n", + " main()" + ] + }, + { + "cell_type": "markdown", + "id": "f7f74e23-10e4-41d2-b16f-e3103254a027", + "metadata": { + "tags": [] + }, + "source": [ + "### **<font color='blue'>Übungsaufgabe</font>**\n", + "\n", + "Wie sieht der Algorithmus für das Rucksackproblem aus, wenn man die Indizes der ausgewählten Elemente im Lösungsvektor (Python `set`) speichert? " + ] + }, + { + "cell_type": "code", + "execution_count": null, + "id": "c11c0a14-0714-40f6-919c-c2209899256b", + "metadata": {}, + "outputs": [], + "source": [] + } + ], + "metadata": { + "@deathbeds/ipydrawio": { + "xml": "" + }, + "kernelspec": { + "display_name": "Python 3 (ipykernel)", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.8.10" + } + }, + "nbformat": 4, + "nbformat_minor": 5 +} diff --git a/Semester_2/Einheit_04/Grundlagen_DEAP.ipynb b/Semester_2/Einheit_04/Grundlagen_DEAP.ipynb new file mode 100644 index 0000000000000000000000000000000000000000..ff4d4492a81a12ab5ad5bda29aafacd0a6d63ee4 --- /dev/null +++ b/Semester_2/Einheit_04/Grundlagen_DEAP.ipynb @@ -0,0 +1,182 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "id": "b063833e-e3ce-4dcc-82a8-1fa689b46a34", + "metadata": { + "tags": [] + }, + "source": [ + "## **<font color='blue'>DEAP - Distributed Evolutionary Algorithms in Python</font>**\n", + "\n", + "DEAP ist ein Framework für evolutionäre Berechnungen, dass insbesondere dem schnellen Prototyping und dem Testen von Ideen dient. \n", + "Sein Design versucht, Algorithmen explizit und Datenstrukturen transparent zu machen. \n", + "Es beinhaltet auch eine einfache Parallelität, bei der sich die Benutzer nicht mit Implementierungsdetails wie Synchronisierung und Lastausgleich befassen müssen, sondern nur mit der funktionalen Dekomposition.\n", + "\n", + "DEAP ist aus drei Kern-Modulen sowie weiteren Modulen aufgebaut:\n", + "\n", + "<img src=\"./Pics/Deap_Architecture.png\" width=\"40%\" height=\"40%\">\n", + "\n", + "* **Base** <br>\n", + "Das Basismodul **Base** enthält **Objekte** und **Datenstrukturen**, die in evolutionären Verfahren häufig verwendet werden und nicht bereits in der Python-Standardbibliothek implementiert sind. Da Python bereits viele der benötigten Datenstrukturen bereitstellt, implementiert dieses Modul eigentlich nur drei Klassen: eine **generische Fitness**, eine **Toolbox** und einen **speziellen Baum**. \n", + "Die Toolbox ist ein Container für die Werkzeuge (**Operatoren**), die der Benutzer in seinem evolutionären Algorithmus verwenden möchte.\n", + "Beispielsweise kann eine Nutzer eine eigene Mutation nutzen, indem er eine nahekommende verfügbare `MutationXYZ` bei der Registrierung der eigenen `Mutation` in der Toolbox nutzt. \n", + " \n", + "* **Creator** <br>\n", + "Das **Creator**-Modul ist eine **Meta-Fabrik**, die die **Erstellung von Klassen** durch Vererbung und Komposition unter Verwendung eines funktionalen Programmierparadigma ermöglicht, d.h. ohne den Aufwand des Nutzers für die Definition von Klassen. **Attribute**, sowohl Daten als auch Funktionen, können dynamisch hinzugefügt werden, um neue Klassen zu erstellen.\n", + "\n", + "* **Tools** <br>\n", + "Das Modul **Tools** enthält häufig verwendete Operatoren (**Operators**) der evolutionären Algorithmen. Sie werden eingesetzt, um die Individuen in ihrer Umgebung zu **verändern, auszuwählen** und zu **verschieben**. \n", + "Außerdem bietet es Objekte, die verschiedene Analyseaufgaben wie Checkpointing, Statistikauswertung und Genealogie erleichtern. \n", + "Eine Toolbox selbst ist eine Behälter für die vom Nutzer ausgewählten Werkzeuge.\n", + "\n", + "* **Algorithms** <br>\n", + "Die Kernfunktionalitäten von DEAP werden durch das Algorithmenmodul **Algorithms** ergänzt, das häufig verwendete **Populations-Methoden** enthält: \n", + "z.B. (μ , λ), (μ + λ). DEAP ist jedoch in keiner Weise auf diese Verfahren beschränkt.\n", + "Sie sind nur ein Ausgangspunkt für Nutzer, die ihre eigenen maßgeschneiderten Algorithmen entwickeln wollen.\n", + "\n", + "* **GP - Genetic Programming** <br>\n", + "Operatoren und Werkzeuge, die nicht in den Kernmodulen enthalten sind, finden sich in eigenen Modulen, \n", + "z.B. Operatoren und Datenstrukturen der Genetischen Programmierung (GP) im **GP**-Modul. \n", + "\n", + "* **Benchmark** <br>\n", + "Das Modul **Benchmark** enthält verschiedene State-of-the-Art-Benchmark-Funktionen, die zur Bewertung der Algorithmenleistung verwendet werden können. \n", + "\n", + "* **DTM - Distributed Task Manager** <br>\n", + "Das letzte Modul des Frameworks mit dem Namen **DTM**, der für Distributed Task Manager, behandelt die Parallelität.\n", + "\n", + "### **<font color='blue'>Wichtige Klassen und Funktionen</font>**\n", + "\n", + "* **Creator**\n", + "\n", + " * `creator.create(name, base[, attribute[, ... ]])` : Erzeugt eine neue Klasse mit dem Namen `name`, die von `base` im Creator-Modul erbt. Die neue Klasse kann Attribute haben, die durch die nachfolgenden Schlüsselwortargumente definiert werden. \n", + "<br>\n", + "\n", + "* **Toolbox**\n", + " \n", + " * Class `base.Toolbox()` : Erzeugt ein neues Toolboxobjekt.\n", + " * `register(alias, method[, argument[, ... ]])` : Registriert eine Methode `method` in der Toolbox unter dem Namen `alias`. Es können Standardargumente angeben werden, die automatisch übergeben werden, wenn die registrierte Methode aufgerufen wird. Die Standardargumente können dann beim Funktionsaufruf überschrieben werden.\n", + "<br>\n", + " \n", + "* **Fitness**\n", + " \n", + " * Class `base.Fitness([values ])` : Die Fitness ist ein Maß für die Qualität einer Lösung. Wenn `values` als Tupel angegeben werden, wird die Fitness mit diesen Werten initialisiert. Die Werte der Fitness `values` können über `individual.fitness.values = values` gesetzt werden.\n", + "<br>\n", + "\n", + "* **Operatoren**\n", + "Sie stellen die Grundfunktionen für die Transformation (Rekombination, Mutation) oder Selektion der Individuen bereit. Werden beispielsweise zwei Individuen für eine Rekombination bereitgestellt, so erfolgt diese Rekombination in-place. Das Lösen der Nachkommen von ihren Eltern und das Zurücksetzen der Fitness obliegt dem Nutzer. Im Allgemeinen bietet es sich an mit dem Aufruf der `toolbox.clone()` Funktion ein Individuum zu clonen und mittel `del` das Attribut `values` zu leeren. \n", + "\n", + " * **Initalisierung** - in DEAP implementiert: \n", + " * `tools.initRepeat(container, func, n)` : Aufruf des Funktions`container`s mit einer Generatorfunktion, die dem n-fachen Aufruf der Funktion func entspricht.\n", + " * `container` – Datentyp zum Speichern der Ergebnisse von `func`.\n", + " * `func` – Funktion, die n-mal aufgerufen wird, um den `container` zu füllen.\n", + " * `n` – Anzahl der Wiederholungen von `func`.\n", + " * Return: Eine Instanz des gefüllten `container` \n", + " \n", + " <br>\n", + "\n", + " * **Rekombination/Crossover** - in DEAP implementiert: \n", + " * `tools.cxOnePoint(ind1, ind2)` : Führt eine Ein-Punkt-Kreuzung an den gegebenen Individuen `ind1`, `ind2` durch. Beide Individuen werden in-place verändert und zurückgegeben.\n", + " * `tools.cxTwoPoint(ind1, ind2)` : Führt eine Zwei-Punkt-Kreuzung an den gegebenen Individuen `ind1`, `ind2` durch. Beide Individuen werden in-place verändert und zurückgegeben. Nutzt die `randint()` von Python. \n", + " * `tools.cxUniform(ind1, ind2, indpb)` : Führt eine uniforme Kreuzung an den gegebenen Individuen `ind1`, `ind2` durch. Die Attribute der beiden Individuen werden in-place entsprechend der `indpb`-Wahrscheinlichkeit vertauscht. Nutzt die `random()` von Python. \n", + "\n", + " <br>\n", + " \n", + " * **Mutationen** - in DEAP implementiert: \n", + " * `tools.mutFlipBit(individual, indpb)` : Umkehrung des Attribute mittels des not-Operators bei gegebener Wahrscheinlichkeit `indpb` des gegebenen Individuums und Rückgabe der Mutante. Anwendung normalerweise auf boolesche Werte.\n", + " * `tools.mutGaussian(individual, mu, sigma, indpb)` : Gaußsche Mutation mit dem Mittelwert `mu` und der Standardabweichung `sigma` auf das gegebene Individuum mit reellen Attributen. `indpb` ist die Wahrscheinlichkeit mit der ein Attribut mutiert werden soll.\n", + " \n", + " <br>\n", + " \n", + " * **Selektion** - in DEAP implementiert: \n", + " * `tools.selTournament(individuals, k, tournsize)` : Auswahl von `k` Individuen aus den gegebenen Individuen `individuals` unter Verwendung von `k` Turnieren mit `tournsize` Individuen.\n", + " * `tools.selRoulette(individuals, k)` : Auswahl von `k` Individuen aus den gegebenen Individuen durch `k` Drehungen eines Roulettes. Die Auswahl erfolgt nur aufgrund des erste Fitnesswerts.\n", + " * `tools.selBest(individuals, k)` : Auswahl der `k` besten Individuen aus den gegebenen Individuen.\n", + "\n", + " <br>\n", + " \n", + " * **Statistik** - in DEAP implementiert: \n", + " * Class `tools.Statistics([key][, n])` : Liefert ein Statistikobjekt, das die verlangten Daten enthält. Bei der Erstellung erhält das Statistikobjekt ein Schlüsselargument, um die erforderlichen Daten zu erhalten. Ein Statistik-Objekt kann für jede registrierte Funktion als 3-dimensionale Matrix angesehen werden.\n", + " * `register(name, function)` : Registrierung einer Funktion, die bei jedem Aufruf von `update()` auf die Sequenz angewendet wird.\n", + " * `update(seq, index=0, add=False)` : Wendet auf die Eingabesequenz `seq` jede registrierte Funktion an und speichert das Ergebnis in einer Liste, zugehörig zur Funktion und dem Datenindex `index`.\n", + " * `tools.mean(seq), tools.median(seq), tools.var(seq), tools.std(seq)` : Returns the arithmetic mean, the median, the variance and the square root of the variance of the sequence `seq`.\n", + " \n", + " \n", + " <br>\n", + " \n", + " * **HallOfFame** - in DEAP implementiert: \n", + " * Class `tools.HallOfFame(maxsize)` : Die Ruhmeshalle enthält die besten Individuen, die im Laufe der Evolution in der Population vorhanden waren. Sie ist immer so sortiert, dass das erste Element der Ruhmeshalle das Individuum ist, das den besten jemals erreichten ersten Fitnesswert hat. \n", + " * Class `tools.ParetoFront([similar])` : Die Ruhmeshalle der Pareto-Front enthält alle nicht-dominierten Individuen, die jemals in der Population vorhanden waren.\n", + " \n", + "* **Algorithms**\n", + "\n", + "Das Modul Algorithmen soll Algorithmen enthalten, um sehr gängige evolutionäre Algorithmen auszuführen. \n", + "Die hier verwendeten Methoden dienen eher der Bequemlichkeit als als Referenz, \n", + "da die Implementierung jedes evolutionären Algorithmus unendlich variieren kann. \n", + "Die meisten Algorithmen in diesem Modul verwenden die in der Toolbox registrierten Operatoren. \n", + "Im Allgemeinen werden die Schlüsselwörter `mate()` für Crossover, `mutate()` für Mutation, `select()` für Selektion und `evaluate()` für Evaluation verwendet.\n", + "\n", + " * `algorithms.eaSimple(population, toolbox, cxpb, mutpb, ngen[, stats, halloffame, verbose ])` : Dieser Algorithmus reproduziert den einfachen evolutionären Algorithmus. \n", + "Diese Funktion erwartet, dass die Aliase `toolbox.mate()`, `toolbox.mutate()`, `toolbox.select()` und `toolbox.evaluate()` registriert sind.\n", + "Der Algorithmus verwendet λ = κ = μ und geht wie folgt vor. Zunächst wird die Population (P(0)) initialisiert, indem jedes Individuum bewertet wird. \n", + "Dann wird die Evolutionsschleife gestartet, die mit der Auswahl der Population P(g+1) beginnt. Der Crossover-Operator wird auf einen Teil von P(g+1) entsprechend der `cxpb`-Wahrscheinlichkeit angewandt. Die resultierenden und die unveränderten Individuen werden in P'(g+1) platziert. \n", + "Danach wird ein Teil von P'(g+1) über `mutpb` ausgewählt, mutiert und in P''(g+1) platziert, die unberührten Individuen werden auch in P''(g + 1) übertragen. Schließlich werden diese neuen Individuen bewertet und die Evolutionsschleife wird fortgesetzt, bis `ngen` Generationen abgeschlossen sind. Die Operatoren werden in der folgenden Reihenfolge angewendet: \n", + "\n", + "<br>\n", + "\n", + " evaluate(population)\n", + " for i in range(ngen):\n", + " descendants = select(population)\n", + " descendants = mate(descendants)\n", + " descendants = mutate(descendants)\n", + " evaluate(descendants)\n", + " population = descendants\n", + "\n", + " * `algorithms.eaMuPlusLambda(population, toolbox, mu, lambda_, cxpb, mutpb, ngen[, stats, halloffame, verbose ])` : Dies ist der (μ + λ) evolutionäre Algorithmus. `mu` ist die Anzahl der Individuen, die für die nächste Generation ausgewählt werden, `lambda`die Anzahl der Kinder, die in jeder Generation erzeugt werden. \n", + " Zunächst werden alle Individuen bewertet. Dann beginnt die Evolutionsschleife mit der Erzeugung von `lambda` Nachkommen aus der Population, die Nachkommen werden durch Kreuzung, Mutation oder Reproduktion erzeugt proportional zu den Wahrscheinlichkeiten `cxpb`, `mutpb` und `1 - (cxpb + mutpb)`. Die Nachkommen werden ausgewertet und die Population der nächsten Generation wird sowohl aus den Nachkommen als auch aus der Population ausgewählt.\n", + " \n", + "<br>\n", + " \n", + " evaluate(population)\n", + " for i in range(ngen):\n", + " descendants = varOr(population, toolbox, lambda_, cxpb, mutpb)\n", + " evaluate(descendants)\n", + " population = select(population + descendants, mu)\n", + "\n", + " * **Variations**\n", + " * `algorithms.varAnd(population, toolbox, cxpb, mutpb)` : Teil eines evolutionären Algorithmus, der nur den Variationsteil (Crossover und Mutation) anwendet. Die veränderten Individuen haben noch keine Fitness-Bewertung. Die Individuen werden geklont, so dass die erzeugte Population unabhängig ist von der Eingabepopulation ist.\n", + " Bei der Variation wird zunächst die elterliche Population $P_p$ mit der `toolbox.clone()`-Methode dupliziert und das Ergebnis in die Nachkommenpopulation $P_o$ gesetzt. Eine erste Schleife über $P_o$ wird ausgeführt, um aufeinanderfolgende Individuen zu paaren. Entsprechend der Kreuzungswahrscheinlichkeit `cxpb` werden die Individuen $x_i$ und $x_{i+1}$ mit der Methode `toolbox.mate()` gepaart. Die resultierenden Kinder $y_i$ und $y_{i+1}$ ersetzen ihre jeweiligen Eltern in $P_o$. \n", + "Eine zweite Schleife über das resultierende $P_o$ wird ausgeführt, um jedes Individuum mit einer Wahrscheinlichkeit `mutpb` zu mutieren. \n", + "Wenn ein Individuum mutiert ist, ersetzt es seine nicht mutierte Version in $P_o$. \n", + "Das resultierende $P_o$ wird zurückgegeben.\n", + "Diese Variante wird `And` genannt, weil sie sowohl Crossover als auch Mutation auf die Individuen anwenden kann. \n", + "Man beachte, dass beide Operatoren nicht systematisch angewandt werden, die resultierenden Individuen können nur durch Crossover, nur durch Mutation, durch Crossover und Mutation und durch Reproduktion entsprechend der angegebenen Wahrscheinlichkeiten erzeugt werden.\n", + " \n", + " * `algorithms.varOr(population, toolbox, lambda_, cxpb, mutpb)` : Bei jeder `lambda`-Iteration wählt die Variation eine der drei Operationen: Kreuzung, Mutation oder Reproduktion. Im Falle einer Kreuzung werden zwei Individuen zufällig aus der elterlichen Population $P_p$ ausgewählt. Diese Individuen werden mit der Methode `toolbox.clone()` geklont und dann mit der Methode `toolbox.mate()` gepaart. Nur das erste Kind wird an die Nachkommenpopulation $P_o$ angehängt, das zweite Kind wird verworfen. <br> \n", + " Im Falle einer Mutation wird ein Individuum zufällig aus $P_p$ ausgewählt, geklont und dann mit Hilfe der Methode `toolbox.mutate()` mutiert. Die resultierende Mutante wird an $P_o$ angehängt. Im Falle einer Reproduktion wird ein Individuum nach dem Zufallsprinzip aus $P_p$ ausgewählt, geklont und an $P_o$ angehängt. <br> \n", + " Diese Variante wird `Or` genannt, weil niemals ein Nachkomme aus beiden Operationen Crossover und Mutation resultieren wird. Die Summe der beiden Wahrscheinlichkeiten soll in [0, 1] liegen, die Reproduktionswahrscheinlichkeit ist `1 - cxpb - mutpb`." + ] + } + ], + "metadata": { + "kernelspec": { + "display_name": "Python 3 (ipykernel)", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.8.10" + } + }, + "nbformat": 4, + "nbformat_minor": 5 +} diff --git a/Semester_2/Einheit_04/Pics/.ipynb_checkpoints/Mutation-1-checkpoint.gif b/Semester_2/Einheit_04/Pics/.ipynb_checkpoints/Mutation-1-checkpoint.gif new file mode 100644 index 0000000000000000000000000000000000000000..5674408068e619515a18c1450e278ca0def2b5c3 Binary files /dev/null and b/Semester_2/Einheit_04/Pics/.ipynb_checkpoints/Mutation-1-checkpoint.gif differ diff --git a/Semester_2/Einheit_04/Pics/.ipynb_checkpoints/Mutation-2-checkpoint.gif b/Semester_2/Einheit_04/Pics/.ipynb_checkpoints/Mutation-2-checkpoint.gif new file mode 100644 index 0000000000000000000000000000000000000000..9a791d56f80e8c1d4d7eefd6c843a34f445e69bc Binary files /dev/null and b/Semester_2/Einheit_04/Pics/.ipynb_checkpoints/Mutation-2-checkpoint.gif differ diff --git a/Semester_2/Einheit_04/Pics/.ipynb_checkpoints/Mutation-3-checkpoint.gif b/Semester_2/Einheit_04/Pics/.ipynb_checkpoints/Mutation-3-checkpoint.gif new file mode 100644 index 0000000000000000000000000000000000000000..841d84cfad431bff9f48d0e12ea71834f413745c Binary files /dev/null and b/Semester_2/Einheit_04/Pics/.ipynb_checkpoints/Mutation-3-checkpoint.gif differ diff --git a/Semester_2/Einheit_04/Pics/Ablauf-GA.svg b/Semester_2/Einheit_04/Pics/Ablauf-GA.svg new file mode 100644 index 0000000000000000000000000000000000000000..aa54b27810ef41258333ca4c26318ee383701df6 --- /dev/null +++ b/Semester_2/Einheit_04/Pics/Ablauf-GA.svg @@ -0,0 +1,34 @@ +<?xml version="1.0" encoding="UTF-8" standalone="no"?><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" contentScriptType="application/ecmascript" contentStyleType="text/css" height="550px" preserveAspectRatio="none" style="width:417px;height:550px;" version="1.1" viewBox="0 0 417 550" width="417px" zoomAndPan="magnify"><defs><filter height="300%" id="fgrty9rvwu9y2" width="300%" x="-1" y="-1"><feGaussianBlur result="blurOut" stdDeviation="2.0"/><feColorMatrix in="blurOut" result="blurOut2" type="matrix" values="0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 .4 0"/><feOffset dx="4.0" dy="4.0" in="blurOut2" result="blurOut3"/><feBlend in="SourceGraphic" in2="blurOut3" mode="normal"/></filter></defs><g><ellipse cx="211.5" cy="20" fill="#000000" filter="url(#fgrty9rvwu9y2)" rx="10" ry="10" style="stroke: none; stroke-width: 1.0;"/><rect fill="#FEFECE" filter="url(#fgrty9rvwu9y2)" height="39.0679" rx="12.5" ry="12.5" style="stroke: #A80036; stroke-width: 1.5;" width="171" x="126" y="50"/><text fill="#000000" font-family="sans-serif" font-size="14" lengthAdjust="spacingAndGlyphs" textLength="151" x="136" y="74.9659">initialisiere Population</text><rect fill="#FEFECE" filter="url(#fgrty9rvwu9y2)" height="39.0679" rx="12.5" ry="12.5" style="stroke: #A80036; stroke-width: 1.5;" width="296" x="63.5" y="176.1358"/><text fill="#000000" font-family="sans-serif" font-size="14" lengthAdjust="spacingAndGlyphs" textLength="276" x="73.5" y="201.1018">bestimme Fitnesswert für Elternselektion</text><rect fill="#FEFECE" filter="url(#fgrty9rvwu9y2)" height="39.0679" rx="12.5" ry="12.5" style="stroke: #A80036; stroke-width: 1.5;" width="292" x="65.5" y="235.2038"/><text fill="#000000" font-family="sans-serif" font-size="14" lengthAdjust="spacingAndGlyphs" textLength="272" x="75.5" y="260.1697">selektiere Individuen/Eltern für Paarung</text><rect fill="#FEFECE" filter="url(#fgrty9rvwu9y2)" height="39.0679" rx="12.5" ry="12.5" style="stroke: #A80036; stroke-width: 1.5;" width="197" x="113" y="294.2717"/><text fill="#000000" font-family="sans-serif" font-size="14" lengthAdjust="spacingAndGlyphs" textLength="177" x="123" y="319.2376">erzeuge Rekombinationen</text><rect fill="#FEFECE" filter="url(#fgrty9rvwu9y2)" height="39.0679" rx="12.5" ry="12.5" style="stroke: #A80036; stroke-width: 1.5;" width="157" x="133" y="359.3056"/><text fill="#000000" font-family="sans-serif" font-size="14" lengthAdjust="spacingAndGlyphs" textLength="137" x="143" y="384.2716">erzeuge Mutationen</text><rect fill="#FEFECE" filter="url(#fgrty9rvwu9y2)" height="39.0679" rx="12.5" ry="12.5" style="stroke: #A80036; stroke-width: 1.5;" width="335" x="44" y="418.3735"/><text fill="#000000" font-family="sans-serif" font-size="14" lengthAdjust="spacingAndGlyphs" textLength="315" x="54" y="443.3395">bestimme Fitnesswert für Populationsselektion</text><rect fill="#FEFECE" filter="url(#fgrty9rvwu9y2)" height="39.0679" rx="12.5" ry="12.5" style="stroke: #A80036; stroke-width: 1.5;" width="300" x="61.5" y="477.4415"/><text fill="#000000" font-family="sans-serif" font-size="14" lengthAdjust="spacingAndGlyphs" textLength="280" x="71.5" y="502.4074">selektiere Individuen für neue Population</text><polygon fill="#FEFECE" filter="url(#fgrty9rvwu9y2)" points="141,109.0679,282,109.0679,294,121.0679,282,133.0679,141,133.0679,129,121.0679,141,109.0679" style="stroke: #A80036; stroke-width: 1.5;"/><text fill="#000000" font-family="sans-serif" font-size="14" lengthAdjust="spacingAndGlyphs" textLength="30" x="215.5" y="148.0339">nein</text><text fill="#000000" font-family="sans-serif" font-size="14" lengthAdjust="spacingAndGlyphs" textLength="141" x="141" y="126.4999">Stopkriteria erreicht?</text><text fill="#000000" font-family="sans-serif" font-size="14" lengthAdjust="spacingAndGlyphs" textLength="12" x="117" y="116.9659">ja</text><ellipse cx="24" cy="167.0679" fill="none" filter="url(#fgrty9rvwu9y2)" rx="10" ry="10" style="stroke: #000000; stroke-width: 1.0;"/><ellipse cx="24.5" cy="167.5679" fill="#000000" filter="url(#fgrty9rvwu9y2)" rx="6" ry="6" style="stroke: none; stroke-width: 1.0;"/><line style="stroke: #A80036; stroke-width: 1.5;" x1="211.5" x2="211.5" y1="30" y2="50"/><polygon fill="#A80036" points="207.5,40,211.5,50,215.5,40,211.5,44" style="stroke: #A80036; stroke-width: 1.0;"/><line style="stroke: #A80036; stroke-width: 1.5;" x1="211.5" x2="211.5" y1="215.2038" y2="235.2038"/><polygon fill="#A80036" points="207.5,225.2038,211.5,235.2038,215.5,225.2038,211.5,229.2038" style="stroke: #A80036; stroke-width: 1.0;"/><line style="stroke: #A80036; stroke-width: 1.5;" x1="211.5" x2="211.5" y1="274.2717" y2="294.2717"/><polygon fill="#A80036" points="207.5,284.2717,211.5,294.2717,215.5,284.2717,211.5,288.2717" style="stroke: #A80036; stroke-width: 1.0;"/><line style="stroke: #A80036; stroke-width: 1.5;" x1="211.5" x2="211.5" y1="333.3396" y2="359.3056"/><polygon fill="#A80036" points="207.5,349.3056,211.5,359.3056,215.5,349.3056,211.5,353.3056" style="stroke: #A80036; stroke-width: 1.0;"/><line style="stroke: #A80036; stroke-width: 1.5;" x1="211.5" x2="211.5" y1="398.3735" y2="418.3735"/><polygon fill="#A80036" points="207.5,408.3735,211.5,418.3735,215.5,408.3735,211.5,412.3735" style="stroke: #A80036; stroke-width: 1.0;"/><line style="stroke: #A80036; stroke-width: 1.5;" x1="211.5" x2="211.5" y1="457.4415" y2="477.4415"/><polygon fill="#A80036" points="207.5,467.4415,211.5,477.4415,215.5,467.4415,211.5,471.4415" style="stroke: #A80036; stroke-width: 1.0;"/><line style="stroke: #A80036; stroke-width: 1.5;" x1="211.5" x2="211.5" y1="133.0679" y2="176.1358"/><polygon fill="#A80036" points="207.5,166.1358,211.5,176.1358,215.5,166.1358,211.5,170.1358" style="stroke: #A80036; stroke-width: 1.0;"/><line style="stroke: #A80036; stroke-width: 1.5;" x1="211.5" x2="211.5" y1="516.5094" y2="526.5094"/><line style="stroke: #A80036; stroke-width: 1.5;" x1="211.5" x2="391" y1="526.5094" y2="526.5094"/><polygon fill="#A80036" points="387,339.3056,391,329.3056,395,339.3056,391,335.3056" style="stroke: #A80036; stroke-width: 1.5;"/><line style="stroke: #A80036; stroke-width: 1.5;" x1="391" x2="391" y1="121.0679" y2="526.5094"/><line style="stroke: #A80036; stroke-width: 1.5;" x1="391" x2="294" y1="121.0679" y2="121.0679"/><polygon fill="#A80036" points="304,117.0679,294,121.0679,304,125.0679,300,121.0679" style="stroke: #A80036; stroke-width: 1.0;"/><line style="stroke: #A80036; stroke-width: 1.5;" x1="129" x2="24" y1="121.0679" y2="121.0679"/><line style="stroke: #A80036; stroke-width: 1.5;" x1="24" x2="24" y1="121.0679" y2="157.0679"/><polygon fill="#A80036" points="20,147.0679,24,157.0679,28,147.0679,24,151.0679" style="stroke: #A80036; stroke-width: 1.0;"/><line style="stroke: #A80036; stroke-width: 1.5;" x1="211.5" x2="211.5" y1="89.0679" y2="109.0679"/><polygon fill="#A80036" points="207.5,99.0679,211.5,109.0679,215.5,99.0679,211.5,103.0679" style="stroke: #A80036; stroke-width: 1.0;"/><!-- +@startuml + +skinparam defaultFontSize 14 +skinparam classAttributeIconSize 0 +scale max 1024 width + +start + +:initialisiere Population; + +while (Stopkriteria erreicht?) is (nein) + :bestimme Fitnesswert für Elternselektion; + :selektiere Individuen/Eltern für Paarung; + :erzeuge Rekombinationen; + :erzeuge Mutationen; + :bestimme Fitnesswert für Populationsselektion; + :selektiere Individuen für neue Population; +endwhile (ja) + +stop +@enduml + +PlantUML version 1.2018.13(Mon Nov 26 18:11:51 CET 2018) +(GPL source distribution) +Java Runtime: OpenJDK Runtime Environment +JVM: OpenJDK 64-Bit Server VM +Java Version: 11.0.18+10-post-Ubuntu-0ubuntu120.04.1 +Operating System: Linux +OS Version: 5.15.0-71-generic +Default Encoding: UTF-8 +Language: de +Country: DE +--></g></svg> \ No newline at end of file diff --git a/Semester_2/Einheit_04/Pics/Ablauf-GA.uml b/Semester_2/Einheit_04/Pics/Ablauf-GA.uml new file mode 100644 index 0000000000000000000000000000000000000000..afde4a6cb86825d5661c84bf86a8598e9c26baa5 --- /dev/null +++ b/Semester_2/Einheit_04/Pics/Ablauf-GA.uml @@ -0,0 +1,26 @@ + +@startuml + +skinparam defaultFontSize 14 +skinparam classAttributeIconSize 0 +scale max 1024 width + +start + +:initialisiere Population; + +while (Stopkriteria erreicht?) is (nein) + :bestimme Fitnesswert für Elternselektion; + :selektiere Individuen/Eltern für Paarung; + :erzeuge Rekombinationen; + :erzeuge Mutationen; + :bestimme Fitnesswert für Populationsselektion; + :selektiere Individuen für neue Population; +endwhile (ja) + +stop +@enduml + + + + diff --git a/Semester_2/Einheit_04/Pics/Chromosom.png b/Semester_2/Einheit_04/Pics/Chromosom.png new file mode 100644 index 0000000000000000000000000000000000000000..915fe7e65787725e1e6163a9dc97e7ebd0d7345a Binary files /dev/null and b/Semester_2/Einheit_04/Pics/Chromosom.png differ diff --git a/Semester_2/Einheit_04/Pics/Codierung.png b/Semester_2/Einheit_04/Pics/Codierung.png new file mode 100644 index 0000000000000000000000000000000000000000..65b3691c6c38ec1ce983bd45fb04c35f4fe8df72 Binary files /dev/null and b/Semester_2/Einheit_04/Pics/Codierung.png differ diff --git a/Semester_2/Einheit_04/Pics/Cross-Over-1.gif b/Semester_2/Einheit_04/Pics/Cross-Over-1.gif new file mode 100644 index 0000000000000000000000000000000000000000..18c170781ec9b3f55d360554e58b8f7bd020ad82 Binary files /dev/null and b/Semester_2/Einheit_04/Pics/Cross-Over-1.gif differ diff --git a/Semester_2/Einheit_04/Pics/Cross-Over-2.gif b/Semester_2/Einheit_04/Pics/Cross-Over-2.gif new file mode 100644 index 0000000000000000000000000000000000000000..3847efffa8df41769b5fe1ca1cbeaf50cd5fe6e9 Binary files /dev/null and b/Semester_2/Einheit_04/Pics/Cross-Over-2.gif differ diff --git a/Semester_2/Einheit_04/Pics/Cross-Over-3.gif b/Semester_2/Einheit_04/Pics/Cross-Over-3.gif new file mode 100644 index 0000000000000000000000000000000000000000..d18243e96bdad22b869709d856757aaff4fb5e23 Binary files /dev/null and b/Semester_2/Einheit_04/Pics/Cross-Over-3.gif differ diff --git a/Semester_2/Einheit_04/Pics/Deap_Architecture.png b/Semester_2/Einheit_04/Pics/Deap_Architecture.png new file mode 100644 index 0000000000000000000000000000000000000000..161ea3ad442bd2fd7c59f1f41b0a5d214fe677e5 Binary files /dev/null and b/Semester_2/Einheit_04/Pics/Deap_Architecture.png differ diff --git a/Semester_2/Einheit_04/Pics/Generationmodel.png b/Semester_2/Einheit_04/Pics/Generationmodel.png new file mode 100644 index 0000000000000000000000000000000000000000..422ac2f86c19400062f6f870dc8523214ebbdcdc Binary files /dev/null and b/Semester_2/Einheit_04/Pics/Generationmodel.png differ diff --git a/Semester_2/Einheit_04/Pics/Mutation-1.gif b/Semester_2/Einheit_04/Pics/Mutation-1.gif new file mode 100644 index 0000000000000000000000000000000000000000..5674408068e619515a18c1450e278ca0def2b5c3 Binary files /dev/null and b/Semester_2/Einheit_04/Pics/Mutation-1.gif differ diff --git a/Semester_2/Einheit_04/Pics/Mutation-2.gif b/Semester_2/Einheit_04/Pics/Mutation-2.gif new file mode 100644 index 0000000000000000000000000000000000000000..9a791d56f80e8c1d4d7eefd6c843a34f445e69bc Binary files /dev/null and b/Semester_2/Einheit_04/Pics/Mutation-2.gif differ diff --git a/Semester_2/Einheit_04/Pics/Mutation-3.gif b/Semester_2/Einheit_04/Pics/Mutation-3.gif new file mode 100644 index 0000000000000000000000000000000000000000..841d84cfad431bff9f48d0e12ea71834f413745c Binary files /dev/null and b/Semester_2/Einheit_04/Pics/Mutation-3.gif differ diff --git a/Semester_2/Einheit_04/Pics/Roulette.png b/Semester_2/Einheit_04/Pics/Roulette.png new file mode 100644 index 0000000000000000000000000000000000000000..f2af12d3af03f6c7b1c4c9fcaba189d08ab36f3c Binary files /dev/null and b/Semester_2/Einheit_04/Pics/Roulette.png differ