diff --git a/Semester_2/Einheit_12/Grundlagen-ML.ipynb b/Semester_2/Einheit_12/Grundlagen-ML.ipynb new file mode 100644 index 0000000000000000000000000000000000000000..5dc13207d5bf906edea8f5fd495b32b5eb9eec9c --- /dev/null +++ b/Semester_2/Einheit_12/Grundlagen-ML.ipynb @@ -0,0 +1,819 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "id": "7671966d-f256-49ca-80c4-1d6181acc60a", + "metadata": {}, + "source": [ + "### <font color='blue'>**Grundlagen Maschinelles Lernen**</font>\n", + "\n", + "Maschinelles Lernen (ML) ist ein weit verbreiteter Ansatz im Gebiet der Künstlichen Intelligenz. \n", + "\n", + "Grundidee des Maschinellen Lernens: \n", + "\n", + "* Aus Beispielen werden Regelmäßigkeiten, Muster oder Modelle durch \"Lernen\" extrahiert. \n", + "* Hierzu werden ML-System mithilfe von Beispielen trainiert.\n", + "* Nach der Lernphase entstehen Modelle, die die bisherigen Beispiel durch Erkennen von Mustern, Beziehungen und Regelmäßigkeiten verallgemeinern. \n", + "* Damit lassen sie sich auf neue Daten anwenden und künftige Werte vorhersagen.\n", + "* Aktuelle ML-Systeme zeichnen sich durch einen geringen Entwicklungsaufwand und leichte anpassbarkeit aus.\n", + "* Nachteile sind eine großer Datenbedarf und die schlechte Erklärbarkeit, warum und wie das System welche Lösung gefunden hat. \n", + "\n", + "Fokus hier auf eine Spezialform des Maschinellen Lernens: Methoden des Deep Learnings (tiefes Lernen). \n", + "Sie basieren basieren auf künstlichen neuronalen Netzwerke (artificial neuronal networks ANN.\n", + "Deep bzw. tief bedeutet, dass tiefe, mehrschichtige Netzwerke - heute mit bis zu 100 Schichten - verwendet werden.\n", + "Schematischer Workflow \n", + "\n", + "1. **Vorbereitete Daten**, z.B. normalisiert, stehen zur Verfügung. \n", + "2. Ggf. muss eine **Konvertierung** in ein verwertbares Format.\n", + "3. Ggf. **Anreicherung** der bestehenden Daten, z.B. durch synthetische Daten \n", + "4. Abschließende **Analyse der Daten**, z.B. auf Integrität\n", + "5. Prüfung, ob **existierende Modelle** für die Aufgabe herangezogen werden können. \n", + "6. Erstellung eines **ersten Modells* \n", + "7. **Training** des Modells \n", + "8. **Evaluation** des trainierten Modells \n", + "9. Prüfung auf **Verwertbarkeit des Modells**\n", + "10. Ggf. **Anpassung des Modells** in einem iterativen Prozess\n", + "11. **Anwendung eines akzeptablen Modells** für künftige Szenarien\n", + "\n", + "Lernansätze beim Maschinellen Lernen kann man wie folgt klassifizieren: \n", + "\n", + "* **Lernmodus** - mit dem das Netzwerk trainiert wird\n", + " * **Überwachtes Lernen** - Supervised Learning: Für Eingabe sind die Ausgaben bekannt \n", + " * Unüberwachtes Lernen - Unsupervised Learning: Exploration von Daten, Identifikation inhärenter struktureller Eigenschaften. \n", + " * Teilüberwachtes Lernen - Semi-supervised Learning\n", + " * Bestärkendes Lernen - Reinforcement Learning: Belohnen richtiger und bestrafen falscher Antworten führt zu selbständig entwicleten Strategien. \n", + " * Aktives Lernen - Active Learning \n", + "* **Problemtyp** - der zu lösen ist\n", + " * **Regression**: Vorhersage von kontinuierlichen Werten, Methoden: lineare, polynomiale oder multivariate Regression, Beispiel: Vorhersage eletrischer Leistung in abhängigkeit meteorologischer Daten. \n", + " * **Klassifikation**: Vorhersage von Klassenzugehörigkeiten, d.h. Abbildung von Merkmalen in einen diskreten Wertebereich, Beispiel: Kategorisierung von E-Mails als Spam.\n", + " * **Clustering**: Findung von Gruppierung und deren Ähnlichkeitsmerkmalen nach nicht vorgegebenen Bezeichungen), Methoden des Unsupervised Learnings.\n", + " \n", + " \n", + "<div>\n", + "<img src=\"./Pics/Methoden.png\" width=\"800\"/>\n", + "</div>\n", + "\n", + "\n", + "\n", + "### <font color='blue'>**Neuronale Netzwerke**</font>\n", + "\n", + "Deep Learning basiert auf der Analogie zur Funktionsweise des menschlichen Gehirns. Die Bausteine sind Neuronen, die miteinander verknüpft sind. \n", + "Hier werden künstliche Neuronen genutzt und in mehreren Schichten miteinanderverknüpft. \n", + "\n", + "#### <font color='blue'>**Aufbau**</font>\n", + "\n", + "Ein natürliche Neuron besteht aus \n", + "\n", + "* einem **Zellkörper (Soma)**, der die Informationsverarbeitung vornimmt,\n", + "* den **Verästelungen (Dendriten)**, die die Reize der umgebenden Neuronen aufnehmen und an den Zellkörper weiterleiten,\n", + "* dem **Axon**, einem langen Fortsatz des Zellkörpers analog zu den Dendriten, die an den Enden Verästelungen (Axonterminale) mit Anknüpfungen an die Synapsen haben.\n", + "* die **Kontakzonen der Nervenzellen (Synapsen)** zwischen den Axonterminalen und den Dendriten. \n", + "\n", + "\n", + "<div>\n", + "<img src=\"./Pics/Neuron.png\" width=\"400\"/>\n", + "</div>\n", + "\n", + "\n", + "Beim Übertragen der Impulse an die nächste Nervenzelle werden Botenstoffe (Neurotransmitter) ausgeschüttet. Sie lösen eine Änderung des elektischen Potentials der verbundenen Neuronen aus. Zwischen den Zellen werden ankommende Aktivierungspotential ausgelöst, wenn ein Schwellenpotential überschritten wird. \n", + "\n", + "Ein künstliches Neuron wird als Perzeptron modelliert und besteht aus \n", + "\n", + "* einem **Perzeptor** als Modell der künstlichen Nervenzelle, der die Berechnung der **Übertragungs- und Aktivierungsfunktion** durchführt,\n", + "* eine **Eingabeschicht** mit der Dendritenfunktion zur Aufnahme von Reizen, \n", + "* eine **Ausgabe** als Modell des Axons,\n", + "* den **Gewichtungen (weights)**, die die Eigenschaften der Synapsen repäsentieren.\n", + "* und das **Bias**, das zu der Summe des Eingabevektors addiert wird. \n", + "* Die **Aktivierungsfunktion** modelliert das Überschreiten des Schwellenwertes. \n", + "\n", + "<div>\n", + "<img src=\"./Pics/AufbauNeuron.png\" width=\"600\"/>\n", + "</div>\n", + "\n", + "#### <font color='blue'>**Modell**</font>\n", + "\n", + "In der mathematische Formulierung sind\n", + "\n", + "* die Eingabewerte bilden einen **n-dimensionalen Vektor** $X = [x_1, x_2, ... ]$, dessen Komponenten mit dem **Wichtungen** $w_i$ versehen und inklusive des **Bias** $b$ aufaddiert werden: \n", + "$$\n", + " \\alpha = \\sum\\limits_{i=1}^n w_i x_i + b \\; . \n", + "$$\n", + "* Die Ausgabe des Neurons errechnet sich dann durch die Anwendung der **Aktivierungsfunktion**\n", + "$$\n", + " y = \\varphi( \\alpha ) \n", + "$$\n", + "Beispiel für Aktivierungsfunktionen sind \n", + "$$\n", + " y_1 = \\frac {1}{1+e^{-x}} \\quad y_2 = \\frac {e^x - e ^{-x}} {e^x + e ^{-x}}\n", + "$$\n", + "\n", + "#### <font color='blue'>**Lernen**</font>\n", + "\n", + "Das **Lernen** für ein einzelnes Neuron geschieht über die **Anpassung der Wichtungen** der linearen Übertragungsfunktion. Hierzu werden wiederholt Eingabewerte vorgegeben und die Ausgaben des Neurons $y_i$ mit den erwarteten Ausgaben $\\hat{y}_i$ verglichen. Das wird iterativ solange gemacht, bis das Neuron die erwarteten Ausgaben bestmöglich vorhersagt. \n", + " \n", + "Zur Anpassung wird gerne die **Delta-Regel** angewendet: \n", + "$$\n", + " w_{i_{neu}} = w_{i_{alt}} + \\eta \\cdot ( y_i - \\hat{y}_i ) \n", + "$$\n", + "Die **Lernrate** $\\eta$ ist geeignet, d.h. nicht zu hoch und nicht zu niedrig zu wählen. \n", + "Üblich ist es, zunächst mit hohen Lernraten zu beginnen und dann die Raten schrittweise zu reduzieren.\n", + "\n", + "#### <font color='blue'>**Mehrschichtige Netzwerke**</font>\n", + "\n", + "Mehrschichtige neuronale Netze bestehen aus mehrschichtigen Ansammlungen von Neuronen mit gewichteten Verbindungen. Die Bestandteile sind: \n", + "\n", + "* Eine **Eingabeschicht (input layer)**: \n", + " Jedes neuron repräsentiert hier ein Merkmal.\n", + " \n", + "* Eine oder mehrere **verdeckte Schichten (hidden layers)**: Sie dienen zur Weiterverarbeitung der Eingabeschicht. Mehr als eine verdeckte Schicht führt zu **tiefen neuronalen Netzen (deep neuronal networks)**\n", + " \n", + "* Eine **Ausgabeschicht (output layer)**: \n", + " Sie repräsentiert die Zielwerte, z.B. die gefundenen Klassen bei Klassifikationsaufgaben\n", + "\n", + "<div>\n", + "<img src=\"./Pics/Netzwerk.png\" width=\"500\"/>\n", + "</div>\n", + " \n", + "\n", + "Unterschieden werden \n", + "\n", + "* **vorwärtsgekoppelte Netze** (feedforward neural networks) mit unidirektionalen Verbindungen vom Input zum Ouput, d.h. es gibt keine Verbindungen zu Neuronen voriger Schichten. Vertreter sind CNNs (convolutional neural networks), z.B. für die Bildklassifikation \n", + "\n", + "* **rückgekoppelte Netze** (feedback neural networks) haben Rückführungen zu den unmittelbaren Vorgängern (direkte Rückkopplung) oder zu anderen vorhergehenden Schichten (indirekte Rückkopplung). Sie sind für Fragen mit zeitlichen Abläufen geeignet. \n", + "\n", + "#### <font color='blue'>**Lernvorgang**</font>\n", + "\n", + "Ziel ist die möglichst genaue Abbildung von Eingabevektoren auf gegebene Ausgabevektoren. Diese Abbildung wird dann als Modell bezeichnet. Hierzu müssen die Gewichte und die Aktivierungsfunktionen so gewählt werden, dass für viele Eingabebeispiele die Ausgabedaten korrekt bestimmt werden. \n", + "Zur Anpassung werden mathematische Verfahren verwendet. \n", + "Diese Training erfolgt in einem iterativen Prozess in folgenden Schritten: \n", + "\n", + "<div>\n", + "<img src=\"./Pics/Training.png\" width=\"600\"/>\n", + "</div>\n", + "\n", + "1. Festlegung der **Struktur** des neuronalen Netzwerks, z.B. nach Gefühl oder durch Adaption bestehender Modelle \n", + " und Festlegung von **Hyperparametern des Lernprozesses**, z.B. Anzahl der Epochen\n", + "2. **Initialisierung** des Netzwerks ggf. durch zufällige Wahl von Gewichtungen und Bias \n", + "3. Bereitstellung der **Trainingsdaten** aufgeteilt in Batches für einen \n", + "4. **Feed-Forward** Schritt von der Eingabeschicht bis zur Ausgabeschicht\n", + "5. **Fehlerevaluation** zur Beurteilung der Differenzen zwischen den berechneten und den Trainingsdaten über eine Fehlerfunktion\n", + "6. Sofern Fehlertoleranz und Anzahl der Epochen noch nicht erreicht, erfolgt eine \n", + "7. **Anpassung der Gewichtungen und des Bias**, indem die Fehlerinfomation durch Anpassung von der Ausgabeschicht über die verdeckten Schichten bis hin zu Eingabeschicht zrückpropagiert werden (Backpropagation). Hierzu wird die **Delta-Regel** verallgemeinert. \n", + "8. Nach Ende des Lernvorgangs (Fehler ist minimiert oder Zahl der Epochen erreicht) wird das **angelernte Modell evaluiert**, indem mit Testdaten mit bekannter Ausgabe die Antworten berechnet werden und deren Korrektheit und Präzision beurteilt wird. \n", + "9. Im Fall der Unzulänglichkeit erfolgt eine **Überarbeitug der Struktur des Modells**, d.h. Anpassungen des durch zusätzliche Schichten oder Aktivierungsfunktionen, und das erneute Durchlaufen des Lernprozesses.\n", + "10. Wenn da Modell verwertbar ist, dann kann es als **final** betrachtet, gespeichert und benutzt werden. \n", + "\n", + "#### <font color='blue'>**Fehlerfunktion**</font>\n", + "\n", + "Ein Fehlerwert beurteilt die Qualität der Abbildung der Eingaben auf die Ausgaben. Hier wird die **Fehlerfunktion (loss function)** verwendet, die je nach Aufgabengebiet sehr unterschiedlich sein kann. \n", + "\n", + "Für Regressionsaufgaben verbreitet ist die Erfassung des **mittleren quadratischen Fehlers (mean squared error - MSE)**, die durch die Fehlerfunktion definiert ist: \n", + "$$\n", + " E = \\frac 1 n \\sum\\limits_{i=1}^{n} ( y_i - \\hat y _i )^2\n", + "$$\n", + "$E$ ist der Fehlerwert, $n$ die Anzahl der Trainigsbeispiele und $y_i$ und $\\hat y _i$ die gewünschten und die errechneten Ausgaben. \n", + "\n", + "#### <font color='blue'>**Gewichtsanpassung**</font>\n", + "\n", + "Die Anpassung der Gewichtungen wird über die Backpropagation mittels **spezieller mathematischer Verfahren**, z.B. dem Gradientenverfahren, durchgeführt. Die Anpassung der jeweiligen Wichtungen erfolgt nach der verallgemeinerten Delta-Regel:\n", + "$$\n", + " w_{i_{neu}} = w_{i_{alt}} - \\eta \\, \\frac {\\partial E} {\\partial w_i} \\; , \n", + "$$\n", + "in der als Änderung das Produkt der Lernrate $\\eta$ mit der partiellen Ableitung des Fehlers nach der Wichtung verwendet wird. \n", + "Beginnend mit den Wichtungen der letzten Verbindungen zwischen Output- und vorhergehender Schicht, werden die Anpassungen Schicht für Schicht bis zur Input-Schicht vorgenommen. \n", + "\n", + "### <font color='blue'>**Klassifikationsbeispiel**</font>\n", + "\n", + "Der Trainingsdatensatz enthält 50 Instanzen von drei Arten von Schwertlilien mit den Merkmalen:\n", + "1. **Länge des Kelchblatts** (Spalte `sepal-length`) \n", + "2. **Breite des Sepalums** (Spalte `sepal-width`)\n", + "3. **Länge des Kronblatts** (Spalte `petal-length`)\n", + "4. **Breite des Kronblatts** (Spalte `petal-width`)\n", + "Zu den Merkmalen gehören die drei Kategorien der Iris-Varianten Iris-setosa, Iris-versicolor und Iris-virginica (Spalte `species`).\n", + "\n", + "<div>\n", + "<img src=\"./Pics/Bluete.png\" width=\"600\"/>\n", + "</div>\n", + "\n", + "Das Netzwerk soll zuerst aus drei Teilen bestehen: \n", + "\n", + "1. eine Input-Schicht, in das die vier Merkmale eingehen,\n", + "2. eine versteckte Schicht mit 10 Neuronen,\n", + "3. eine Output-Schicht, die die zu erkennenden Klassen der Iris-Varianten ausgibt.\n" + ] + }, + { + "cell_type": "code", + "execution_count": 1, + "id": "8174ac33-47c7-4704-8c01-d485c1ad4067", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + " sepal length sepal width petal length petal width species\n", + "0 5.1 3.5 1.4 0.2 Iris-setosa\n", + "1 4.9 3.0 1.4 0.2 Iris-setosa\n", + "2 4.7 3.2 1.3 0.2 Iris-setosa\n", + "3 4.6 3.1 1.5 0.2 Iris-setosa\n", + "4 5.0 3.6 1.4 0.2 Iris-setosa\n", + ".. ... ... ... ... ...\n", + "145 6.7 3.0 5.2 2.3 Iris-virginica\n", + "146 6.3 2.5 5.0 1.9 Iris-virginica\n", + "147 6.5 3.0 5.2 2.0 Iris-virginica\n", + "148 6.2 3.4 5.4 2.3 Iris-virginica\n", + "149 5.9 3.0 5.1 1.8 Iris-virginica\n", + "\n", + "[150 rows x 5 columns]\n" + ] + } + ], + "source": [ + "import numpy as np\n", + "import pandas as pd\n", + "\n", + "# Lade den Iris-Datenset\n", + "data_train = pd.read_csv('./iris.csv')\n", + "print( data_train ) " + ] + }, + { + "cell_type": "code", + "execution_count": 2, + "id": "7c414d55-5f28-4fa5-bea7-357beb651a74", + "metadata": {}, + "outputs": [], + "source": [ + "# Mapping der Iris-Varianten zu numerischen Werten 0, 1 bzw. 2\n", + "data_train.loc[data_train['species']=='Iris-setosa', 'species'] = 0\n", + "data_train.loc[data_train['species']=='Iris-versicolor', 'species'] = 1\n", + "data_train.loc[data_train['species']=='Iris-virginica', 'species'] = 2\n", + "data_train = data_train.apply(pd.to_numeric)\n", + "data_train_array = data_train.values" + ] + }, + { + "cell_type": "code", + "execution_count": 3, + "id": "d48c4828-4429-4131-b5d8-e8e60794f70b", + "metadata": { + "tags": [] + }, + "outputs": [], + "source": [ + "# Reproduzierbarkeit der Ergebnisse\n", + "np.random.seed(17)" + ] + }, + { + "cell_type": "code", + "execution_count": 4, + "id": "866f4a76-040f-4d8f-81c6-4285a98b0862", + "metadata": { + "tags": [] + }, + "outputs": [], + "source": [ + "# Splitten des Datensatzes in Trainings- und Testdaten 80% vs. 20% \n", + "from sklearn.model_selection import train_test_split\n", + "X_train, X_test, y_train, y_test = train_test_split(data_train_array[:,:4], # X \n", + " data_train_array[:,4], # Y \n", + " test_size=0.2 )" + ] + }, + { + "cell_type": "code", + "execution_count": 5, + "id": "04290085-675d-481f-b50a-918552b89e03", + "metadata": { + "tags": [] + }, + "outputs": [], + "source": [ + "from sklearn.neural_network import MLPClassifier\n", + "# VERSION 1\n", + "# Neuronales Netz zur Klassifikation (MultiLayerPerceptron)\n", + "# mit Aktivierungsfunktion 'relu' und Optimierer 'adam'.\n", + "mlp = MLPClassifier( hidden_layer_sizes=(10,), activation='relu', solver='adam', \n", + " max_iter=350, batch_size=10, verbose=False )\n" + ] + }, + { + "cell_type": "code", + "execution_count": 6, + "id": "a3c1c40a-9932-477c-803b-2ccb536de868", + "metadata": { + "tags": [] + }, + "outputs": [], + "source": [ + "# VERSION 2 \n", + "# Neuronales Netz mit 2 Hidden-Layers mit 5 bzw. 3 Neuronen \n", + "# mit Aktivierungsfunktion tanh und Optimierer adam \n", + "mlp = MLPClassifier( hidden_layer_sizes=(5,3), activation='tanh', solver='adam', \n", + " max_iter=350, batch_size=10, verbose=False)" + ] + }, + { + "cell_type": "code", + "execution_count": 7, + "id": "ff931304-da0c-47ab-bb5c-5010b81250f7", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "data": { + "text/html": [ + "<style>#sk-container-id-1 {color: black;}#sk-container-id-1 pre{padding: 0;}#sk-container-id-1 div.sk-toggleable {background-color: white;}#sk-container-id-1 label.sk-toggleable__label {cursor: pointer;display: block;width: 100%;margin-bottom: 0;padding: 0.3em;box-sizing: border-box;text-align: center;}#sk-container-id-1 label.sk-toggleable__label-arrow:before {content: \"▸\";float: left;margin-right: 0.25em;color: #696969;}#sk-container-id-1 label.sk-toggleable__label-arrow:hover:before {color: black;}#sk-container-id-1 div.sk-estimator:hover label.sk-toggleable__label-arrow:before {color: black;}#sk-container-id-1 div.sk-toggleable__content {max-height: 0;max-width: 0;overflow: hidden;text-align: left;background-color: #f0f8ff;}#sk-container-id-1 div.sk-toggleable__content pre {margin: 0.2em;color: black;border-radius: 0.25em;background-color: #f0f8ff;}#sk-container-id-1 input.sk-toggleable__control:checked~div.sk-toggleable__content {max-height: 200px;max-width: 100%;overflow: auto;}#sk-container-id-1 input.sk-toggleable__control:checked~label.sk-toggleable__label-arrow:before {content: \"▾\";}#sk-container-id-1 div.sk-estimator input.sk-toggleable__control:checked~label.sk-toggleable__label {background-color: #d4ebff;}#sk-container-id-1 div.sk-label input.sk-toggleable__control:checked~label.sk-toggleable__label {background-color: #d4ebff;}#sk-container-id-1 input.sk-hidden--visually {border: 0;clip: rect(1px 1px 1px 1px);clip: rect(1px, 1px, 1px, 1px);height: 1px;margin: -1px;overflow: hidden;padding: 0;position: absolute;width: 1px;}#sk-container-id-1 div.sk-estimator {font-family: monospace;background-color: #f0f8ff;border: 1px dotted black;border-radius: 0.25em;box-sizing: border-box;margin-bottom: 0.5em;}#sk-container-id-1 div.sk-estimator:hover {background-color: #d4ebff;}#sk-container-id-1 div.sk-parallel-item::after {content: \"\";width: 100%;border-bottom: 1px solid gray;flex-grow: 1;}#sk-container-id-1 div.sk-label:hover label.sk-toggleable__label {background-color: #d4ebff;}#sk-container-id-1 div.sk-serial::before {content: \"\";position: absolute;border-left: 1px solid gray;box-sizing: border-box;top: 0;bottom: 0;left: 50%;z-index: 0;}#sk-container-id-1 div.sk-serial {display: flex;flex-direction: column;align-items: center;background-color: white;padding-right: 0.2em;padding-left: 0.2em;position: relative;}#sk-container-id-1 div.sk-item {position: relative;z-index: 1;}#sk-container-id-1 div.sk-parallel {display: flex;align-items: stretch;justify-content: center;background-color: white;position: relative;}#sk-container-id-1 div.sk-item::before, #sk-container-id-1 div.sk-parallel-item::before {content: \"\";position: absolute;border-left: 1px solid gray;box-sizing: border-box;top: 0;bottom: 0;left: 50%;z-index: -1;}#sk-container-id-1 div.sk-parallel-item {display: flex;flex-direction: column;z-index: 1;position: relative;background-color: white;}#sk-container-id-1 div.sk-parallel-item:first-child::after {align-self: flex-end;width: 50%;}#sk-container-id-1 div.sk-parallel-item:last-child::after {align-self: flex-start;width: 50%;}#sk-container-id-1 div.sk-parallel-item:only-child::after {width: 0;}#sk-container-id-1 div.sk-dashed-wrapped {border: 1px dashed gray;margin: 0 0.4em 0.5em 0.4em;box-sizing: border-box;padding-bottom: 0.4em;background-color: white;}#sk-container-id-1 div.sk-label label {font-family: monospace;font-weight: bold;display: inline-block;line-height: 1.2em;}#sk-container-id-1 div.sk-label-container {text-align: center;}#sk-container-id-1 div.sk-container {/* jupyter's `normalize.less` sets `[hidden] { display: none; }` but bootstrap.min.css set `[hidden] { display: none !important; }` so we also need the `!important` here to be able to override the default hidden behavior on the sphinx rendered scikit-learn.org. See: https://github.com/scikit-learn/scikit-learn/issues/21755 */display: inline-block !important;position: relative;}#sk-container-id-1 div.sk-text-repr-fallback {display: none;}</style><div id=\"sk-container-id-1\" class=\"sk-top-container\"><div class=\"sk-text-repr-fallback\"><pre>MLPClassifier(activation='tanh', batch_size=10, hidden_layer_sizes=(5, 3),\n", + " max_iter=350)</pre><b>In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook. <br />On GitHub, the HTML representation is unable to render, please try loading this page with nbviewer.org.</b></div><div class=\"sk-container\" hidden><div class=\"sk-item\"><div class=\"sk-estimator sk-toggleable\"><input class=\"sk-toggleable__control sk-hidden--visually\" id=\"sk-estimator-id-1\" type=\"checkbox\" checked><label for=\"sk-estimator-id-1\" class=\"sk-toggleable__label sk-toggleable__label-arrow\">MLPClassifier</label><div class=\"sk-toggleable__content\"><pre>MLPClassifier(activation='tanh', batch_size=10, hidden_layer_sizes=(5, 3),\n", + " max_iter=350)</pre></div></div></div></div></div>" + ], + "text/plain": [ + "MLPClassifier(activation='tanh', batch_size=10, hidden_layer_sizes=(5, 3),\n", + " max_iter=350)" + ] + }, + "execution_count": 7, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "# Training \n", + "mlp.fit(X_train, y_train) " + ] + }, + { + "cell_type": "markdown", + "id": "ad948853-d373-4e38-89e8-0279edf4e650", + "metadata": {}, + "source": [ + "#### <font color='blue'>**Evaluation**</font>\n", + "\n", + "Die **Konfusionsmatrix** hilft dabei, die Qualität einer erlernten Klassifikation auswerten und neutral zu bewerten. Des Weiteren lassen sich mithilfe der Wahrheitsmatrix einfacher spezifische Kennzahlen errechnen. Um die Konfusion Matrix aufzubauen, benötigt man das Testset des Datensatzes. Der Klassifikator teilt den Eingabedaten die Ausgabe-Klassen zu. Die Konfusionsmatrix wird gerne genutzt, um festzustellen, welche Art des Fehlers beim Klassifikator häufig vorkommt. \n", + "\n", + "Die Matrix setzt sich aus den bereits genannten Fehlertypen zusammen. \n", + "Die Zeilen sind dabei die vorhergesagten Klassen und die Spalten die tatsächlichen Klassen der Testdaten:\n", + "\n", + "<div>\n", + "<img src=\"./Pics/Konfusionsmatrix.png\" width=\"500\"/>\n", + "</div>\n", + "Weiter Kennzahlen sind: \n", + "\n", + "* Die **Sensitivität** (engl. **Recall**) bezieht die für eine Klasse richtig vorhergesagten Datenpunkte auf die Gesamtzahl der tatsächlich vorhandenen Datensätze der Klasse:\n", + "$$ \n", + " \\text{Recall}_i = \\frac { N_{ii} } { \\sum _j N_{ji} }\n", + "$$\n", + "Sie ist von großer Bedeutung, da in vielen Praxisbeispielen das Modell vor allem daran gemessen wird, ob es die positiven Fälle richtig erkennt. Nehmen wir an, wir trainieren ein Klassifikationsmodell, das anhand von Bildern Krebszellen erkennen soll. In diesem Fall ist es sehr wichtig, dass alle positiven Personen, die also wirklich Krebs haben, erkannt werden, damit man die Krankheit frühzeitig behandeln kann. In diesem Beispiel sind andere Kennzahlen nicht von solch großer Bedeutung, denn es schadet nicht, wenn Personen, die keinen Krebs haben, trotzdem genauer untersucht werden. \n", + "\n", + "* Die **Präzision** ist die relative Häufigkeit einer richtig vorhergesagten Klasse bezogen auf die Gesamtzahl der vorsagten Exemplare dieser Klasse:\n", + "$$ \n", + " \\text{Präzision}_i = \\frac { N_{ii} } { \\sum _j N_{ij} }\n", + "$$\n", + "\n", + "* Die **Genauigkeit** umschreibt die insgesamt richtig Klassifizierten im Verhältnis zu allen Klassifzierungen:\n", + "$$ \n", + " \\text{Genauigkeit} = \\frac { \\sum _i N_{ii} } { \\sum _i \\sum _j N_{ij} }\n", + "$$\n", + "Auf den ersten Blick sehen die Formeln für die Genauigkeit und Präzision relativ ähnlich aus. Ein gutes Machine Learning Modell muss nach dem Training gute Vorhersage für neue, ungesehene Daten liefern. Jedoch ist ein solches Modell nur dann wertvoll, wenn es sehr oft gute Vorhersagen liefert und die guten Ergebnisse nicht nur selten auftreten. Diese Eigenschaften lassen sich mit der Genauigkeit und Präzision messen.\n", + "<br>\n", + "Die Genauigkeit misst, wie nahe die Vorhersagen an den gewünschten Werten liegt. Bei einer Klassifikation bedeutet das also, wie oft die vorhergesagte Klasse auch der tatsächlichen entspricht. Die Präzision hingegen misst, wie scharf die Ergebnisse sind, d.h. wie reproduzierbar die Ergebnisse sind. Konkret bedeutet dies, wie nahe die Ergebnisse für ähnliche Eigenschaftswerte beeinander liegen. Dies gibt eine Aussage über die Reproduzierbarkeit von Ergebnissen da ein Modell nicht wirklich brauchbar ist, wenn es für denselben bei zwei Vorhersagen zwei sehr unterschiedliche Werte liefert. \n", + "\n", + "* Der **F-Score**, auch F1-Score genannt, ist eine im maschinellen Lernen und in der Datenanalyse weit verbreitete Metrik zur Bewertung der Leistung von Klassifizierungsmodellen. Er ist ein Maß für die *Präzision* und den *Recall* eines Modells, wobei die Präzision den Anteil der wahrhaft richtigen Ergebnisse an allen vorhergesagten richtigen Ergebnissen und der Recall den Anteil der wahrhaft richtigen Ergebnisse an allen tatsächlich richtigen Ergebnissen angibt. <br>\n", + "Der F-Score ist ein gewichtetes harmonisches Mittel aus Precision und Recall und liefert eine einzige Zahl, die die Leistung eines Modells in Bezug auf Precision und Recall zusammenfasst. \n", + "Der **F-Score reicht von 0 bis 1**, wobei ein höherer Wert für eine bessere Modellleistung steht. \n", + "Der F1-Score wird häufig in Situationen verwendet, in denen ein Ungleichgewicht zwischen der Anzahl positiver und negativer Beispiele in den Daten besteht, da er eine ausgewogene Bewertung der Leistung eines Modells unabhängig von der Klassenverteilung liefert.\n", + "$$\n", + " \\text{F-Score} = \\frac {2 \\cdot \\text{Recall} \\cdot \\text{Precision}} { \\text{Recall} + \\text{Precision} }\n", + "$$\n", + "Durch die Nutzung des sogenannten harmonischen Mittels, und nicht des klassischen arithmetischen Mittel, wird sichergestellt, dass Extremwerte einer der beiden Größen deutlich stärker bestraft werden. " + ] + }, + { + "cell_type": "code", + "execution_count": 8, + "id": "1f933cdb-9327-4b4a-a545-0c4d86350141", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Trainingsergebnis: 0.992\n", + "[[ 7 0 0]\n", + " [ 0 11 0]\n", + " [ 0 1 11]]\n", + " precision recall f1-score support\n", + "\n", + " 0.0 1.00 1.00 1.00 7\n", + " 1.0 0.92 1.00 0.96 11\n", + " 2.0 1.00 0.92 0.96 12\n", + "\n", + " accuracy 0.97 30\n", + " macro avg 0.97 0.97 0.97 30\n", + "weighted avg 0.97 0.97 0.97 30\n", + "\n", + "Testergebnis: 0.967\n" + ] + } + ], + "source": [ + "print(\"Trainingsergebnis: %5.3f\" % mlp.score( X_train, y_train ) )\n", + "\n", + "predictions = mlp.predict(X_test) # Evaluation anhand der Testdaten \n", + "\n", + "from sklearn.metrics import classification_report, confusion_matrix \n", + "print( confusion_matrix( y_test, predictions ) ) # Konfusionsmatrix Zeile: prediction Spalte: wahr\n", + "print( classification_report( y_test, predictions ) ) # Ausgabe precison, recall und f1-score\n", + "\n", + "print( \"Testergebnis: %5.3f\" % mlp.score( X_test, y_test ) ) # Test und Ergebnisausgabe des Modells" + ] + }, + { + "cell_type": "code", + "execution_count": 9, + "id": "56c547b7-1952-4232-9a41-170a4f81d37d", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Wichtungen: [array([[-0.18175367, 0.51967945, -0.03682395, -0.1205498 , 0.16938574],\n", + " [-0.71339316, 0.1364212 , 0.68704501, 0.83270091, 0.40263018],\n", + " [ 1.02301099, -0.62040153, -0.54177161, -0.58501333, -0.41696715],\n", + " [ 0.53283474, -0.92627887, 0.24828775, 1.00029128, -0.58660593]]), array([[-1.64319389, 0.99261637, 0.48133661],\n", + " [ 0.19205787, -0.35979584, 1.30116347],\n", + " [ 0.49705423, -0.08875001, 1.10067155],\n", + " [ 0.31704068, -1.41095649, -0.4765751 ],\n", + " [ 0.53497596, -0.47725283, 2.05482876]]), array([[ 1.80286371, -0.92012959, -0.82321987],\n", + " [-2.25024998, 0.78176397, 0.15917304],\n", + " [ 0.98562046, 2.12981661, -2.50680455]])]\n", + "Biases: [array([ 0.36436877, 0.79437877, 0.03455584, -0.69635934, 0.69751936]), array([-0.32413316, 0.70181907, 0.44662492]), array([ 0.51175497, -0.31347659, 0.17286358])]\n" + ] + } + ], + "source": [ + "# Folgendes gibt die Werte der Gewichte pro Layer aus\n", + "print( \"Wichtungen:\", mlp.coefs_ )\n", + "print( \"Biases: \", mlp.intercepts_ ) " + ] + }, + { + "cell_type": "code", + "execution_count": 10, + "id": "611bd33f-f191-4a6d-bd80-cdbdca083329", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[0. 2. 0. 1.]\n" + ] + } + ], + "source": [ + "# Modellanwendung zur Vorhersage auf folgenden Werten \n", + "print( mlp.predict( [[5.1,3.5,1.4,0.2], [5.9,3.,5.1,1.8], [4.9,3.,1.4,0.2], [5.8,2.7,4.1,1.]] ) )" + ] + }, + { + "cell_type": "code", + "execution_count": 11, + "id": "31b7dbe2-0297-42ed-86c2-e0488d7f085e", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "data": { + "image/png": "\n", + "text/plain": [ + "<Figure size 640x480 with 1 Axes>" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "# Visualisierung der Loss-Kurve\n", + "import matplotlib.pyplot as plt\n", + "loss_values = mlp.loss_curve_\n", + "plt.plot(loss_values)\n", + "plt.show()" + ] + }, + { + "cell_type": "markdown", + "id": "91376581-9808-4db2-840d-254291726be3", + "metadata": {}, + "source": [ + "#### <font color='blue'>**Regressionsbeispiele**</font>" + ] + }, + { + "cell_type": "code", + "execution_count": 12, + "id": "50005cd0-1f67-4fe7-911d-92a26bd61a1c", + "metadata": {}, + "outputs": [], + "source": [ + "import numpy as np\n", + "\n", + "def generate_data(expanded=False): \n", + " rng = np.random.RandomState(0)\n", + " n_sample = 100\n", + " x_max, x_min = 1.4, -1.4\n", + " x_delta = x_max - x_min\n", + " x_train = np.sort(rng.rand(n_sample) * x_delta - x_delta / 2)\n", + " y_train = x_train**3 - 0.5 * x_train**2 + rng.randn(n_sample) * 0.3\n", + " x_train = x_train.reshape((-1, 1))\n", + "\n", + " if expanded: \n", + " x_train = np.concatenate([x_train, x_train**2, x_train**3], axis=1)\n", + " return x_train, y_train" + ] + }, + { + "cell_type": "code", + "execution_count": 13, + "id": "3ccfd473-fdc4-4ed5-9bb4-143bf552a2c5", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "data": { + "image/png": "\n", + "text/plain": [ + "<Figure size 640x480 with 1 Axes>" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "X_train, y_train = generate_data(expanded=False)\n", + "\n", + "from sklearn.neural_network import MLPRegressor\n", + "from sklearn.linear_model import LinearRegression\n", + "from sklearn.metrics import mean_squared_error\n", + "\n", + "if True: \n", + " regressor = MLPRegressor(hidden_layer_sizes=(5,), random_state=1, \n", + " activation='identity', # ‘identity’, ‘logistic’, ‘tanh’, ‘relu’\n", + " max_iter=500)\n", + "else: \n", + " regressor = LinearRegression()\n", + " \n", + "regressor.fit(X_train, y_train)\n", + "\n", + "#print( regressor.coefs_ )\n", + "#print( regressor.intercepts_ )\n", + "\n", + "y_predicted = regressor.predict(X_train)\n", + "mse = mean_squared_error(y_train, y_predicted)\n", + "\n", + "import pandas as pd\n", + "import matplotlib.pyplot as plt\n", + "data_frame = pd.DataFrame({'input': X_train[:,0], 'output': y_train})\n", + "ax1 = data_frame.plot.scatter(x='input', y='output', c='DarkBlue')\n", + "ax1.plot( X_train[:,0], y_predicted, color='red')\n", + "_ = ax1.set_title(f\"Mean squared error = {mse:.3f}\")" + ] + }, + { + "cell_type": "markdown", + "id": "27ea2669-bbc3-4bf0-9c7b-e67bc6ae2640", + "metadata": {}, + "source": [ + "Es ist wichtig zu beachten, dass das gelernte Modell nicht in der Lage ist, die nicht-lineare Beziehung zwischen Daten und Ziel zu behandeln, da lineare Modelle davon ausgehen, dass die Beziehung zwischen Daten und Ziel linear ist.\n", + "\n", + "Denkbar sind 3 Möglichkeiten, dieses Problem zu lösen:\n", + "\n", + "* Auswahl eines Modells, das mit Nichtlinearität umgehen kann,\n", + "* Entwicklung eines reichhaltigeren Satzes von Merkmalen durch Einbeziehung von Expertenwissen, das direkt von einem einfachen linearen Modell verwendet werden kann, oder\n", + "* Verwendung eines \"Kerns\", um eine lokal basierte Entscheidungsfunktion anstelle einer globalen linearen Entscheidungsfunktion zu haben.\n", + "\n", + "Der erste Punkt soll anhand eines **Entscheidungsbaum-Regressors**, der von Haus aus mit Nichtlinearität umgehen kann, veranschaulicht werden.\n" + ] + }, + { + "cell_type": "markdown", + "id": "68b4561d-735e-4002-ba6f-6d4eca54cd5a", + "metadata": {}, + "source": [ + "### <font color='blue'>**Entscheidungsbäume**</font>\n", + "\n", + "Entscheidungsbäume (Decision Trees, DTs) sind eine **überwachte Lernmethode**, die für **Klassifizierung und Regression** verwendet wird. Ziel ist es, ein Modell zu erstellen, das den Wert einer Zielvariablen vorhersagt, indem einfache **Entscheidungsregeln** aus den Datenmerkmalen abgeleitet werden. Ein Baum kann als eine stückweise konstante Annäherung betrachtet werden. Ein Entscheidungsbaum-Regressor versucht also, eine kontinuierliche Zielvariable vorherzusagen, indem er die Merkmalsvariablen in **kleine Zonen unterteilt, wobei jede Zone eine konstante Vorhersage enthält**. Entscheidungsbäume lernen aus den Daten eine Reihe von Wenn-dann-also-Entscheidungsregeln zu approximieren. Je tiefer der Baum ist, desto komplexer sind die Entscheidungsregeln und desto besser passt das Modell.\n", + "\n", + "Bei **jedem Modellierunsgschritt** wird nun das **Attribut (z.B. Intervallgrenze) gesucht**, mit welchem sich die Trainingsdaten in diesem Schritt bezüglich des Zielattributs am besten klassifizieren lassen. Das ermittelte Attribut wird nun zur Aufteilung der Daten verwendet. Auf die so entstandenen Teilmengen wird die Prozedur rekursiv angewendet, bis in jeder Teilmenge nur noch Objekte mit einer Klassifikation enthalten sind. Am Ende ist ein Entscheidungsbaum entstanden, der das Erfahrungswissen des Trainingsdatensatzen beschreibt.\n", + "\n", + "<div>\n", + "<img src=\"./Pics/Entscheidungsbaum.png\" width=\"700\"/>\n", + "</div>\n", + " \n" + ] + }, + { + "cell_type": "code", + "execution_count": 14, + "id": "ddaa9f73-1ae3-4707-a26c-e72c1a96bf9d", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "data": { + "image/png": "\n", + "text/plain": [ + "<Figure size 640x480 with 1 Axes>" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "X_train, y_train = generate_data(expanded=False)\n", + "\n", + "from sklearn.tree import DecisionTreeRegressor\n", + "\n", + "tree1 = DecisionTreeRegressor(max_depth=1).fit(X_train, y_train)\n", + "y_predicted1 = tree1.predict(X_train)\n", + "mse1 = mean_squared_error(y_train, y_predicted1)\n", + "\n", + "tree2 = DecisionTreeRegressor(max_depth=2).fit(X_train, y_train)\n", + "y_predicted2 = tree2.predict(X_train)\n", + "mse2 = mean_squared_error(y_train, y_predicted2)\n", + "\n", + "tree3 = DecisionTreeRegressor(max_depth=3).fit(X_train, y_train)\n", + "y_predicted3 = tree3.predict(X_train)\n", + "mse3 = mean_squared_error(y_train, y_predicted3)\n", + "\n", + "\n", + "data_frame = pd.DataFrame({'input': X_train[:,0], 'output': y_train})\n", + "ax1 = data_frame.plot.scatter(x='input', y='output', c='DarkBlue')\n", + "ax1.plot( X_train, y_predicted1, color='blue')\n", + "ax1.plot( X_train, y_predicted2, color='red')\n", + "ax1.plot( X_train, y_predicted3, color='green')\n", + "_ = ax1.set_title(f\"Mean squared errors = {mse1:.2f} {mse2:.2f} {mse3:.2f}\")\n", + "\n" + ] + }, + { + "cell_type": "markdown", + "id": "76b4b1aa-a86f-4240-815c-ea6a30d04415", + "metadata": {}, + "source": [ + "Anstatt ein Modell zu haben, das von Haus aus mit Nichtlinearität umgehen kann, könnten wir unsere Daten auch modifizieren: Wir könnten neue Merkmale erstellen, die von den ursprünglichen Merkmalen abgeleitet sind, indem wir etwas Expertenwissen nutzen. In diesem Beispiel wissen wir, dass wir eine kubische und quadratische Beziehung zwischen Daten und Ziel haben (weil wir die Daten erzeugt haben).\n", + "\n", + "Mit dieser Information könnten wir zwei neue Merkmale ($x^2$ und $x^3$) wie folgt erstellen. \n", + "Diese Art der Transformation wird als polynomiale Merkmalserweiterung bezeichnet:" + ] + }, + { + "cell_type": "code", + "execution_count": 15, + "id": "fcd2a5e5-66de-4b9b-94ec-434224a806dd", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "data": { + "image/png": "\n", + "text/plain": [ + "<Figure size 640x480 with 1 Axes>" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "X_train, y_train = generate_data(expanded=True)\n", + "\n", + "from sklearn.neural_network import MLPRegressor\n", + "from sklearn.linear_model import LinearRegression\n", + "from sklearn.metrics import mean_squared_error\n", + "\n", + "if True: \n", + " regressor = MLPRegressor(hidden_layer_sizes=(5,5,), random_state=1, \n", + " activation='identity', #\n", + " #activation='logistic', #\n", + " #activation='tanh', #\n", + " #activation='relu', # ‘identity’, ‘logistic’, ‘tanh’, ‘relu’\n", + " max_iter=500)\n", + "else: \n", + " regressor = LinearRegression()\n", + " \n", + "regressor.fit(X_train, y_train)\n", + "\n", + "#print( regressor.coefs_ )\n", + "#print( regressor.intercepts_ )\n", + "\n", + "y_predicted = regressor.predict(X_train)\n", + "mse = mean_squared_error(y_train, y_predicted)\n", + "\n", + "import pandas as pd\n", + "import matplotlib.pyplot as plt\n", + "data_frame = pd.DataFrame({'input': X_train[:,0], 'output': y_train})\n", + "ax1 = data_frame.plot.scatter(x='input', y='output', c='DarkBlue')\n", + "ax1.plot( X_train[:,0], y_predicted, color='red')\n", + "_ = ax1.set_title(f\"Mean squared error = {mse:.3f}\")" + ] + }, + { + "cell_type": "markdown", + "id": "bd94af80-46cd-4e65-8b1f-ed2df11bdddd", + "metadata": {}, + "source": [ + "Wir sehen, dass mit einem linearen Modell die Linearitätsbeschränkung des Modells überwunden werden kann, indem die nichtlinearen Komponenten bei der Entwicklung zusätzlicher Merkmale hinzufügen. Hier wurden neue Merkmale erstellt, indem man wusste, wie das Ziel generiert wurde bzw. welche gestzmäßigkeit dahinter stand.\n", + "\n", + "Anstatt solche polynomialen Merkmale manuell zu erstellen, kann man direkt `sklearn.preprocessing.PolynomialFeatures` verwenden.\n", + "\n", + "Um die Verwendung der Klasse `PolynomialFeatures` zu demonstrieren, verwenden wir eine Scikit-Learn-`Pipeline`, die zunächst die Merkmale transformiert und dann das Regressionsmodell anpasst.\n", + "Hierbei wird `include_bias=False` gesetzt, da wir sonst eine Spalte erstellen würden, die perfekt mit dem durch die LinearRegression eingeführten intercept_ korreliert. \n", + "Ob dieses Verfahren der manuellen Erstellung der Merkmale bis zum numerischen Fehler gleichwertig ist, kann überprüft werden, indem das Maximum der absoluten Werte der Differenzen zwischen den von beiden Methoden erzeugten Merkmalen beurteilt wird." + ] + }, + { + "cell_type": "code", + "execution_count": 16, + "id": "75709f30-925f-4170-97f5-c255b20abffd", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "data": { + "image/png": "\n", + "text/plain": [ + "<Figure size 640x480 with 1 Axes>" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "X_train, y_train = generate_data(expanded=False)\n", + "\n", + "from sklearn.pipeline import make_pipeline\n", + "from sklearn.preprocessing import PolynomialFeatures\n", + "\n", + "regressor = make_pipeline(\n", + " PolynomialFeatures(degree=2, include_bias=False),\n", + " LinearRegression(),\n", + ")\n", + "\n", + "regressor.fit(X_train, y_train)\n", + "\n", + "y_predicted = regressor.predict(X_train)\n", + "mse = mean_squared_error(y_train, y_predicted)\n", + "\n", + "import pandas as pd\n", + "import matplotlib.pyplot as plt\n", + "data_frame = pd.DataFrame({'input': X_train[:,0], 'output': y_train})\n", + "ax1 = data_frame.plot.scatter(x='input', y='output', c='DarkBlue')\n", + "ax1.plot( X_train[:,0], y_predicted, color='red')\n", + "_ = ax1.set_title(f\"Mean squared error = {mse:.3f}\")" + ] + } + ], + "metadata": { + "kernelspec": { + "display_name": "Python 3 (ipykernel)", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.8.10" + } + }, + "nbformat": 4, + "nbformat_minor": 5 +} diff --git a/Semester_2/Einheit_12/Pics/.ipynb_checkpoints/Training-checkpoint.png b/Semester_2/Einheit_12/Pics/.ipynb_checkpoints/Training-checkpoint.png new file mode 100644 index 0000000000000000000000000000000000000000..269c5099c0980556881c25dde81c8a45d9dec138 Binary files /dev/null and b/Semester_2/Einheit_12/Pics/.ipynb_checkpoints/Training-checkpoint.png differ diff --git a/Semester_2/Einheit_12/Pics/AufbauNeuron.png b/Semester_2/Einheit_12/Pics/AufbauNeuron.png new file mode 100644 index 0000000000000000000000000000000000000000..9d40d1e20be907fa1d3bb62667661205ccaa3410 Binary files /dev/null and b/Semester_2/Einheit_12/Pics/AufbauNeuron.png differ diff --git a/Semester_2/Einheit_12/Pics/Bluete.png b/Semester_2/Einheit_12/Pics/Bluete.png new file mode 100644 index 0000000000000000000000000000000000000000..79ceeacd18bd90e6e91b26eccea237da91262a3a Binary files /dev/null and b/Semester_2/Einheit_12/Pics/Bluete.png differ diff --git a/Semester_2/Einheit_12/Pics/Entscheidungsbaum.png b/Semester_2/Einheit_12/Pics/Entscheidungsbaum.png new file mode 100644 index 0000000000000000000000000000000000000000..77adb2c7af79b77ec664d7e3c326a1ad0e7290da Binary files /dev/null and b/Semester_2/Einheit_12/Pics/Entscheidungsbaum.png differ diff --git a/Semester_2/Einheit_12/Pics/Konfusionsmatrix.png b/Semester_2/Einheit_12/Pics/Konfusionsmatrix.png new file mode 100644 index 0000000000000000000000000000000000000000..ed2341911657019df4f1c2a1ee03414d7985d69f Binary files /dev/null and b/Semester_2/Einheit_12/Pics/Konfusionsmatrix.png differ diff --git a/Semester_2/Einheit_12/Pics/Methoden.png b/Semester_2/Einheit_12/Pics/Methoden.png new file mode 100644 index 0000000000000000000000000000000000000000..93c9f922f5d26fe1c67d5d68676445a4b8339c18 Binary files /dev/null and b/Semester_2/Einheit_12/Pics/Methoden.png differ diff --git a/Semester_2/Einheit_12/Pics/Netzwerk.png b/Semester_2/Einheit_12/Pics/Netzwerk.png new file mode 100644 index 0000000000000000000000000000000000000000..3a6884df38a74a201c1a6b2880dc29ad14d93046 Binary files /dev/null and b/Semester_2/Einheit_12/Pics/Netzwerk.png differ diff --git a/Semester_2/Einheit_12/Pics/Neuron.png b/Semester_2/Einheit_12/Pics/Neuron.png new file mode 100644 index 0000000000000000000000000000000000000000..c632b9eb0b6617aaa5912816a2e194d8c48abb10 Binary files /dev/null and b/Semester_2/Einheit_12/Pics/Neuron.png differ diff --git a/Semester_2/Einheit_12/Pics/QRCode.png b/Semester_2/Einheit_12/Pics/QRCode.png new file mode 100644 index 0000000000000000000000000000000000000000..6747198dd58e8e4f1c753a0a1b04ea39023647da Binary files /dev/null and b/Semester_2/Einheit_12/Pics/QRCode.png differ diff --git a/Semester_2/Einheit_12/Pics/Training.png b/Semester_2/Einheit_12/Pics/Training.png new file mode 100644 index 0000000000000000000000000000000000000000..269c5099c0980556881c25dde81c8a45d9dec138 Binary files /dev/null and b/Semester_2/Einheit_12/Pics/Training.png differ diff --git a/Semester_2/Einheit_12/Pics/decision_tree.png b/Semester_2/Einheit_12/Pics/decision_tree.png new file mode 100644 index 0000000000000000000000000000000000000000..43e668f06e662c2b72b78df253e858ccde8ff245 Binary files /dev/null and b/Semester_2/Einheit_12/Pics/decision_tree.png differ diff --git a/Semester_2/Einheit_12/iris.csv b/Semester_2/Einheit_12/iris.csv new file mode 100644 index 0000000000000000000000000000000000000000..fa85845b76a0a20252e05faefb5f4f0df1ba4c02 --- /dev/null +++ b/Semester_2/Einheit_12/iris.csv @@ -0,0 +1,151 @@ +sepal length,sepal width,petal length,petal width,species +5.1,3.5,1.4,0.2,Iris-setosa +4.9,3,1.4,0.2,Iris-setosa +4.7,3.2,1.3,0.2,Iris-setosa +4.6,3.1,1.5,0.2,Iris-setosa +5,3.6,1.4,0.2,Iris-setosa +5.4,3.9,1.7,0.4,Iris-setosa +4.6,3.4,1.4,0.3,Iris-setosa +5,3.4,1.5,0.2,Iris-setosa +4.4,2.9,1.4,0.2,Iris-setosa +4.9,3.1,1.5,0.1,Iris-setosa +5.4,3.7,1.5,0.2,Iris-setosa +4.8,3.4,1.6,0.2,Iris-setosa +4.8,3,1.4,0.1,Iris-setosa +4.3,3,1.1,0.1,Iris-setosa +5.8,4,1.2,0.2,Iris-setosa +5.7,4.4,1.5,0.4,Iris-setosa +5.4,3.9,1.3,0.4,Iris-setosa +5.1,3.5,1.4,0.3,Iris-setosa +5.7,3.8,1.7,0.3,Iris-setosa +5.1,3.8,1.5,0.3,Iris-setosa +5.4,3.4,1.7,0.2,Iris-setosa +5.1,3.7,1.5,0.4,Iris-setosa +4.6,3.6,1,0.2,Iris-setosa +5.1,3.3,1.7,0.5,Iris-setosa +4.8,3.4,1.9,0.2,Iris-setosa +5,3,1.6,0.2,Iris-setosa +5,3.4,1.6,0.4,Iris-setosa +5.2,3.5,1.5,0.2,Iris-setosa +5.2,3.4,1.4,0.2,Iris-setosa +4.7,3.2,1.6,0.2,Iris-setosa +4.8,3.1,1.6,0.2,Iris-setosa +5.4,3.4,1.5,0.4,Iris-setosa +5.2,4.1,1.5,0.1,Iris-setosa +5.5,4.2,1.4,0.2,Iris-setosa +4.9,3.1,1.5,0.1,Iris-setosa +5,3.2,1.2,0.2,Iris-setosa +5.5,3.5,1.3,0.2,Iris-setosa +4.9,3.1,1.5,0.1,Iris-setosa +4.4,3,1.3,0.2,Iris-setosa +5.1,3.4,1.5,0.2,Iris-setosa +5,3.5,1.3,0.3,Iris-setosa +4.5,2.3,1.3,0.3,Iris-setosa +4.4,3.2,1.3,0.2,Iris-setosa +5,3.5,1.6,0.6,Iris-setosa +5.1,3.8,1.9,0.4,Iris-setosa +4.8,3,1.4,0.3,Iris-setosa +5.1,3.8,1.6,0.2,Iris-setosa +4.6,3.2,1.4,0.2,Iris-setosa +5.3,3.7,1.5,0.2,Iris-setosa +5,3.3,1.4,0.2,Iris-setosa +7,3.2,4.7,1.4,Iris-versicolor +6.4,3.2,4.5,1.5,Iris-versicolor +6.9,3.1,4.9,1.5,Iris-versicolor +5.5,2.3,4,1.3,Iris-versicolor +6.5,2.8,4.6,1.5,Iris-versicolor +5.7,2.8,4.5,1.3,Iris-versicolor +6.3,3.3,4.7,1.6,Iris-versicolor +4.9,2.4,3.3,1,Iris-versicolor +6.6,2.9,4.6,1.3,Iris-versicolor +5.2,2.7,3.9,1.4,Iris-versicolor +5,2,3.5,1,Iris-versicolor +5.9,3,4.2,1.5,Iris-versicolor +6,2.2,4,1,Iris-versicolor +6.1,2.9,4.7,1.4,Iris-versicolor +5.6,2.9,3.6,1.3,Iris-versicolor +6.7,3.1,4.4,1.4,Iris-versicolor +5.6,3,4.5,1.5,Iris-versicolor +5.8,2.7,4.1,1,Iris-versicolor +6.2,2.2,4.5,1.5,Iris-versicolor +5.6,2.5,3.9,1.1,Iris-versicolor +5.9,3.2,4.8,1.8,Iris-versicolor +6.1,2.8,4,1.3,Iris-versicolor +6.3,2.5,4.9,1.5,Iris-versicolor +6.1,2.8,4.7,1.2,Iris-versicolor +6.4,2.9,4.3,1.3,Iris-versicolor +6.6,3,4.4,1.4,Iris-versicolor +6.8,2.8,4.8,1.4,Iris-versicolor +6.7,3,5,1.7,Iris-versicolor +6,2.9,4.5,1.5,Iris-versicolor +5.7,2.6,3.5,1,Iris-versicolor +5.5,2.4,3.8,1.1,Iris-versicolor +5.5,2.4,3.7,1,Iris-versicolor +5.8,2.7,3.9,1.2,Iris-versicolor +6,2.7,5.1,1.6,Iris-versicolor +5.4,3,4.5,1.5,Iris-versicolor +6,3.4,4.5,1.6,Iris-versicolor +6.7,3.1,4.7,1.5,Iris-versicolor +6.3,2.3,4.4,1.3,Iris-versicolor +5.6,3,4.1,1.3,Iris-versicolor +5.5,2.5,4,1.3,Iris-versicolor +5.5,2.6,4.4,1.2,Iris-versicolor +6.1,3,4.6,1.4,Iris-versicolor +5.8,2.6,4,1.2,Iris-versicolor +5,2.3,3.3,1,Iris-versicolor +5.6,2.7,4.2,1.3,Iris-versicolor +5.7,3,4.2,1.2,Iris-versicolor +5.7,2.9,4.2,1.3,Iris-versicolor +6.2,2.9,4.3,1.3,Iris-versicolor +5.1,2.5,3,1.1,Iris-versicolor +5.7,2.8,4.1,1.3,Iris-versicolor +6.3,3.3,6,2.5,Iris-virginica +5.8,2.7,5.1,1.9,Iris-virginica +7.1,3,5.9,2.1,Iris-virginica +6.3,2.9,5.6,1.8,Iris-virginica +6.5,3,5.8,2.2,Iris-virginica +7.6,3,6.6,2.1,Iris-virginica +4.9,2.5,4.5,1.7,Iris-virginica +7.3,2.9,6.3,1.8,Iris-virginica +6.7,2.5,5.8,1.8,Iris-virginica +7.2,3.6,6.1,2.5,Iris-virginica +6.5,3.2,5.1,2,Iris-virginica +6.4,2.7,5.3,1.9,Iris-virginica +6.8,3,5.5,2.1,Iris-virginica +5.7,2.5,5,2,Iris-virginica +5.8,2.8,5.1,2.4,Iris-virginica +6.4,3.2,5.3,2.3,Iris-virginica +6.5,3,5.5,1.8,Iris-virginica +7.7,3.8,6.7,2.2,Iris-virginica +7.7,2.6,6.9,2.3,Iris-virginica +6,2.2,5,1.5,Iris-virginica +6.9,3.2,5.7,2.3,Iris-virginica +5.6,2.8,4.9,2,Iris-virginica +7.7,2.8,6.7,2,Iris-virginica +6.3,2.7,4.9,1.8,Iris-virginica +6.7,3.3,5.7,2.1,Iris-virginica +7.2,3.2,6,1.8,Iris-virginica +6.2,2.8,4.8,1.8,Iris-virginica +6.1,3,4.9,1.8,Iris-virginica +6.4,2.8,5.6,2.1,Iris-virginica +7.2,3,5.8,1.6,Iris-virginica +7.4,2.8,6.1,1.9,Iris-virginica +7.9,3.8,6.4,2,Iris-virginica +6.4,2.8,5.6,2.2,Iris-virginica +6.3,2.8,5.1,1.5,Iris-virginica +6.1,2.6,5.6,1.4,Iris-virginica +7.7,3,6.1,2.3,Iris-virginica +6.3,3.4,5.6,2.4,Iris-virginica +6.4,3.1,5.5,1.8,Iris-virginica +6,3,4.8,1.8,Iris-virginica +6.9,3.1,5.4,2.1,Iris-virginica +6.7,3.1,5.6,2.4,Iris-virginica +6.9,3.1,5.1,2.3,Iris-virginica +5.8,2.7,5.1,1.9,Iris-virginica +6.8,3.2,5.9,2.3,Iris-virginica +6.7,3.3,5.7,2.5,Iris-virginica +6.7,3,5.2,2.3,Iris-virginica +6.3,2.5,5,1.9,Iris-virginica +6.5,3,5.2,2,Iris-virginica +6.2,3.4,5.4,2.3,Iris-virginica +5.9,3,5.1,1.8,Iris-virginica \ No newline at end of file