Supervised Machine Learning

Glossar
SchlüsselwörterÜberwachtes Lernen, überwachten Lernen, supervised learning, supervised machine learning, überwachtes maschinelles Lernen
TypKI-Methode

Beim überwachten Lernen (supervised learning) wird ein Algorithmus mit Trainingsdaten und dazugehörigen Lösungen trainiert.

Das Supervised Machine Learning zu Deutsch überwachtes Lernen stellt eine Teil der Maschine-Learning-Methoden dar. Der Algorithmus wird auf Basis von gekennzeichneten In- und Output Daten trainiert. Der Algorithmus lernt auf den vom Menschen vorgeben Zuweisungen, z.B. von Merkmalen (Input) zu Inhalten (Output). Der Mensch nimmt bei dieser Methoden eine zentrale Position als Entscheidungsträger bzw. als Gesetzgeber von Zusammenhängen ein. Ein Beispiel für überwachtes Lernen ist die Klassifizierung von Bildern (z. B. Hunde vs. Katzen).

Lernansätze

Entscheidungsbäume (Decision Tree)

Entscheidungsbäume stellen Diagramme dar, in denen Entscheidungen in einer hierarchische Struktur von Entscheidungsknoten und möglichen Ergebnissen aufgezeigt werden. Entscheidungen werden auf Basis von Prämissen oder Gesetzen getroffen und folgen einem Ergebnispfad, wie z.B. „…wenn Wert X größer als Schwellenwert, dann…“. Jeder Knoten im Baum repräsentiert eine Entscheidung oder eine Bedingung, die Verzweigungen von diesem Knoten führen zu weiteren Entscheidungen oder einem Endknoten.

Naive Bayes

Naive Bayes ist eine Klassifizierungsmethode, die häufig für die Einordnung von Daten verwendet wird. Sie nimmt die Unabhängigkeit aller Merkmale (Daten) an und basiert auf dem Bayes-Theorem, das besagt, dass die Wahrscheinlichkeit, dass ein Ereignis eintritt, basierend auf der Wahrscheinlichkeit anderer Faktoren berechnet werden kann. Mit anderen Worten, die Eintrittswahrscheinlichkeiten von Ereignissen wird auf Basis von beobachtbaren Daten (Merkmalen) beschrieben. Um Naive Bayes auf Daten anzuwenden, wird der Klassifikator zuerst mit Trainingsdaten trainiert, um die Wahrscheinlichkeiten für jedes Merkmal in einer Klasse zu schätzen.

Support Vector Machine (SVM)

Eine Support Vector Machine ist eine Technik des Maschinellen Lernens, die häufig im Rahmen von Klassifizierungen und Regressionsanalysen verwendet wird. Es handelt sich dabei um einen Lernalgorithmus der darauf abzielt, die optimale Trennung zwischen zwei oder mehr Klassen in einem Merkmalsraum zu finden. Solche Modelle suchen nach einer Entscheidungsgrenze zwischen Klassen. Dies geschieht in „Hyperebenen“, welche die Klassen in einem höherdimensionalen Raum trennen. Die Hyperebene wird durch die sogenannten Support-Vektoren bestimmt, welche die Punkte in den Trainingsdaten repräsentieren. Die Hyperebene wird so gewählt, dass der Abstand (auch als „Margin“ bezeichnet) zwischen der Hyperebene und den nächstgelegenen Trainingsdatenpunkten (den sogenannten „Support Vektoren“) maximiert wird. Durch die Maximierung der Margin kann die SVM eine bessere Generalisierungsfähigkeit erreichen, was bedeutet, dass sie auch auf bisher ungesehene Daten gut anwendbar ist.


WEITERFÜHRENDE LITERATUR