Machine Learning | – der Kopf hinter der KI
Lesezeit: 4 Min
Künstliche Intelligenzen wie DALL-E oder ChatGPT lassen uns derzeit nicht schlecht darüber staunen, was KI alles kann. Doch was sind eigentlich die grundlegenden Lernmechanismen der KI und welche Arten gibt es? Darüber klärt Sie AI Engineer und KI-Experte Hans Torben Löfflad in seinem Gastbeitrag auf.
Viele moderne KI-Anwendungen generieren ihr Wissen durch Machine Learning. Unterscheidet eine KI beispielsweise Äpfel von Birnen, so erlernt das dahinterliegende Machine Learning Modell beispielsweise anhand der Pixel, wie sich Äpfel von Birnen unterscheiden. Aber welche Arten von Machine Learning gibt es eigentlich? Und für welche Anwendungen werden sie verwendet?
Supervised Learning
Beim Supervised Learning oder zu Deutsch „überwachtes Lernen“ wird das Machine Learning Modell beim Lernen an die Hand genommen. Vorstellen können Sie sich Supervised Learning mit dem Lernverhalten von Kleinkindern. Ein Kind, dessen Mutter ihm erklärt: „Schau mal, das ist eine Ente und da drüben, das ist ein Schwan!“, lernt die beiden Tiere voneinander zu unterscheiden. Dabei gibt die Mutter nicht vor, anhand welcher Merkmale sich eine Ente von einem Schwan unterscheidet. Vielmehr findet das Kind eigene Wege, die beiden Tiere zu unterscheiden.
Übertragen auf das Machine Learning Modell gibt der/die Data Scientist:in Merkmale wie beispielsweise Bilder oder Produktspezifikationen und sogenannte Labels (Ente, Schwan oder Preise) vor.
Anhand der Daten macht das Machine Learning Modell eine Vorhersage über das Label, welches mit dem wahren Label verglichen wird. Weicht die Vorhersage vom erwarteten Ergebnis ab, passt das Machine Learning Modell seine Entscheidungsregeln an, mit dem Ziel die Vorhersage zu verbessern.
Im Gegensatz zu einem Kind benötigt das Machine Learning Modell jedoch wesentlich mehr Beispiele, um zu lernen. Oftmals geht es um mehr als 10.000 Beispiele.
Herausforderung des Supervised Learnings
Das überwachte Lernen stellt hohe Anforderungen an die Verfügbarkeit von Daten. Außerdem setzt die hohe Anzahl an notwendigen Beispielen eine repetitive Aufgabe voraus, die oft genug wiederholt werden muss. Zuletzt kann das Labeln der Daten einen zeitlich großen Aufwand innerhalb des Projekts darstellen. Dennoch sind die Einsatzfelder von überwachtem Lernen vielfältig und lassen sich in zwei Kategorien gliedern: Klassifikation und Regression. Wie der Name Klassifikation vermuten lässt, werden die Beispiele Klassen zugeordnet. So lassen sich mithilfe von Bilddaten beispielsweise Produktionsfehler oder Qualitätsklassen erkennen. Im Fall der Regression geht es darum, einen spezifischen Wert vorherzusagen. Dies kann beispielsweise verwendet werden, um Preise oder die Restlebensdauer einer Produktionsmaschine mithilfe von Sensordaten vorherzusagen.
Unsupervised Learning
Konträr zum Supervised Learning steht das Unsupervised Learning oder auch „unüberwachtes Lernen“. Hierbei identifiziert das Machine Learning Modell ohne jegliches Vorwissen Gruppen oder Cluster aus den Daten.
Das bedeutet, dass hierbei „Schubladen“ ohne jegliche Vorurteile befüllt werden. Vielmehr wird jeder Eintrag mit dem anderen verglichen und nach sorgfältiger Abwägung in die richtige Schublade gelegt. Ob dabei in jeder Schublade eine feste Anzahl an Einträgen oder eine feste Anzahl an Schubladen mit beliebig vielen Einträgen befüllt wird, ist abhängig vom Algorithmus.
Hierfür gibt der/die Data Scientist:in Merkmale wie zum Beispiel Kundeninformationen oder Sensordaten vor. Anhand der Daten bestimmt das Machine Learning Modell die Ähnlichkeit der einzelnen Einträge zueinander. So sind sich Kund:innen, die einen Laptop bzw. ein Smartphone kaufen, ähnlicher als Kund:innen, die sich Make-up kaufen. Anhand der Ähnlichkeit der Einträge zueinander werden die Gruppen oder Cluster gebildet.
Was spricht für Unsupervised Learning?
Der große Vorteil unüberwachter Lernverfahren gegenüber überwachten Lernverfahren ist, dass keine gelabelten Daten benötigt werden. Dies reduziert den Aufwand der Datenerhebung enorm. Gleichzeitig können die gebildeten Gruppen und Cluster unerwünschte Charakteristika aufweisen. Wird beispielsweise anhand der Gruppierung der Einkäufe eine Produktempfehlung ausgesprochen, so wird im obigen Beispiel dem Käufer des Make-ups vermutlich auch Wimperntusche empfohlen, obwohl das Make-up ein einmaliger Kauf für Halloween war und somit unpassend ist. Mit der notwendigen Vorsicht stellen unüberwachte Lernverfahren ein mächtiges Tool dar, welches nicht nur neue Einsichten liefern kann, sondern einen hohen Mehrwert mit vielfältigen Einsatzmöglichkeiten verspricht. Dabei sind sowohl Kundensegmentierungen als auch Empfehlungssysteme essenziell für eine individuelle und zeitgemäße Kundenansprache. Es besteht aber auch die Möglichkeit, mit Hilfe von unüberwachten Lernverfahren den Zustand von Produktionsanlagen zu überwachen.
Reinforcement Learning
Einen etwas anderen Ansatz verfolgt das Reinforcement Learning oder zu Deutsch „bestärkendes Lernen“. Ausschlaggebend für den Lernerfolg des Machine Learning Modells sind hier Feedback und Interaktion mit der Umwelt. Vergleichbar ist bestärkendes Lernen mit der Erziehung eines Haustiers. Befolgt der Hund die Befehle des Herrchens, winkt ein Leckerli. Macht er, was er will, bleibt die Belohnung aus. Probiert der Hund anfangs noch vieles aus, so wird er mit der Zeit das gewünschte Verhalten erlernen.
Übertragen auf das Machine Learning Modell ist es die Aufgabe der Data Scientist:innen die richtige Belohnungsstrategie auszuarbeiten und dem System die benötigten Daten zur Verfügung zu stellen. Interagiert nun das Modell mit der Umwelt, ist es zwingend notwendig, den Lernfortschritt des Systems zu überwachen und gegebenenfalls einzugreifen.
Die Challenge des Reinforcement Learnings
Hier wird schon die größte Herausforderung bei der Arbeit mit bestärkendem Lernen ersichtlich, denn das erlernte Verhalten und das gewünschte Verhalten können divergieren. Dabei liegt die große Herausforderung darin, das Anreizsystem richtig zu wählen. Gelingt dies, ist es möglich, komplexe Aufgaben zu automatisieren. Denkbar sind hier beispielsweise eine Routenplanung für Lieferfahrzeuge. Ein weiterer Anwendungsfall ist die Optimierung der Produktionsplanung. Mithilfe eines Digital Twins kann die Produktion beliebig oft simuliert und so nach der aktuellen Auftragslage die Produktionsplanung optimiert werden.
Machine Learning: Alle Arten auf einen Blick
Erschlagen? Wir machen Ihnen den Einstieg leicht. Egal, ob Sie einen eigenen Anwendungsfall haben und Unterstützung bei der Umsetzung benötigen oder ob Sie mehr über das Thema KI erfahren möchten. Unsere KI-Expert:innen unterstützen Sie bei Ihrem Vorhaben.