Content-feeback-grafik-large-v2

Wie Empfehlungssysteme unseren Konsum beeinflussen

24.05.2023
Lesezeit: 7 Min

„Kund:innen, die das gekauft haben, haben auch das gekauft“ – fast jede:r kennt sie, die Vorschläge, die uns verschiedene Onlineshops machen, sobald wir ein Produkt anschauen. Als eine der früheren künstlichen Intelligenzen sind die sogenannten Empfehlungssysteme eines der bekanntesten Beispiele im Bereich E-Commerce. Doch wie funktionieren diese Systeme, welche Unterschiede gibt es und haben sie sich seither weiterentwickelt? Unser Gastautor Mirko Ulrich, mmmake AI Engineer, gibt in seinem Beitrag über dieses Thema eine erste Einführung.

Inhalt

Empfehlungssysteme, auch bekannt als Recommendation Engine oder Recommender System, sind aus vielen Onlineservices nicht wegzudenken. Was wären Amazon, Netflix oder Spotify ohne die Empfehlungen für ihre jeweiligen Produkte?

Empfehlungen in der Realität vs. Empfehlungen online

Stellt man sich die perfekten Einzelhändler:innen aus Kundensicht vor, so dürfte folgende Eigenschaft wohl nicht fehlen: Eine fachkundige Person, welche ihre Produkte ganz genau kennt und den Kund:innen genau die richtigen Juwelen aus ihrem Repertoire empfehlen kann. Dabei spielt es keine Rolle, ob es sich um Stamm- oder Neukund:innen handelt. Der versierte Blick des idealen Händlers liest den Stöbernden die Wünsche von den Lippen ab. 

Doch wie integrieren wir diese Eigenschaft in Digital Services? Wir imitieren einfach diese ideale Verkaufsperson!

Personen mit ähnlichem Geschmack werden in ähnlichen Situationen ähnliche Entscheidungen treffen. Diese Prämisse bildet die Grundlage von Empfehlungssystemen. Ein:e User:in eines Services befindet sich in einer bestimmten Situation – das Bedürfnis ist also schon definiert. Auf Basis der Historie dieses und aller anderen User:innen und unter Berücksichtigung der Kenntnisse über die angebotenen Produkte (Items), kann dem/der User:in ein sinnvoller Vorschlag gemacht werden. 

Dabei gibt es vier verschiedene Ansätze von Empfehlungssystemen, die sich in der Art und Weise unterscheiden, wann User:innen bzw. Items als „ähnlich“ gelten. 

Empfehlungen durch Feedback: explizit & implizit

Der Geschmack eines/einer Users:in erklärt sich durch das Feedback desselben. Hier wird in zwei Kategorien unterteilt: explizites und implizites Feedback.  

Explizites Feedback, beispielsweise in Form der allgegenwärtigen 1-bis-n-Sterne-Bewertungen ist dabei die wertvollste Information. Der/die User:in gibt auf einer Skala an, wie zufrieden er/sie mit der Auswahl bzw. der Empfehlung war. Allerdings erfordert diese Form von Feedback Engagement der User:innen, was häufig ausbleibt. Die Gründe mögen vielfältig sein, das Resultat ist jedoch eindeutig: Nur ein Bruchteil der Kund:innen geben – auf Nachfrage – Bewertungen über konsumierte Produkte ab. 

Daran können Anbieter:innen nichts ändern. Jedoch können sie sich implizites Feedback zunutze machen! Jede Interaktion eines/einer Users:in mit einem Item gibt Informationen: Welche Items wurden angesehen, in welchen Kategorien gesucht, was landete im Warenkorb, bevor schlussendlich welches Item gekauft wurde? Im einfachsten Falle kann dieses implizite Feedback auf die binäre Aussage reduziert werden: Hat ein:e User:in mit einem Item interagiert? 

Wenn man sich das Bild der idealen Krämer:in vergegenwärtigt, so wird beispielsweise aufgrund der Beobachtung einer stöbernden Kund:in genau die richtige Empfehlung ausgesprochen oder auf Basis von Bewertungen der Kund:in jenes Objekt ausgewählt, das die bisherigen Erfahrungen perfekt ergänzt. 

Empfehlungssysteme – verschiedene Ansätze, ähnliche Ergebnisse?

Um auf die unterschiedlichen Ansätze der Empfehlungssysteme einzugehen und einfacher zu erklären, dient folgendes Beispiel:  

User Alex sucht auf einer Streamingplattform nach einem Film. Die Historie von Alex verrät, dass die Produkte „Reservoir Dogs“, „Pulp Fiction“ und „Kill Bill“ gut angekommen sind. 

Inhaltsbasierte Empfehlungen (Content-based)

Hierbei werden Items empfohlen, die eine hohe Ähnlichkeit zu Items aufweisen und dem/der User:in deshalb gefallen könnten. Dazu muss es nicht einmal Aufzeichnungen über den/die User:in geben. Bei der Abfrage über den Filmgeschmack gibt Alex bei Filmen wie “Pulp Fiction” und “Reservoir Dogs” ein „Fand-ich-ganz-nett“ an. Daraufhin konzentriert sich das System auf diese Items und liefert ähnliche Inhalte. 

Doch wann sind sich Items ähnlich? Diese Frage kann auf verschiedene Arten beantwortet werden – meist unter Nutzung verschiedener Technologien: Bei den von Alex angegebenen Filmen liegt die Vermutung nahe, dass Filme von Quentin Tarantino ganz gut passen dürften. Oder vielleicht doch Filme aus den Neunzigern? Oder andere Werke, die von Lawrence Bender produziert wurden? Das sind Beispiele für regelbasierte Empfehlungen. Meist ist intuitiv nachvollziehbar, durch welche Verbindung ein Item empfohlen wurde. Aber das kann ein:e wohlinformierte:r User:in auch allein bewerkstelligen. 

Durch Embeddings können Items als Vektoren beschrieben werden – sogenannte Feature-Vectors. Dabei werden Eigenschaften der Items durch numerische Werte ausgedrückt. Die beschriebenen Vektoren werden genutzt, um ähnliche Items zu finden. Embeddings können beispielsweise durch Methoden des Natural-Language-Processing auf der Zusammenfassung oder Beschreibung erstellt werden. Deep-Learning-Modelle, eine Spielart von Machine Learning, können auf große Datenmengen trainiert werden, um solche Embeddings auf Basis des eigentlichen Contents anzufertigen.

Egal wie diese Embeddings erstellt werden, schlussendlich ist es möglich, durch eine Metrik festzustellen, wie ähnlich sich Werke einer intuitiven Gruppe sind. Und noch viel wichtiger: Welche (eventuell unerwarteten) Items dem/der User:in präsentiert werden können. Auf diese Weise könnte Alex von „Natural Born Killer“ erfahren, dessen grundlegende Story ebenfalls von Tarantino stammt, jedoch von Oliver Stone realisiert wurde.

Der große Nachteil: Bei dem bisher beschriebenen Ansatz wird der/die User:in beinahe vollständig ignoriert, abgesehen von der initialen Abfrage, was ihm/ihr gefallen hat. Der nächste Ansatz ändert dies. 

Empfehlungen durch kollaboratives Filtern

Bei Ansätzen des kollaborativen Filterns stehen die User:innen und ihre Historie im Mittelpunkt. Die Aufzeichnungen zu den User:innen erlauben es, auch diese durch ein Embedding zu beschreiben. Sobald die vektorielle Darstellung verfügbar ist, kann wieder mit verschiedenen Metriken ein:e ähnlich:er andere:r User:in bestimmt werden. Items, mit denen diese:r User:in zufrieden war, gefallen wahrscheinlich auch dem/der ursprünglichen Nutzer:in. Auf diesem Wege könnte Alex auf Robert Rodriguez aufmerksam werden. 

Auf Basis des Nutzungsverhaltens der User:innen kann also festgestellt werden, welche User:innen sich ähnlich sind. Dieser Ansatz kann jedoch auch detaillierter angewandt werden. Kommen wir zurück zu Alex in der (virtuellen) Videothek: Auch wenn das Faible für Tarantino bekannt ist, wäre es vermutlich nicht der richtige Zeitpunkt, ihm “Django Unchained” vorzuschlagen, während er “Toy Story”, “Ratatouille” und “Findet Nemo” betrachtet.  

Es lohnt sich also immer, das aktuelle Nutzer:innenverhalten in einer Session zu berücksichtigen. Durch den Vergleich der Sessions kann anschließend das aktuelle Bedürfnis des/der Users:in erfasst werden. Durch die geschickte Kombination aus der globalen Historie eines/einer Users:in und der aktuellen Session kann dem/der User:in vermittelt werden, dass sowohl die üblichen als auch die akuten Bedürfnisse berücksichtigt werden.

Auf diese Weise könnte man feststellen, dass Alex etwas sucht, das er mit seinen Nichten und Neffen anschauen möchte. Somit wäre „Zoomania“ wohl eine wundervolle Empfehlung.

Graue Schafe und kalte Maschine – die Nachteile des kollaborativen Filterns

Natürlich hat jeder Ansatz auch seine Schwächen:

Das gewählte Beispiel mit Alex‘ Vorliebe für Tarantino-Filme ist ein recht dankbares Szenario. Die Vorliebe ist derart speziell, dass ziemlich klar umrissen ist, womit der/die User:in abgeholt werden kann. Außerdem gibt es auch naheliegende nächste Adressen, wie Rodriguez oder das Honkong-Kino der 1970er und 1980er. Was aber wissen wir über einen/eine User:in mit Vorliebe für romantische Komödien, MCU und Michael Bay? Das sind derart wenig spezifische Hinweise, dass der/die User:in durch nichts heraussticht – unauffällig wie ein graues Schaf. 
Das ist ein ernstzunehmendes Problem, da solche User:innen durch kollaboratives Filtern zum Mainstream hingezogen werden. Wenn über einen längeren Zeitraum viele solcher mainstreamzentrierten Aufzeichnungen gesammelt werden, besteht die Gefahr, dass ein cleveres System zu einer banalen Top-Ten-Liste verkommt.

Weiter stellt sich die Frage, wie das System mit neuen Items umgehen soll. Im Falle des strikten kollaborativen Filterns sind die neuen Angebote praktisch unsichtbar. Da noch niemand damit interagiert hat, kann es nicht empfohlen werden. Neukund:innen können das System vor ähnliche Herausforderungen stellen, denn wenn es keine Historie gibt, womit soll dann abgeglichen werden? Dieses als „Cold Start“ bekannte Phänomen muss überwunden werden, damit die Empfehlungen für alle Kund:innen relevant sein können. 

Die Lösung: the best of all worlds

Obwohl inhaltsbasierte Ansätze die Historie der User:innen ignorieren, könnten sie der Schlüssel sein, um das Cold-Start-Problem zu lösen. Angenommen, die Informationen einer Produktpalette wären ausreichend, um die Ähnlichkeit einzelner Artikel über eine Metrik zu bemessen, könnten neue Items gemeinsam mit den Positionen empfohlen werden, denen sie am ähnlichsten sind. Dadurch könnte das Nutzer:innenverhalten berücksichtigt und neue Angebote eingearbeitet werden. 

Die Problematik mit den grauen Schafen könnte behoben werden, indem mehrere Subsysteme für Empfehlungen kombiniert werden. Neben All-Time-Favourites gibt es beispielsweise auch genrespezifische Empfehlungen oder solche, die genau nicht in den Top-n-Produkten sind. Dadurch bekommt der/die User:in ein breiteres Angebot und gibt gleichzeitig dem System neue Informationen, um künftig präziser auf die persönlichen Bedürfnisse einzugehen. 

Mehr Information, mehr gut!

Die bisher beschriebenen Ansätze zeigen einen Entwicklungsweg, bei dem zunächst das Produkt im Zentrum steht und sich dieser Fokus dann auf den/die User:in verschiebt. Jedoch wird beim kollaborativen Filtern lediglich die offensichtliche Historie genutzt. Je mehr Informationen über die User:innen und ihren Kontext übermittelt werden, desto spezifischer die Empfehlungen. Auch auf Anomalien im Nutzungsverhalten könnte reagieren werden. Etwa, wenn ein ungewöhnlicher Kontext der Nutzung (Zeitpunkt, Umfang, …) auf neue Lebensumstände der User:innen oder ein Problem bei der Sicherheit des Accounts hinweisen. 

Die Zeit geht an niemandem spurlos vorbei. Niemand ist dieselbe Person, wie vor zehn Jahren – oder zehn Wochen? Heutzutage ändert sich die Welt und damit auch der Konsum viel schneller. Welcher Konsum war prägend für den persönlichen Geschmack, was kann lediglich einer Phase oder einem Trend zugeschrieben werden? Um beim Beispiel-User Alex zu bleiben: Welche Zeitspanne liegt zwischen einer auffälligen Häufung romantischer Filme und dem regelmäßigen Konsum von Kinderfilmen? Mit derlei Fragen beschäftigt sich die Klasse der time-aware Recommender Systems. 

„You had my curiosity, now you have my attention.“

Große Multikategorie-Stores und Streaminganbieter haben sich etabliert, unter anderem indem sie ihren User:innen auf bequeme Art nützliche Empfehlungen aussprechen konnten. Jede:r Anbieter:in von Produkten oder Services steht vor der Frage, was seine/ihre Kund:innen genau wollen, wenn sie zu ihnen kommen. Welche weiteren Artikel sollten am besten vorgeschlagen werden? Mit unseren Data Science Services unterstützen und beraten wir Sie mit individuellen Lösungen für Empfehlungssysteme Ihrer Onlineservices und implementieren diese. Sprechen Sie mit unseren Expert:innen!

Wie Empfehlungssysteme technisch umgesetzt werden und was Sie dabei bedenken müssen, erfahren Sie bald im nächsten Artikel von Mirko.


Der Autor
AI Engineer

Kontakt