Eine Empfehlungsengine, auch Recommender genannt, ist ein System mit künstlicher Intelligenz (KI), das einem Nutzer Artikel vorschlägt. Empfehlungssysteme basieren auf Analysen von Big Data und Algorithmen des maschinellen Lernens (ML), um Muster in Daten zum Nutzerverhalten zu finden und auf der Grundlage dieser Muster relevante Artikel zu empfehlen.
Empfehlungsengines helfen Nutzern, Inhalte, Produkte oder Dienstleistungen zu entdecken, die sie von sich aus möglicherweise nicht gefunden hätten. Diese Systeme sind ein wesentlicher Bestandteil der Umsatzgenerierung und der Förderung des Engagements für viele Online-Unternehmen, einschließlich E-Commerce-Websites, Streaming-Plattformen, Suchmaschinen und Social Media-Netzwerken.
Ein Recommender schlägt den nächsten Film oder das nächste Video zum Ansehen vor, einen ähnlichen Song zum Anhören, relevante Suchergebnisse oder ein Produkt, das zu einer bestimmten Bestellung passt.
Auch die von Empfehlungssystemen erstellten Vorschläge spielen bei der Personalisierung der Nutzererfahrung eine wichtige Rolle. Laut einer Studie der Unternehmensberatung McKinsey kann die Personalisierung den Umsatz um 5 bis 15 % steigern. Außerdem sind 76 % der Kunden frustriert, wenn sie keine personalisierte Interaktion erleben.
Der Markt für Empfehlungssysteme wächst. Im Jahr 2024 wird der Markt für Empfehlungsengines auf 6,88 Milliarden USD geschätzt, und diese Marktgröße wird sich innerhalb von 5 Jahren voraussichtlich verdreifachen.
Um Nutzer mit passenden Vorschlägen anzusprechen, verbindet eine Empfehlungsengine Data Science und maschinelles Lernen.
Recommender arbeiten in der Regel in 5 Phasen, um die zutreffendsten Empfehlungen vorherzusagen:
Daten sind die Grundlage eines Empfehlungssystems, daher ist die Datenerfassung ein wichtiger erster Schritt. Zu den beiden wichtigsten Arten von Daten, die erfasst werden sollen, gehören explizite und implizite Daten.
Explizite Daten umfassen Nutzeraktionen und -aktivitäten wie Kommentare, Likes, Bewertungen und Rezensionen. Implizite Daten umfassen Nutzerverhalten wie Browserverlauf, Warenkorbereignisse, Klicks, vergangene Käufe und Suchverlauf.
Recommender verwenden auch andere Kundendaten wie demografische (Alter oder Geschlecht) und psychografische Daten (Interessen oder Lebensstil), um ähnliche Nutzer zu finden, sowie Funktionsdaten (wie Preisspanne oder Artikeltyp), um verwandte Produkte oder Dienstleistungen zu bestimmen.
Nachdem die Daten erfasst wurden, besteht der nächste Schritt darin, sie zu speichern. Die Art des Speichersystems hängt von der Art der erfassten Daten ab.
Ein Data Warehouse kann Daten aus verschiedenen Quellen zusammenfassen, um Datenanalysen und maschinelles Lernen zu unterstützen, während Data Lakes sowohl strukturierte als auch unstrukturierte Daten speichern können.
Ein Data Lakehouse kombiniert die besten Aspekte von Data Warehouses und Data Lakes in einer einzigen Datenmanagementlösung.
In der Analysephase werden Algorithmen des maschinellen Lernens eingesetzt, um Datensätze zu verarbeiten und zu untersuchen. Diese Algorithmen erkennen Muster, identifizieren Korrelationen und wägen die Stärke dieser Muster und Korrelationen ab. Modelle für maschinelles Lernen können anhand großer Datensätze trainiert werden, um passende Empfehlungen zu geben.
Der letzte Schritt besteht darin, die Daten zu filtern, sodass die relevantesten Elemente aus der vorherigen Analysephase angezeigt werden. Bei der Datenfilterung werden je nach Art der verwendeten Empfehlungsengine bestimmte mathematische Regeln und Formeln auf die Daten angewendet.
Es kann ein optionaler Schritt zur Präzisierung hinzugefügt werden, um die Ausgaben eines Empfehlungssystems regelmäßig zu bewerten und das Modell weiter zu optimieren mit dem Ziel der kontinuierlichen Verbesserung von Genauigkeit und Qualität.
Recommender unterscheiden sich je nach verwendeter Filtermethode. Im Allgemeinen gibt es 3 Arten von Empfehlungsengines:
Ein kollaboratives Filtersystem filtert Vorschläge basierend auf der Ähnlichkeit eines bestimmten Nutzers mit anderen. Kollaborative Empfehlungssysteme stützen sich auf explizite und implizite Daten und gehen davon aus, dass Nutzer mit vergleichbaren Präferenzen wahrscheinlich an denselben Artikeln interessiert sind und in Zukunft auf ähnliche Weise mit ihnen interagieren werden.
Amazon zum Beispiel verwendet kollaborative Filterung für seine Produktempfehlungen, genau wie Spotify für seine Audioinhalte.
Recommender mit kollaborativer Filterung können wirksame Vorschläge machen und benötigen in der Regel keine detaillierten Artikelbeschreibungen. Allerdings ist kollaboratives Filtern auch anfällig für das Kaltstartproblem. Dieses tritt auf, wenn das System nur begrenzte historische Daten zur Verfügung hat, insbesondere bei neuen Nutzern.
Es gibt zwei Hauptarten von kollaborativen Filtersystemen: speicherbasierte und modellbasierte.
Speicherbasierte Systeme stellen Nutzer und Elemente als Matrix dar. Sie sind eine Erweiterung des KNN-Algorithmus (K-Nearest-Neighbors), weil sie ihre „nächsten Nachbarn“ finden möchten, die ähnliche Nutzer oder ähnliche Artikel sein können. Speicherbasierte Systeme werden weiter in zwei Typen unterteilt:
Alternativ erstellen modellbasierte Systeme ein prädiktives maschinelles Lernmodell der Daten. Die Matrix Nutzer–Element dient als Trainingsdatensatz für das Modell, das Vorhersagen für Missing Values liefert, d. h. für Artikel, die ein Nutzer noch nicht gefunden hat und die daher empfohlen werden.
Einer der am häufigsten verwendeten modellbasierten kollaborativen Filteralgorithmen ist die Matrixfaktorisierung. Diese Methode zur Dimensionsreduktion unterteilt die oft große Benutzer-Element-Matrix in zwei kleinere Matrizen (eine für Benutzer und eine für Elemente), die nur wenige Dimensionen haben. Die beiden Matrizen werden dann miteinander multipliziert, um die Missing Values (oder die Empfehlungen) in der größeren Matrix vorherzusagen.
Eine fortgeschrittenere Implementierung der Matrixfaktorisierung nutzt neuronale Deep-Learning-Netze. Andere modellbasierte Systeme nutzen Algorithmen des maschinellen Lernens wie Bayes-Klassifikatoren, Clustering und Entscheidungsbäume.
Ein inhaltsbasiertes Filtersystem filtert Empfehlungen basierend auf den Funktionen eines Artikels. Inhaltsbasierte Empfehlungssysteme gehen davon aus, dass, wenn einem Nutzer ein bestimmter Artikel gefällt, er auch einen anderen ähnlichen Artikel mögen wird. Die inhaltsbasierte Filterung berücksichtigt Artikelbeschreibungen wie Farbe, Kategorie, Preis und andere Metadaten, die durch Schlüsselwörter und Tags zugewiesen wurden, sowie explizite und implizite Daten.
Inhaltsbasierte Filtersysteme stellen Elemente und Nutzer als Vektoren in einem Vektorraum dar. Nähe wird verwendet, um die Ähnlichkeit zwischen Artikeln zu bestimmen. Je näher sich zwei Vektoren im Raum befinden, als desto ähnlicher werden sie eingestuft. Dem Nutzer werden Vektoren empfohlen, die den vorherigen Artikeln entsprechend den bereitgestellten Merkmalen ähneln.
Inhaltsbasierte Recommender wenden einen nutzerbasierten Klassifikator oder ein Regression-Modell an. Beschreibungen und Merkmale von Artikeln, an denen ein Nutzer interessiert ist, fungieren als Trainingsdatensatz für das Modells, das dann Vorhersagen für empfohlene Artikel liefert.
Inhaltsbasierte Empfehlungssysteme können durch die Verwendung von Tags zur Verarbeitung natürlicher Sprache weiter verbessert werden. Dieser Tagging-Prozess kann jedoch bei großen Datenmengen mühsam sein.
Anders als bei der kollaborativen Filterung ist das Kaltstartproblem weniger ein Problem, da die inhaltsbasierte Filterung auf Metadatenmerkmalen und nicht auf früheren Nutzerinteraktionen basiert. Die inhaltsbasierte Filterung kann beim Entdecken neuer Elemente jedoch eingeschränkt sein, da sie häufig Elemente vorschlägt, die den Nutzern zuvor gefallen haben und denen ähnlich sind.
Wie der Name schon sagt, kombiniert ein hybrides Empfehlungssystem kollaborative Filterung und inhaltsbasierte Filterung.
Ein hybrider Ansatz kann die Leistung einer Empfehlungsengine erheblich verbessern, erfordert jedoch fortschrittliche Architekturen und intensive Rechenleistung.
Netflix verwendet zum Beispiel ein hybrides Empfehlungssystem für seine Film- und Fernsehsendungsempfehlungen.
Eine Empfehlungsengine kann sowohl für Unternehmen als auch für Nutzer einen Mehrwert schaffen. Hier sind einige Vorteile, die Unternehmen durch die Investition in Empfehlungssysteme erzielen können:
Die Empfehlung des richtigen Produkts oder der richtigen Dienstleistung spart den Nutzern Zeit beim endlosen Scrollen durch einen umfangreichen Katalog. So stammen beispielsweise 80 % dessen, was die Zuschauer auf Netflix sehen, aus Vorschlägen, die auf Empfehlungsalgorithmen basieren. Darüber hinaus führt das Vorschlagen relevanter Inhalte zu personalisierten Erfahrungen.
Laut einer Studie von McKinsey führt eine verbesserte Customer Experience zu einer höheren Kundenzufriedenheit, nämlich um 20 %. Zufriedene Kunden engagieren sich stärker und entwickeln Loyalität gegenüber einer Marke. Unternehmen können dadurch Vertrauen aufbauen und mehr Kunden binden.
Die Bereitstellung personalisierter Empfehlungen ermutigt die Nutzer, mehr Artikel anzusehen und durchzuklicken, was schließlich dazu führen kann, dass die Nutzer zu Käufern werden. McKinsey fand einen Anstieg der Verkaufskonversionsraten um 10–15 % aufgrund positiverer und besser personalisierter Kundenerfahrungen heraus.
Kundenkonversionsraten steigern den Umsatz und der Umsatz steigert den Gewinn. McKinsey gibt an, dass 35 % dessen, was Käufer bei Amazon kaufen, auf Produktempfehlungen zurückzuführen sind. Mittlerweile schätzt Netflix die Einsparungen aufgrund seines Empfehlungssystems auf mehr als 1 Milliarde US-Dollar.
Empfehlungssysteme haben ihre Grenzen und stellen Unternehmen vor Herausforderungen. Hier sind einige der häufigsten:
Empfehlungsengines erfordern die Analyse und Filterung riesiger Datenmengen. Dies erfordert komplexe Architekturen und eine erhebliche Investition in Rechenressourcen.
Empfehlungssysteme müssen schnell genug sein, um die richtigen Empfehlungen in Echtzeit ermitteln und anzeigen zu können. Dies wird noch schwieriger, wenn Echtzeit-Vorschläge gleichzeitig Hunderten oder Tausenden von Nutzern angezeigt werden, geschweige denn Millionen von ihnen.
Die Optimierung von Algorithmen für maschinelles Lernen anhand der falschen Metriken kann zu irrelevanten Empfehlungen führen. Artikel, die oft hoch bewertet werden, werden möglicherweise häufiger vorgeschlagen als neue oder unbekannte Artikel oder solche mit weniger Bewertungen. Die beliebtesten oder am häufigsten gekauften Artikel sind jedoch möglicherweise nicht das, woran die Kunden interessiert sind.
Algorithmen für maschinelles Lernen können gesellschaftliche Vorurteile übernehmen, die in den Daten vorhanden sind – seien es die erfassten Daten, die markierten Daten, die Trainingsdaten oder externe Datenquellen – oder von menschlichen Bewertern, die das Modell einstellen. Dies kann zu ungenauen Empfehlungen führen.
Einige Nutzer lehnen möglicherweise das Datenerfassungsbestreben eines Unternehmens für Empfehlungssysteme aufgrund von Datenschutzbedenken ab. Unternehmen müssen bei der Erfassung und Speicherung von Daten möglicherweise auch regulatorische Anforderungen und Compliance-Standards berücksichtigen.
Hier sind einige Möglichkeiten, wie Unternehmen Empfehlungssysteme nutzen können. Mit der Weiterentwicklung der Empfehlungstechnologie könnten weitere Anwendungsfälle und Applikationen hinzukommen.
Einzelhändler und Online-Shops können Empfehlungsengines nutzen, um die Verkäufe zu steigern. Recommender können Artikel vorschlagen, die auch andere Kunden gekauft haben, oder Produkte, die zu dem passen, was der Kunde bereits bestellt hat.
Empfehlungssysteme können für standortbezogene oder saisonale Empfehlungen und zur Förderung neuer Produkte oder reduzierter Artikel verwendet werden. Diese Systeme können auch verwendet werden, um die Reichweite von selten gekauften Artikeln zu erhöhen, indem sie als Bundle oder als häufig gekaufte Produkte zusammen mit beliebteren Produkten empfohlen werden.
Amazon ist ein Paradebeispiel für ein E-Commerce-Unternehmen, das Empfehlungsengines einsetzt.
Basierend auf historischen Daten und Nutzerpräferenzen können Empfehlungssysteme relevante Inhalte vorschlagen, mit denen sich die Nutzer wahrscheinlich beschäftigen und die sie mögen.
Egal, ob es sich um die nächste TV-Serie zum Anschauen, ein E-Book zum Lesen, einen Künstler zum Hören, ein Spiel zum Spielen oder ein Konzert zum Besuchen handelt, diese Systeme verbessern die Nutzererfahrung, indem sie personalisierte Empfehlungen bieten.
Netflix, Spotify und YouTube sind Unternehmen im Medien- und Unterhaltungsbereich, die mit Empfehlungen arbeiten.
Im Reise- und Gastgewerbe können Empfehlungsengines Hotels und Unterkünfte, Restaurants, Aktivitäten und Erlebnisse entsprechend dem Budget und der bisherigen Reiseerfahrung einer Person vorschlagen.
Diese personalisierten Reiseempfehlungen erhöhen die Kundenzufriedenheit, indem sie auf die Bedürfnisse der Reisenden eingehen.
Unternehmen können Empfehlungsengines nutzen, um ihre qualifizierten Leads auszubauen. Recommender können Inhalte wie Blogbeiträge, Fallstudien, Webinare oder Whitepaper vorschlagen, um neue Dienstleistungen vorzustellen und potenzielle Kunden anzulocken.
Marketingteams können diese Vorschläge dann über Newsletter, Social Media-Anzeigen und gezielte E-Mail-Nachrichten bereitstellen.
AIOps oder künstliche Intelligenz für den IT-Betrieb setzt KI ein, um das IT-Servicemanagement und operative Workflows zu automatisieren und zu optimieren.
In AIOps können Empfehlungsengines verwendet werden, um Lösungen vorzuschlagen, die IT-Betriebsteams helfen, schnell zu handeln und auf technische Probleme angemessen zu reagieren.
IBM web domains
ibm.com, ibm.org, ibm-zcouncil.com, insights-on-business.com, jazz.net, mobilebusinessinsights.com, promontory.com, proveit.com, ptech.org, s81c.com, securityintelligence.com, skillsbuild.org, softlayer.com, storagecommunity.org, think-exchange.com, thoughtsoncloud.com, alphaevents.webcasts.com, ibm-cloud.github.io, ibmbigdatahub.com, bluemix.net, mybluemix.net, ibm.net, ibmcloud.com, galasa.dev, blueworkslive.com, swiss-quantum.ch, blueworkslive.com, cloudant.com, ibm.ie, ibm.fr, ibm.com.br, ibm.co, ibm.ca, community.watsonanalytics.com, datapower.com, skills.yourlearning.ibm.com, bluewolf.com, carbondesignsystem.com, openliberty.io