Un moteur de recommandation, également appelé système de recommandation, est un système d’intelligence artificielle (IA) qui fait des suggestions à l’utilisateur. Les systèmes de recommandation s’appuient sur l’analytique big data et les algorithmes de machine learning (ML) pour trouver des modèles dans les données de comportement utilisateur et faire des suggestions pertinentes en fonction de ces modèles.
Les moteurs de recommandation permettent aux utilisateurs de découvrir des contenus, des produits ou des services qu’ils n’auraient pas nécessairement trouvés par eux-mêmes. Ces systèmes sont utilisés par bon nombre d’entreprises en ligne pour générer des ventes et susciter l’engagement : sites Web d’e-commerce, plateformes de diffusion multimédia, moteurs de recherche et réseaux sociaux.
Les systèmes de recommandation suggèrent le prochain film ou la prochaine vidéo à regarder, une musique similaire à écouter, des résultats de recherche pertinents ou un produit qui complète la commande passée.
Les suggestions générées par les systèmes de recommandation jouent également un rôle essentiel dans la personnalisation de l’expérience utilisateur. Selon une étude menée par le cabinet de conseil en gestion McKinsey, la personnalisation permet une hausse des recettes de 5 à 15 %. Par ailleurs, 76 % des clients se disent frustrés par l’absence d’une interaction personnalisée.
Le marché des systèmes de recommandation est en pleine croissance. Le marché des moteurs de recommandation est estimé à 6,88 milliards de dollars en 2024, et devrait tripler au cours des 5 prochaines années.
Pour cibler les utilisateurs avec des suggestions adaptées, les moteurs de recommandation allient science des données et machine learning.
Les systèmes de recommandation les plus efficaces opèrent généralement en 5 phases :
Les systèmes de recommandation s’appuient sur les données, c’est pourquoi la collecte de ces dernières constitue une première étape incontournable. Les deux principaux types de données à collecter sont les données explicites et les données implicites.
Les données explicites englobent les actions et les activités des utilisateurs telles que les commentaires, les likes, les évaluations et les avis. Les données implicites comprennent le comportement des utilisateurs : historique de navigation, événements liés au panier, clics, achats antérieurs et historique des recherches.
Les systèmes de recommandation utilisent également d’autres données sur les clients, comme les données démographiques (âge ou sexe) et psychographiques (centres d’intérêt ou style de vie), pour trouver des utilisateurs similaires, ainsi que des données sur les caractéristiques (par exemple, la fourchette de prix ou le type d’article), et identifier les produits ou services associés.
Une fois les données collectées, l’étape suivante consiste à les stocker. Le type de système de stockage utilisé dépendra du type de données collectées.
Les entrepôts de données permettent d’agréger les données provenant de différentes sources pour faciliter leur analyse et le machine learning, tandis que les data lakes permettent de stocker des données structurées et non structurées.
Le data lakehouse regroupe les meilleurs aspects des entrepôts de données et des data lakes au sein d’une seule et même solution de gestion des données.
La phase d’analyse s’appuie sur des algorithmes de machine learning pour traiter et examiner les jeux de données. Ces algorithmes détectent les schémas, identifient les corrélations et évaluent la force de ces schémas et corrélations. Les modèles de machine learning peuvent être entraînés sur de grands jeux de données pour formuler des recommandations adaptées.
La dernière étape consiste à filtrer les données pour afficher les éléments les plus pertinents de l’étape d’analyse précédente. Le filtrage des données consiste à appliquer certaines règles et formules mathématiques aux données en fonction du type de moteur de recommandation utilisé.
Facultative, l’étape d’affinage permet d’évaluer régulièrement les sorties du système de recommandation et d’optimiser davantage le modèle pour améliorer en permanence sa précision et sa qualité.
Les moteurs de recommandation diffèrent selon la méthode de filtrage qu’ils utilisent. Il existe 3 grands types de moteurs de recommandation :
Les systèmes de filtrage collaboratif filtrent les suggestions selon la similarité des utilisateurs. Les systèmes de recommandation collaboratifs s’appuient sur des données explicites et implicites, et partent du principe que les utilisateurs ayant des préférences comparables seront intéressés par les mêmes éléments et sont susceptibles d’interagir avec ces derniers de la même manière.
Amazon, par exemple, utilise le filtrage collaboratif pour ses recommandations de produits, tout comme Spotify le fait pour son contenu audio.
Les systèmes de recommandation collaboratifs proposent des suggestions pertinentes et n’ont généralement pas besoin d’une description détaillée des éléments. Le filtrage collaboratif est toutefois sujet au problème de démarrage à froid, qui se produit lorsque le système dispose de données historiques restreintes, surtout pour les nouveaux utilisateurs.
Il existe 2 principaux types de systèmes de filtrage collaboratif : les systèmes basés sur la mémoire et les systèmes basés sur les modèles.
Les systèmes basés sur la mémoire représentent les utilisateurs et les éléments sous forme de matrice. Ils constituent une extension de l’algorithme des k plus proches voisins (KNN), puisqu’ils visent à trouver leurs « voisins les plus proches », à savoir des utilisateurs ou des éléments similaires. Il existe 2 types de systèmes basés sur la mémoire :
Les systèmes basés sur les modèles proposent eux aussi un modèle de machine learning prédictif. La matrice utilisateur-élément sert de jeu de données d’entraînement au modèle, qui fournit ensuite des prévisions concernant les valeurs manquantes, c’est-à-dire les éléments que l’utilisateur n’a pas encore trouvés et qui seront donc recommandés.
La factorisation de matrice est l’un des algorithmes de filtrage collaboratif basés sur les modèles les plus courants. Cette méthode de réduction de la dimensionnalité décompose la matrice utilisateur-élément, dont la taille est souvent importante, en deux matrices de dimensions inférieures, l’une pour les utilisateurs et l’autre pour les éléments. Les 2 matrices sont ensuite multipliées entre elles pour prédire les valeurs manquantes (ou les recommandations) dans la matrice de grande taille.
Une version plus complexe de la factorisation de matrice exploite les réseaux neuronaux de l’apprentissage profond. D’autres systèmes basés sur les modèles s’appuient sur des algorithmes de machine learning, par exemple la classification bayésienne, le partitionnement et les arbres de décision.
Les systèmes de filtrage basé sur le contenu filtrent les recommandations selon les caractéristiques de l’élément. Les systèmes de recommandation basés sur le contenu partent du principe que si un utilisateur aime un élément particulier, il aimera également les éléments similaires. Le filtrage basé sur le contenu prend en compte la description des éléments (la couleur, la catégorie, le prix et autres métadonnées attribuées par mots-clés et tags), ainsi que les données explicites et implicites.
Les systèmes de filtrage basé sur le contenu représentent les éléments et les utilisateurs sous forme de vecteurs dans un espace vectoriel. La similitude entre les éléments est déterminée en fonction de leur proximité. Plus deux vecteurs sont proches dans l’espace, plus ils sont considérés comme similaires. Les vecteurs identifiés comme étant similaires aux éléments précédents en fonction des caractéristiques fournies seront recommandés à l’utilisateur.
Les systèmes de recommandation basés sur le contenu s’appuient sur un modèle de classification ou de régression. La description et les caractéristiques des éléments qui intéressent l’utilisateur servent de jeu de données d’entraînement au modèle, qui prédit ensuite les éléments à recommander.
Les systèmes de recommandation basés sur le contenu peuvent être améliorés davantage grâce aux étiquettes de traitement automatique du langage naturel. Ce processus d’étiquetage peut toutefois s’avérer fastidieux si les volumes de données sont très importants.
Le problème de démarrage à froid est moins important que dans le cas du filtrage collaboratif, puisque le filtrage basé sur le contenu prend en compte les caractéristiques des métadonnées, et non l’interaction utilisateur antérieure. Le filtrage basé sur le contenu peut toutefois limiter l’exploration des nouveaux éléments, car il suggère souvent des éléments similaires à ce que les utilisateurs ont apprécié précédemment.
Comme son nom l’indique, le système de recommandation hybride associe filtrage collaboratif et filtrage basé sur le contenu.
Si l’approche hybride permet d’améliorer considérablement la performance des moteurs de recommandation, elle requiert une architecture avancée et une puissance de calcul intensive.
Netflix, par exemple, utilise un système de recommandation hybride pour recommander des films et des émissions télévisées.
Les moteurs de recommandation s’avèrent intéressants tant pour les entreprises que pour les utilisateurs. Voici quelques avantages qu’apporte l’adoption des systèmes de recommandation aux entreprises :
Les utilisateurs qui se voient recommander le bon produit ou service gagnent du temps puisqu’ils n’ont plus à parcourir les catalogues dans leur intégralité. Par exemple, 80 % du contenu que les téléspectateurs visionnent sur Netflix correspond aux suggestions optimisées par les algorithmes de recommandation. Qui plus est, recommander des contenus pertinents permet de personnaliser l’expérience.
Selon une étude menée par McKinsey, optimiser l’expérience client permet d’améliorer la satisfaction client de 20 %. La satisfaction client est synonyme d’engagement et de fidélisation, puisqu’elle permet aux entreprises de gagner la confiance du consommateur et d’améliorer sont taux de rétention.
Les recommandations personnalisées stimulent les vues et les clics, ce qui permet de convertir les utilisateurs en acheteurs. Selon McKinsey, une expérience client plus positive et personnalisée entraîne une hausse des ventes et du taux de conversion de 10 à 15 %.
La conversion client stimule les ventes, et les ventes génèrent des recettes. McKinsey relève que 35 % des achats effectués sur Amazon correspondent à des produits recommandés. De son côté, Netflix estime à plus d’un milliard de dollars les économies réalisées grâce à son système de recommandation.
Les systèmes de recommandation ont leurs limites et posent des défis aux entreprises. En voici quelques exemples :
Les moteurs de recommandation impliquent l’analyse et le filtrage d’immenses quantités de données, qui requièrent une architecture complexe et un investissement informatique important.
Les systèmes de recommandation doivent être suffisamment rapides pour déterminer et afficher des suggestions pertinentes en temps réel. Cela devient encore plus difficile lorsque ces suggestions en temps réel sont proposées simultanément à des centaines, des milliers, voire des millions d’utilisateurs.
Optimiser les algorithmes de machine learning à l’aide d’indicateurs erronés peut entraîner des recommandations non pertinentes. Les éléments les mieux notés sont susceptibles d’être recommandés plus souvent que ceux qui sont nouveaux, peu connus ou peu évalués. Pourtant, les éléments les plus populaires ou les plus achetés n’intéressent pas forcément le consommateur.
Les algorithmes de machine learning peuvent acquérir les biais sociétaux présents dans les données (qu’il s’agisse de données collectées ou étiquetées, de données d’entraînement ou de sources de données externes) ou chez les personnes chargées de régler le modèle. Cela peut affecter la pertinence des recommandations.
Certains utilisateurs s’opposent à la collecte de leurs données à des fins de recommandation pour des raisons de confidentialité. Les entreprises doivent également se conformer aux normes et aux réglementations relatives à la collecte et au stockage des données.
Voici quelques exemples d’utilisation des systèmes de recommandation par les entreprises. D’autres cas d’utilisation et applications peuvent voir le jour au fur et à mesure que la technologie de recommandation évolue.
Les détaillants et les commerçants en ligne s’appuient sur les moteurs de recommandation pour améliorer leurs ventes. Les moteurs recommandent des articles achetés par d’autres consommateurs, ou qui complètent ce que l’acheteur a déjà commandé.
Les systèmes de recommandation peuvent s’appuyer sur des critères comme la localisation ou la saison pour générer des suggestions, promouvoir de nouveaux produits ou les articles à prix réduit. Ces systèmes permettent également d’augmenter la portée des articles rarement achetés, en les recommandant sous forme de lots ou comme produits fréquemment achetés pour compléter les articles favoris.
Amazon est un excellent exemple d’entreprise d’e-commerce qui s’appuie sur les moteurs de recommandation.
S’appuyant sur des données historiques et les préférences des utilisateurs, les systèmes de recommandation suggèrent des contenus pertinents, susceptibles de susciter l’engagement et la satisfaction utilisateur.
Qu’il s’agisse de la prochaine série télévisée à regarder, d’un eBook à lire, d’un artiste à écouter, d’un jeu ou d’un concert, ces systèmes améliorent l’expérience utilisateur en proposant des recommandations personnalisées.
Netflix, Spotify et YouTube sont des entreprises du secteur des médias et du divertissement qui font appel aux systèmes de recommandation.
Dans le secteur du tourisme et de l’hôtellerie, les moteurs de recommandation suggèrent des options d’hébergement, des restaurants, des activités et des expériences en fonction du budget et de l’historique de voyage du consommateur.
Ces suggestions de voyage personnalisées permettent de répondre aux besoins des voyageurs et d’améliorer la satisfaction client.
Les entreprises peuvent utiliser les moteurs de recommandation pour générer des prospects qualifiés. Les systèmes de recommandation suggèrent des contenus comme les articles de blog, les études de cas, les webinaires ou encore les livres blancs, pour promouvoir de nouveaux services et attirer de nouveaux clients.
Les équipes marketing peuvent ensuite inclure ces recommandations dans leur newsletter, leurs publicités sur les réseaux sociaux ou leurs campagnes d’e-mail marketing ciblé.
L’AIOps (intelligence artificielle pour les opérations informatiques) exploite l’IA pour automatiser et rationaliser la gestion des services informatiques et les workflows opérationnels.
Les moteurs de recommandation peuvent être intégrés à l’approche AIOps pour suggérer des solutions permettant aux équipes d’exploitation informatique d’agir rapidement et de résoudre efficacement les problèmes techniques.