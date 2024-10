Les systèmes de filtrage collaboratif filtrent les suggestions selon la similarité des utilisateurs. Les systèmes de recommandation collaboratifs s’appuient sur des données explicites et implicites, et partent du principe que les utilisateurs ayant des préférences comparables seront intéressés par les mêmes éléments et sont susceptibles d’interagir avec ces derniers de la même manière.

Amazon (lien externe à ibm.com), par exemple, utilise le filtrage collaboratif pour ses recommandations de produits, tout comme Spotify (lien externe à ibm.com) le fait pour son contenu audio.



Les systèmes de recommandation collaboratifs proposent des suggestions pertinentes et n’ont généralement pas besoin d’une description détaillée des éléments. Le filtrage collaboratif est toutefois sujet au problème de démarrage à froid, qui se produit lorsque le système dispose de données historiques restreintes, surtout pour les nouveaux utilisateurs.

Il existe 2 principaux types de systèmes de filtrage collaboratif : les systèmes basés sur la mémoire et les systèmes basés sur les modèles.

Systèmes basés sur la mémoire

Les systèmes basés sur la mémoire représentent les utilisateurs et les éléments sous forme de matrice. Ils constituent une extension de l’algorithme des k plus proches voisins (KNN), puisqu’ils visent à trouver leurs « voisins les plus proches », à savoir des utilisateurs ou des éléments similaires. Il existe 2 types de systèmes basés sur la mémoire :

Le filtrage basé sur l’utilisateur détermine les similarités entre un utilisateur donné et les autres utilisateurs de la matrice. Les fonctions de similarité entre utilisateurs sont calculées à partir des lignes de la matrice utilisateur-élément.

Le filtrage basé sur les éléments calcule la similarité des éléments en fonction du comportement des utilisateurs (la manière dont les utilisateurs interagissent avec les éléments, et non les caractéristiques de ces derniers). Les fonctions de similarité entre éléments sont calculées à partir des colonnes de la matrice utilisateur-élément.

Systèmes basés sur les modèles

Les systèmes basés sur les modèles proposent eux aussi un modèle de machine learning prédictif. La matrice utilisateur-élément sert de jeu de données d’entraînement au modèle, qui fournit ensuite des prévisions concernant les valeurs manquantes, c’est-à-dire les éléments que l’utilisateur n’a pas encore trouvés et qui seront donc recommandés.

La factorisation de matrice est l’un des algorithmes de filtrage collaboratif basés sur les modèles les plus courants. Cette méthode de réduction de la dimensionnalité décompose la matrice utilisateur-élément, dont la taille est souvent importante, en deux matrices de dimensions inférieures, l’une pour les utilisateurs et l’autre pour les éléments. Les 2 matrices sont ensuite multipliées entre elles pour prédire les valeurs manquantes (ou les recommandations) dans la matrice de grande taille.

Une version plus complexe de la factorisation de matrice exploite les réseaux neuronaux de l’apprentissage profond. D’autres systèmes basés sur les modèles s’appuient sur des algorithmes de machine learning comme la classification bayésienne, le partitionnement et les arbres de décision.