Si les termes « algorithme » et « modèle » sont souvent utilisés de manière interchangeable, ils représentent des concepts distincts (bien que liés). Algorithme est un terme générique désignant un processus étape par étape, généralement décrit en langage mathématique ou en pseudocode, pour exécuter une fonction ou un objectif donné. Dans le contexte de l’intelligence artificielle, un modèle d’IA est tout programme qui reçoit des données d’entrée et produit une prédiction ou une décision sans intervention humaine supplémentaire.
Un algorithme de machine learning est un ensemble défini d’étapes utilisées pour entraîner un modèle de machine learning afin qu’il puisse formuler des prédictions utiles dans son cas d’utilisation concret. Il comprend non seulement la façon dont le modèle associe un point de données d’entrée à sa sortie correspondante, mais également le processus d’optimisation des prédictions du modèle pour « s’adapter » à un jeu de données d’exemples pertinents. C’est un algorithme qui permet à une machine d’apprendre à partir des données.
En termes simples, le résultat obtenu en appliquant un algorithme de machine learning à un jeu de données est un modèle entraîné. L’« entraînement » peut être décrit comme un processus itératif consistant à mettre à jour les paramètres du modèle (les aspects ajustables de la logique mathématique que le modèle utilise pour faire des prédictions ou prendre des décisions sur les données d’entrée) de manière à obtenir des sorties plus utiles.
Bien qu’il existe des algorithmes de machine learning (ML) spécialement conçus pour entraîner les modèles à effectuer une seule tâche donnée, il s’agit d’une exception, et non d’une règle. D’une manière générale, chaque algorithme ML possède des qualités mathématiques ou pratiques particulières, qui sont utiles pour certains types de tâches (ou certains types ou quantités de données). Dans de nombreux cas, la même technique de machine learning peut être utilisée pour entraîner les modèles à réaliser plusieurs tâches (bien que similaires). Inversement, il existe presque toujours plusieurs algorithmes ML bien adaptés à l’entraînement d’un modèle pour une tâche donnée.
Le principal avantage des algorithmes ML est qu’ils permettent aux modèles d’IA d’apprendre implicitement de l’expérience, contrairement aux techniques d’IA « classiques » ou « basées sur des règles », qui obligent le data scientist, l’expert en la matière ou l’ingénieur en ML de programmer manuellement et explicitement la logique décisionnelle du modèle. Au cours des dernières décennies, les systèmes de machine learning se sont imposés comme le principal mode d’intelligence artificielle et d’analyse de données car, entre autres, le machine learning implicite axé sur les données est intrinsèquement plus flexible, plus évolutif et plus accessible que l’IA basée sur des règles.
Cela dit, il est essentiel de noter que l’ajustement d’un modèle à ses données d’entraînement n’est qu’un moyen, et non une finalité. Le principe fondamental du machine learning est que si vous optimisez la performance d’un modèle sur des tâches qui ressemblent suffisamment aux problèmes qu’il devra résoudre dans le monde réel, le modèle entraîné sera également performant sur de nouvelles données, qu’il n’a pas vues lors de son entraînement. L’objectif ultime du machine learning est la généralisation, c’est-à-dire la transposition de la performance acquise sur les données d’apprentissage vers de nouvelles données. Une focalisation myope sur l'entraînement risque de provoquer un surapprentissage : les connaissances du modèle sont tellement adaptées aux schémas de ses données d’entraînement qu’il ne peut pas se généraliser, ce qui fait qu’il excelle dans l’entraînement mais il échoue dans les scénarios réels.
Pour entraîner un modèle de machine learning utile, il convient donc non seulement de sélectionner et de configurer le type d’algorithme ML approprié, mais aussi d’organiser les données d’entraînement et de vérifier minutieusement la performance post-entraînement.