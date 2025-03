Dans la plupart des contextes, l’entraînement est quasiment synonyme d’apprentissage : un data scientist entraîne, et le modèle apprend. L’apprentissage consiste à ajuster les paramètres d’un algorithme de machine learning jusqu’à ce que les sorties du modèle résultant atteignent un certain indicateur de précision ou d’utilité. Pour faciliter l’apprentissage, l’entraînement implique la collecte de données d’entraînement et l’ajustement des hyperparamètres, par exemple le choix d’une fonction de perte, la définition du taux de mise à jour des paramètres ou la modification de l’architecture d’un réseau de neurones.

Les modèles d’IA relèvent généralement de l’un de ces trois paradigmes de machine learning : apprentissage supervisé, apprentissage non supervisé ou apprentissage par renforcement. À chaque type de machine learning ses propres cas d’utilisation, hyperparamètres, algorithmes et processus d’entraînement.

L’apprentissage supervisé est utilisé lorsqu’un modèle est entraîné pour prédire la sortie « correcte » d’une entrée. Il s’applique aux tâches qui nécessitent un certain degré de précision par rapport à une « vérité terrain » externe, telle que la classification ou la régression.

L’apprentissage non supervisé est utilisé pour entraîner un modèle à discerner des schémas et corrélations intrinsèques dans les données. Contrairement à l’apprentissage supervisé, l’apprentissage non supervisé ne suppose pas l’existence d’une vérité terrain externe avec laquelle ses sorties devraient être comparées.

L’apprentissage par renforcement est utilisé lorsqu’un modèle est entraîné pour évaluer son environnement et entreprendre l’action qui lui fera récolter la meilleure récompense.

Il convient de noter que les définitions et les distinctions entre chaque paradigme de machine learning ne sont pas toujours formelles ou absolues. Par exemple, l’apprentissage auto-supervisé (SSL) peut facilement être classé comme apprentissage supervisé ou non supervisé, en fonction de l’aspect de la définition sur lequel on se focalise. L’apprentissage semi-supervisé combine l’apprentissage non supervisé et l’apprentissage supervisé.

Il convient également de noter que plusieurs types de machine learning peuvent parfois être utilisés pour entraîner un seul système d’IA. Par exemple, les grands modèles de langage (LLM) utilisés dans les applications conversationnelles telles que les chatbots font généralement l’objet d’un préentraînement auto-supervisé, suivi d’un réglage fin supervisé et, par la suite, d’un apprentissage par renforcement basé sur les commentaires humains (RLHF).