Puisque nous pouvons détecter les sous-ajustements à partir du jeu d'entraînement, nous pouvons mieux aider à établir la relation dominante entre les variables d'entrée et de sortie dès le départ. En maintenant une complexité de modèle adéquate, nous pouvons éviter le sous-ajustement et faire des prédictions plus précises. Voici quelques techniques qui peuvent être utilisées pour réduire le sous-ajustement :

Diminuer la régularisation

La régularisation est généralement utilisée pour réduire la variance d'un modèle en appliquant une pénalité aux paramètres d'entrée ayant les plus grands coefficients. Il existe un certain nombre de méthodes différentes, telles que la régularisation L1, la régularisation Lasso, le dropout, etc., qui permettent de réduire le bruit et les valeurs extrêmes dans un modèle. Cependant, si les fonctions de données deviennent trop uniformes, le modèle est incapable d'identifier la tendance dominante, ce qui entraîne un sous-ajustement. En diminuant la quantité de régularisation, une plus grande complexité et une plus grande variation sont introduites dans le modèle, ce qui permet de réussir l'entraînement du modèle.

Augmenter la durée de l'entraînement

Comme nous l'avons mentionné précédemment, arrêter l'entraînement trop tôt peut également produire un modèle sous-ajusté. Cela peut être évité en prolongeant la durée de l'entraînement. Cependant, il est important d'être conscient du surentraînement et, par la suite, du sur-ajustement. Il sera essentiel de trouver un équilibre entre ces deux scénarios.

Sélection de fonctions

Dans tout modèle, des fonctions spécifiques sont utilisées pour déterminer un résultat donné. Si les fonctions prédictives présentes sont insuffisantes, un plus grand nombre de fonctions ou des fonctions plus importantes doivent être introduites. Par exemple, dans un réseau de neurones, vous pouvez ajouter plus de neurones cachés, ou dans une forêt aléatoire, vous pouvez ajouter plus d'arbres. Ce processus injectera plus de complexité dans le modèle, ce qui améiorera les résultats d'entraînement.