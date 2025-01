La préparation des données consiste à collecter des données brutes et à les intégrer à un jeu de données d’entraînement. Cette étape permet de s’assurer que les données d’apprentissage ne sont pas biaisées, et c’est sur elle que se base la réussite du modèle : des données précises permettent d’obtenir des prévisions et des informations précises. Alors que les entreprises relient leurs systèmes d’IA à des magasins de données propriétaires, par le biais de la génération augmentée de récupération (RAG) , la préparation des données est une étape critique pour une mise en œuvre fiable de l’IA.

Les utilisateurs connectent la plateforme d’AutoML à la source des données d’apprentissage, idéalement un grand jeu de données prêtes à être utilisées pour l’entraînement. La phase de préparation des données intervient avant le déploiement de la solution d’AutoML.

La solution d’AutoML permet d’aller plus loin dans le prétraitement et le nettoyage des données. Un prétraitement plus minutieux des données permet d’améliorer les performances des modèles d’IA.

Lors de la création manuelle de modèles pour les tâches d’apprentissage supervisé et semi-supervisé, les données d’apprentissage doivent être étiquetées manuellement. Les caractéristiques et les résultats doivent être sélectionnés en fonction du cas d’utilisation prévu pour le modèle. Les solutions d’AutoML peuvent gérer l’ingénierie des caractéristiques pour le compte des utilisateurs afin de sélectionner les caractéristiques des données les plus susceptibles d’améliorer les performances du modèle.