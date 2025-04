Sans un accès sécurisé à des connaissances fiables et propres à un domaine, les modèles de fondation seraient bien moins dignes de confiance et bénéfiques pour les applications d’IA d’entreprise. Heureusement, des magasins de données peuvent servir de référentiels sécurisés et permettre aux modèles de fondation d’étendre à la fois leur taille et leurs données d’entraînement.

Les magasins de données adaptés à l’IA générative d’entreprise sont construits sur une architecture de data lakehouse ouverte, alliant les qualités d’un data lake et d’un entrepôt de données. Cette architecture permet de réaliser des économies grâce à un stockage d’objets à faible coût et de partager de grands volumes de données via des formats de table ouverts comme Apache Iceberg, conçus pour des analyses haute performance et un traitement des données à grande échelle.

Les modèles de fondation peuvent interroger de très grands volumes de données propres à un domaine dans un conteneur évolutif et rentable. Et parce combinés au cloud, ces types de magasins de données permettent une évolutivité pratiquement illimitée, les lacunes des modèles de fondation sont réduites, voire éliminées au fil du temps avec l’ajout de données supplémentaires. Plus ce manque de connaissances est comblé, plus le modèle de fondation devient fiable et plus sa portée est grande.

Avec les magasins de données, les data scientists disposent d’un référentiel qu’ils peuvent utiliser pour collecter et nettoyer les données utilisées pour entraîner et affiner les modèles de fondation. Et les magasins de données qui s’appuient sur des infrastructures cloud et des infrastructures de cloud hybride tierces pour le traitement de grands volumes de données sont critiques à la rentabilité de l’IA générative.