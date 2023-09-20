Les modèles de fondation (FM) marquent le début d’une nouvelle ère du machine learning (ML) et de l’intelligence artificielle (IA), favorisant un développement plus rapide d’une IA qui peut être adaptée à un large éventail de tâches en aval et optimisée pour un large éventail d’applications.
Face à la nécessité croissante de traiter les données là où le travail est effectué, servir les modèles d’IA en périphérie de l’entreprise permet des prédictions en temps quasi réel, tout en respectant les exigences de souveraineté et de protection des données. En combinant les capacités d’IBM watsonx pour FM à l’edge computing, les entreprises peuvent exécuter des workloads d’IA pour assurer le réglage fin et l’inférence des FM à la périphérie opérationnelle. Cela permet aux entreprises de dimensionner les déploiements d’IA en périphérie, afin de réduire les délais et le coût, et d’améliorer le temps de réponse.
N'hésitez pas à consulter toutes les parties de cette série d'articles de blog sur l'edge computing :
Les modèles de fondation, qui sont entraînés à l’aide d’un large jeu de données non étiquetées à l’échelle, favorisent des applications d’intelligence artificielle (IA) de pointe. Ils peuvent être adaptés à un large éventail de tâches en aval et finement réglés pour toute une série d’applications. Les modèles d’IA modernes, qui exécutent des tâches dans un seul domaine, cèdent leur place aux modèles de fondation car ces derniers apprennent de manière plus générale et s’adaptent à divers domaines et problèmes. Comme son nom l’indique, un modèle de fondation peut servir de base aux diverses applications d’un modèle d’IA.
Les modèles de fondation s’attaquent à deux défis majeurs qui empêchent les entreprises d’adopter l’IA à grande échelle. Tout d’abord, les entreprises produisent une grande quantité de données non étiquetées, dont seule une partie est étiquetée pour l’entraînement des modèles d’IA. Deuxièmement, cette tâche d’étiquetage et d’annotation est extrêmement gourmande en ressources humaines, nécessitant souvent plusieurs centaines d’heures de travail spécialisé. Le coût d’une mise à l’échelle des cas d’utilisation est prohibitif, vu le nombre d’équipes spécialisées et d’experts en données requis. En ingérant de grandes quantités de données non étiquetées et en utilisant des techniques d’apprentissage auto-supervisé, les modèles de fondation éliminent ces goulets d’étranglement et favorisent l’adoption de l’IA à l’échelle de l’entreprise. Ces quantités massives de données qui existent au sein de chaque entreprise attendent d’être exploitées pour générer des informations.
Les grands modèles de langage (LLM) sont une classe de modèles de fondation (FM) constitués de couches de réseaux de neurones qui ont été entraînés sur ces quantités massives de données non étiquetées. Ils utilisent des algorithmes d’apprentissage auto-supervisé pour effectuer diverses tâches de traitement automatique du langage naturel (TAL) d’une manière similaire à celle dont les humains utilisent le langage (voir Figure 1).
La création et le déploiement des modèles de fondation (FM) se font en plusieurs étapes. Ces opérations comprennent l’ingestion, la sélection et le prétraitement des données, le pré-entraînement, l’ajustement du modèle à une ou plusieurs tâches en aval, la fourniture d’inférences et la gouvernance et la gestion du cycle de vie des données et des modèles d’IA - autrement dit, le FMOps.
Pour aider les entreprises dans cette démarche, IBM leur propose les outils et les capacités nécessaires pour exploiter le potentiel de ces modèles de fondation via la gamme de produits d’IA IBM watsonx, conçue pour multiplier l’impact de l’IA dans l’ensemble de l’organisation. IBM watsonx comprend les éléments suivants :
Un autre vecteur clé est l’importance croissante de l’informatique à la périphérie de l’entreprise, comme les sites industriels, les ateliers de fabrication, les magasins de vente au détail, les sites périphériques des opérateurs télécoms, etc. Plus précisément, l’IA à la périphérie de l’entreprise permet le traitement des données là où le travail est effectué pour une analyse en temps quasi réel. La périphérie de l’entreprise est l’endroit où de vastes volumes de données d’entreprise sont générés et où l’IA peut fournir des informations commerciales précieuses, opportunes et exploitables.
Les modèles d’IA en périphérie permettent des prévisions en temps quasi réel, tout en respectant les exigences en matière de souveraineté et de protection des données. Cela réduit considérablement la latence souvent associée à l’acquisition, à la transmission, à la transformation et au traitement des données d’inspection. Travailler en périphérie nous permet de protéger les données sensibles de l’entreprise et de réduire les coûts de transfert de données avec des temps de réponse plus rapides.
La mise à l’échelle des déploiements d’IA en périphérie n’est toutefois pas une tâche facile, compte tenu des défis liés aux données (hétérogénéité, volume et réglementation) et aux ressources limitées (calcul, connectivité réseau, stockage et même compétences informatiques). Ils peuvent être classés en deux principales catégories :
IBM a développé une architecture edge qui répond à ces défis en proposant un modèle d’appliance matériel/logiciel intégré aux déploiements d’IA en périphérie. Il s’agit de plusieurs paradigmes clés qui favorisent l’évolutivité des déploiements d’IA :
Une architecture distribuée en étoile peut être employée pour faire évoluer les déploiements d’IA d’entreprise à la périphérie, dans laquelle un cloud central ou un centre de données d’entreprise sert de hub et l’appliance edge clé en main sert de lien avec un emplacement périphérique. Ce modèle en étoile, qui s’étend aux environnements hybrides cloud et périphériques, illustre parfaitement l’équilibre nécessaire pour utiliser de manière optimale les ressources requises pour les opérations de MF (voir figure 2).
La pré-entraînement de ces grands modèles de langage de base (LLM) et d’autres types de modèles de fondation utilisant des techniques auto-supervisées sur de vastes jeux de données non étiquetés nécessite souvent des ressources de calcul (GPU) importantes et s’avère plus efficace si réalisé dans un hub. Les ressources de calcul pratiquement illimitées et les grandes piles de données souvent stockées dans le cloud permettent de pré-entraîner les modèles dotés d’un grand nombre de paramètres et d’améliorer en permanence la précision de ces modèles de fondation.
D’autre part, le réglage de ces modèles de fondation pour les tâches en aval, qui ne nécessitent que quelques dizaines ou centaines d’échantillons de données étiquetées et un service d’inférence, peut être réalisé avec seulement quelques GPU en périphérie de l’entreprise. Cela permet de conserver en toute sécurité les données étiquetées sensibles (ou critiques) dans l’environnement opérationnel de l’entreprise, tout en réduisant les coûts de transfert.
En utilisant une approche pile complète pour déployer les application en périphérie, les data scientists peuvent affiner, tester et déployer les modèles. Cela peut être réalisé dans un environnement unique, tout en réduisant le cycle de développement pour servir de nouveaux modèles d’IA aux utilisateurs finaux. Des plateformes comme le Red Hat OpenShift Data Science (RHODS) et Red Hat OpenShift AI, récemment annoncée, fournissent des outils pour développer et déployer rapidement des modèles d’IA prêts à la production dans des environnements de cloud distribué et en périphérie.
Enfin, servir le modèle d’IA affiné en périphérie réduit considérablement la latence souvent associée à l’acquisition, à la transmission, à la transformation et au traitement des données. Dissocier la pré-entraînement dans le cloud du réglage fin et de l’inférence en périphérie réduit le coût opérationnel global en diminuant le temps requis et les coûts de déplacement des données associés aux tâches d’inférence (voir Figure 3).
Afin de démontrer cette proposition de valeur de bout en bout, un modèle de fondation exemplaire basé sur un transformateur de vision pour les infrastructures civiles (pré-entraîné à l’aide de jeux de données publics et personnalisés spécifiques au secteur) a été affiné et déployé pour l’inférence sur un cluster périphérique (en étoile) à trois nœuds. La pile logicielle comprenait Red Hat OpenShift Container Platform et Red Hat OpenShift Data Science. Ce cluster périphérique était également connecté à une instance du hub Red Hat Advanced Cluster Management for Kubernetes (RHACM) fonctionnant dans le cloud.
Le provisionnement totalement automatisé et basé sur des politiques a été effectué avec Red Hat Advanced Cluster Management for Kubernetes (RHACM) via des politiques et des balises de placement, qui lient des clusters périphériques spécifiques à un ensemble de composants logiciels et de configurations. Ces composants logiciels, qui s’étendent sur l’ensemble de la pile et couvrent le calcul, le stockage, le réseau et la workload de l’IA, ont été installés à l’aide de divers opérateurs OpenShift, du provisionnement des services d’application requis et du compartiment S3 (stockage).
Le modèle de fondation pré-entraîné (MF) pour les infrastructures civiles a été affiné via un Jupyter Notebook dans Red Hat OpenShift Data Science (RHODS) à l’aide de données étiquetées pour classer six types de défauts trouvés sur les ponts en béton. Le service d’inférence de ce MF affiné a également été démontré à l’aide d’un serveur Triton. De plus, la surveillance de la santé de ce système périphérique a été rendue possible en agrégeant les indicateurs d’observabilité des composants matériels et logiciels via Prometheus vers le tableau de bord central RHACM dans le cloud. Les entreprises d’infrastructures civiles peuvent déployer ces MF à leurs emplacements périphériques et employer des images de drones pour détecter les défauts en temps quasi réel. Cela accélère le temps d’analyse et réduit le coût du transfert de grands volumes de données haute définition vers et depuis le cloud.
La combinaison des capacités d’IBM watsonx pour les modèles de fondation (MF) avec une appliance edge clé en main permet aux entreprises d’exécuter des workloads d’IA pour le réglage fin et l’inférence des MF à la périphérie opérationnelle. Cette appliance peut gérer des cas d’utilisation complexes dès son déploiement et construit le cadre en étoile pour la gestion centralisée, l’automatisation et le libre-service. Les déploiements MF en périphérie peuvent être réduits de plusieurs semaines à quelques heures, avec un succès reproductible, une résilience et une sécurité accrues.
