Publication : 3 juin 2024
Contributeurs : Mesh Flinders, Ian Smalley
L'infrastructure d'intelligence artificielle (IA), souvent appelée pile IA, se réfère aux équipements matériels et logiciels indispensables à la création et au déploiement d'applications et de solutions alimentées par l’IA.
Une infrastructure puissante d'IA permet aux développeurs de créer et de déployer efficacement des applications d'IA et de machine learning (ML) comme des chatbots du type Chat GPT d'OpenAI, la reconnaissance faciale et vocale, ainsi que la vision par ordinateur. Les entreprises de toutes tailles et de divers secteurs s'appuient sur l'infrastructure d'IA pour atteindre leurs objectifs en matière d'IA. Avant d'aborder l'importance et le fonctionnement de l'infrastructure d'IA , examinons certains termes clés.
L'IA est une technologie qui autorise les ordinateurs à reproduire le mode de pensée et de résolution de problèmes des humains. Combinée à d'autres technologies—comme l'Internet, les capteurs, la robotique et plus encore—la technologie de l'IA est capable d'exécuter des tâches qui nécessitent généralement une intervention humaine, comme piloter un véhicule, répondre à des questions ou fournir des analyses à partir de grandes quantités de données. Plusieurs des applications les plus répandues de l'IA dépendent de modèles de machine learning, un secteur de l'IA qui se focalise particulièrement sur les données et les algorithmes.
La ML est un domaine de l'IA qui se sert de données et d' algorithmes pour imiter la façon dont les humains apprennent, ce qui permet d'améliorer la précision de ses réponses au fil du temps. Le ML utilise un processus décisionnel pour effectuer une prédiction ou classifier des informations, une fonction d'erreur qui évalue la justesse de son travail, et un grand modèle de langage (LLM) ainsi qu'un processus d'optimisation du modèle qui réduit les écarts entre les exemples connus et les estimations du modèle. Un algorithme de ML réitère ce processus d'« évaluation et optimisation » jusqu'à ce qu'un seuil de précision spécifié pour le modèle soit atteint.
Pour en savoir plus sur les différences subtiles entre l'IA et le ML, consultez notre blog, « IA, machine learning, apprentissage profond et réseaux neuronaux : quelle est la différence ? »
Découvrez comment les serveurs IBM Power réduisent le coût total de possession (TCO) de l'infrastructure informatique en consolidant les empreintes physiques des centres de données et bien plus encore.
Abonnez-vous à la newsletter IBM
Au fur et à mesure que les entreprises identifient de nouvelles manières d'utiliser l'IA, la création de l'infrastructure requise pour soutenir son développement est devenue cruciale. Que l'on déploie le ML pour encourager l'innovation dans la chaîne d'approvisionnement ou que l'on se prépare à lancer un chatbot d' IA générative , il est crucial de disposer de l'infrastructure adéquate.
La raison principale pour laquelle les projets d'IA ont besoin d'une infrastructure spécifique est la grande quantité de puissance requise pour traiter les workloads d'IA. Pour obtenir ce type de puissance, l'infrastructure d'IA s'appuie sur la faible latence des environnements cloud et sur la puissance de traitement des unités de traitement graphique (GPU) , plutôt que sur les unités centrales de traitement (CPU) plus traditionnelles des environnements d'infrastructure informatique traditionnels.
Par ailleurs, l'infrastructure d'IA se focalise sur le matériel et les logiciels spécialement développés pour le cloud et les tâches d'IA et de ML, au lieu des PC, des logiciels et des centres de données sur site que privilégie l'infrastructure informatique. Au sein d'un écosystème d'IA, les piles logicielles incluent souvent des bibliothèques et des frameworks de ML comme TensorFlow et PyTorch, des langages de programmation tels que Python et Java, ainsi que des plateformes de calcul distribué telles que Apache Spark ou Hadoop.
En plus de favoriser le développement d'applications avancées pour les clients, les entreprises qui investissent dans l'infrastructure d'IA observent généralement des améliorations importantes de leurs processus et de leur workflow. Voici six des avantages les plus fréquents que peuvent anticiper les entreprises qui mettent en place une infrastructure d'IA performante :
L'infrastructure d'IA étant généralement basée sur le cloud, elle est bien plus évolutive et flexible que ses prédécesseurs informatiques sur site. Face à la croissance et à la complexité des jeux de données nécessaires aux applications d'IA, cette infrastructure est conçue pour s'adapter, permettant aux organisations d'augmenter les ressources à la demande. L'infrastructure cloud, flexible par nature, s'ajuste facilement à la hausse ou à la baisse en fonction des besoins changeants de l'entreprise.
L'infrastructure d'IA s'appuie sur les technologies de calcul haute performance (HPC) les plus avancées, comme les GPU et les unités de traitement tensoriel (TPU), pour propulser les algorithmes de ML qui forment la base des capacités de l'IA. Les écosystèmes d'IA offrent des capacités de traitement parallèle, réduisant de manière significative le temps nécessaire à l'entraînement des modèles de ML. La vitesse étant cruciale dans de nombreuses applications d'IA, telles que les applications de trading à haute fréquence et les voitures autonomes, les améliorations en termes de rapidité et de performance sont une caractéristique clé de l'infrastructure d'IA.
Une infrastructure IA solide facilite non seulement la création d'applications d'IA grâce au matériel et aux logiciels, mais elle permet aussi aux développeurs et aux ingénieurs de collaborer plus efficacement. En adoptant les pratiques MLOps, un cycle de vie de développement d'IA pensé pour fluidifier et automatiser la création de modèles de ML, les systèmes d'IA permettent aux ingénieurs de gagner en efficacité dans la construction, le partage et la gestion de leurs projets d'IA.
Avec l'augmentation des préoccupations liées à la confidentialité des données et à l'IA, le cadre réglementaire s'est complexifié. Ainsi, une infrastructure d'IA robuste doit s'assurer que les lois sur la confidentialité sont scrupuleusement respectées lors de la gestion et du traitement des données dans le cadre du développement de nouvelles applications d'IA. Les solutions d'infrastructure d'IA s'assurent que toutes les lois et normes applicables sont scrupuleusement respectées et que la conformité de l'IA est appliquée, protégeant ainsi les données des utilisateurs et préservant les entreprises des risques juridiques et de réputation.
Bien que l'investissement dans une infrastructure d'IA puisse représenter une dépense significative, les coûts associés au développement d'applications et de capacités d'IA sur une infrastructure informatique traditionnelle peuvent s'avérer encore plus élevés. L'infrastructure d'IA veille à l'optimisation des ressources et à l'utilisation des technologies les plus performantes disponibles dans le cadre du développement et du déploiement des projets d'IA. En investissant dans une infrastructure d'IA performante, on obtient un meilleur retour sur investissement (ROI) pour les initiatives d'IA que si l'on essaie de les réaliser sur une infrastructure informatique vieillissante et inefficace.
L’IA générative est une IA capable de créer son propre contenu, notamment du texte, des images, des vidéos et du code informatique, à partir de simples invites des utilisateurs. Depuis le lancement de ChatGPT, une application d’IA générative, il y a deux ans, les entreprises du monde entier testent avec enthousiasme de nouvelles façons d’exploiter cette nouvelle technologie. L’IA générative peut augmenter la productivité des entreprises et des particuliers de manière exponentielle. Cependant, cela s'accompagne de risques réels. Une infrastructure d’IA dotée d’ un cadre d’exigences solide en matière d’IA générative peut aider les entreprises à développer leurs capacités de manière sûre et responsable.
Pour offrir aux ingénieurs et développeurs les ressources nécessaires à la construction d'applications avancées d'IA et de ML, l'infrastructure d'IA utilise un mélange de matériel et de logiciel modernes. En règle générale, l'infrastructure d'IA se décompose en quatre éléments : le stockage et le traitement des données, les ressources de calcul, les cadres de ML et les plateformes MLOps. Voici un aperçu plus détaillé de leur fonctionnement.
Les applications d’IA doivent s’entraîner sur de grands jeux de données pour être efficaces. Les entreprises qui souhaitent mettre en place des produits et services d'IA puissants doivent investir dans des solutions de stockage et de gestion des données évolutives, comme des bases de données sur site ou dans le cloud, des entrepôts de données et des systèmes de fichiers distribués. Par ailleurs, des frameworks de traitement de données et des bibliothèques comme Pandas, SciPy et NumPy sont souvent indispensables pour traiter et nettoyer les données avant qu'elles ne soient utilisées pour l'entraînement d'un modèle d'IA.
Les tâches de ML et d'IA nécessitent de grandes quantités de puissance de calcul et de ressources pour fonctionner. Une infrastructure d'IA bien pensée intègre souvent du matériel spécialisé, comme une unité de traitement graphique (GPU) et une unité de traitement tensoriel (TPU), pour offrir des capacités de traitement parallèle et accélérer les tâches de ML.
Unités de traitement graphique (GPU) : les GPU, généralement fabriqués par Nvidia ou Intel, sont des circuits électroniques utilisés pour entraîner et exécuter des modèles d'IA en raison de leur capacité unique à effectuer de nombreuses opérations à la fois. En général, l'infrastructure d'IA comprend des serveurs GPU pour accélérer les calculs de matrices et de vecteurs, fréquents dans les tâches d'IA.
Unités de traitement des tenseurs (TPU) : les GPU sont des accélérateurs conçus sur mesure pour accélérer les calculs des tenseurs dans les workloads d'IA. Leur débit élevé et leur faible latence en font la solution idéale pour de nombreuses applications d’IA et d' apprentissage profond .
Les frameworks de ML fournissent les ressources spécifiques dont l'IA a besoin pour concevoir, entraîner et déployer des modèles de ML. Les frameworks de ML comme TensorFlow et PyTorch prennent en charge une variété de capacités requises par les applications d'IA, y compris l'accélération des tâches GPU et les fonctionnalités essentielles aux trois types d'entraînement ML : supervisé, non supervisé et par renforcement. Des frameworks de ML robustes accélèrent le processus de machine learning et fournissent aux développeurs les outils nécessaires pour développer et déployer des applications d'IA.
Le MLOps est un processus qui implique un ensemble de pratiques spécifiques pour aider à automatiser et à accélérer le machine learning. Les plateformes MLOps assistent les développeurs et les ingénieurs dans la collecte de données et l' entraînement des modèles, ainsi que dans la validation, le dépannage et le suivi d'une application après son lancement. Les plateformes MLOps renforcent la fonctionnalité de l' infrastructure d'IA , aidant les data scientists, ingénieurs et autres à réussir le lancement de nouveaux outils, produits et services dotés de capacités d'IA.
Voici six étapes que les entreprises de toutes tailles et de tous secteurs peuvent suivre pour construire l'infrastructure d'IA dont elles ont besoin :
Avant de vous pencher sur les nombreuses options offertes aux entreprises désireuses de créer et de maintenir une infrastructure d'IA efficace, il est crucial de bien définir vos besoins. Quels problèmes souhaitez-vous résoudre ? Combien êtes-vous prêt à investir ? Disposer de réponses précises à ces questions constitue un bon point de départ et facilitera votre processus de décision en matière de choix d'outils et de ressources.
Opter pour les outils et solutions qui conviennent à vos besoins est une étape essentielle pour établir une infrastructure d'IA sur laquelle vous pouvez vous appuyer. Des GPU et TPU pour optimiser le machine learning, aux bibliothèques de données et frameworks de ML qui constituent votre stack logiciel, vous aurez de nombreuses décisions importantes à prendre lors de la sélection des ressources. Ayez toujours en tête vos objectifs et le niveau d'investissement que vous êtes prêt à réaliser, et examinez vos options en conséquence.
Un flux de données rapide et fiable est essentiel à la fonctionnalité de l’infrastructure de l’IA. Les réseaux à haut débit et à faible latence, comme la 5G, permettent le transfert rapide et sécurisé de grandes quantités de données entre le stockage et le traitement. En outre, les réseaux 5G offrent à la fois des instances de réseau public et privé pour des couches supplémentaires de confidentialité, de sécurité et de personnalisation. Les meilleurs outils d’infrastructure d’IA au monde ne servent à rien sans le bon réseau pour leur permettre de fonctionner comme ils ont été conçus.
Tous les composants de l'infrastructure d'IA sont disponibles à la fois dans le cloud et sur site, il est donc important de considérer les avantages de chaque option avant de décider laquelle vous convient le mieux. Alors que les fournisseurs de cloud comme AWS, Oracle, IBM et Microsoft Azure proposent davantage de flexibilité et d'évolutivité, permettant aux entreprises de bénéficier de modèles économiques à la demande pour certaines fonctionnalités, l'infrastructure d'IA sur site présente également des avantages, notamment un meilleur contrôle et une performance accrue pour certaines charges de travail spécifiques.
L'IA et le ML sont des domaines d'innovation très réglementés et, à mesure que de plus en plus d'entreprises y lancent des applications, la surveillance s'intensifie. La plupart des réglementations actuelles qui régissent le secteur portent sur la protection et la sécurité des données, et leur violation peut entraîner des amendes importantes et nuire à la réputation des entreprises.
La dernière étape de la création de votre infrastructure d'IA est de la déployer et de l'entretenir. En collaboration avec votre équipe de développeurs et d'ingénieurs qui l'utiliseront, vous aurez besoin de moyens pour garantir que le matériel et les logiciels sont maintenus à jour et que les processus que vous avez mis en place sont suivis. Cela comprend généralement la mise à jour régulière des logiciels et l’exécution de diagnostics sur les systèmes, ainsi que l’examen et l’audit des processus et des workflows.
IBM Storage pour les données de fichiers et d'objets est un ensemble intégré de produits et de services de données qui, ensemble, fournissent une plateforme de données mondiale pour répondre à vos besoins actuels en matière de données de fichiers et d'objets et aux workloads d'IA et à forte intensité de données de nouvelle génération. Conçu pour permettre plus d'analyses, vous obtenez un accès fluide aux données de la périphérie au cœur jusqu'au cloud, plus rapide, connecté, optimisé et résilient.
L’IA sur IBM Z utilise le ML pour convertir les données de chaque transaction en analyses en temps réel. Découvrez des informations et obtenez rapidement des résultats fiables et exploitables sans déplacement de données. Appliquez l’IA et le ML à vos données d’entreprise les plus utiles sur IBM Z en utilisant des cadres d’exigences et des outils open source.
L’infrastructure IBM est sécurisée, évolutive, ouverte, indemnisée et conçue pour prendre en charge la nature hautement dynamique et intense en performances des workloads d’IA, tout en offrant des opérations d’IA durables qui réduisent les coûts, les risques et la consommation d’énergie.
En savoir plus sur l’infrastructure des technologies de l’information (TI), ou infrastructure IT, les composants combinés nécessaires au fonctionnement et à la gestion des services et des environnements informatiques de l’entreprise.
Découvrir comment l'IA générative peut permettre aux entreprises d'innover radicalement dans le développement, le marketing et la livraison de leurs produits.
L'informatique quantique utilise des technologies spécialisées, notamment du matériel informatique et des algorithmes qui tirent parti de la mécanique quantique, pour résoudre des problèmes complexes que les ordinateurs classiques ou les superordinateurs ne peuvent pas résoudre, ou pas assez rapidement.
Découvrir comment l'intelligence artificielle (IA) peut optimiser la collaboration avec les solutions de chaîne d'approvisionnement, en améliorant ainsi la gestion des actifs des entreprises.
Découvrir le monde de l'AIOps, une innovation qui utilise l'IA, notamment le traitement du langage naturel et les modèles de ML, pour automatiser et optimiser la gestion des services informatiques.
Découvrir le stockage des données, les supports magnétiques, optiques ou mécaniques qui enregistrent et conservent des informations numériques pour des opérations en cours ou futures.