Les workloads d’IA sont des ensembles de processus informatiques, d’applications et de ressources de calcul en temps réel que l’on emploie pour accomplir des tâches relatives aux systèmes d’intelligence artificielle, de machine learning et d’apprentissage profond.
Plus précisément, le terme « workload d’IA » désigne les tâches gourmandes en ressources, qui exigent que d’immenses quantités de données soient traitées à des fins de développement, d’entraînement et de déploiement de modèles d’IA.
En coulisses, les workloads individuelles d’IA permettent aux applications d’IA de simuler des caractéristiques humaines, telles que la compréhension, la prise de décision, la résolution de problèmes, la créativité et l’autonomie, associées à la manière dont les humains apprennent, pensent et tirent des conclusions.
Dans le domaine de l’informatique, le terme « workload » a évolué et revêt des connotations différentes selon les contextes. En règle générale, une workload correspond à la demande totale du système, c’est-à-dire au temps et aux ressources nécessaires pour atteindre un résultat souhaité. Les workloads peuvent aller de tâches relativement simples, comme un calcul unique ou une application autonome, à des opérations complexes, comme le traitement d’analyses de données à grande échelle, des services de cloud hybride ou de cloud public, ou l’exécution d’une suite d’applications et de workflows interconnectés.
En tant que sous-ensemble, les workloads d’IA sont associées à des tâches liées aux applications d’IA, telles que l’IA générative, les grands modèles de langage (LLM) comme ChatGPT, le traitement automatique du langage naturel (NLP) et l’exécution d’algorithmes d’IA. Les workloads d’IA se différencient de la plupart des autres types de workloads par leurs niveaux élevés de complexité et les types de données traitées. Par rapport à d’autres types de workloads, les workloads d’IA traitent généralement des données non structurées comme des images et du texte.
D’une manière générale, les workloads d’IA peuvent être divisées en deux catégories principales, à savoir l’entraînement et l’inférence de modèle :
Les workloads d’entraînement des modèles permettent d’apprendre aux cadres d’IA à identifier les schémas pour faire des prédictions précises.
Les workloads d’inférence de modèle englobent des tâches (et la puissance de calcul associée) nécessaires aux modèles d’IA pour interpréter les nouvelles données et demandes, et y répondre.
Parmi les autres types de workloads d’IA plus nuancés, on peut citer les suivants :
Ces types de workloads impliquent la préparation des données à des fins d’analyse approfondie ou d’entraînement des modèles. Essentiel à l’entraînement des modèles d’IA, le traitement des workloads garantit que les données d’entraînement répondent aux normes de qualité et de formatage prédéfinies. Les workloads de traitement des données comprennent des tâches telles que l’extraction et le regroupement de données provenant de différentes sources pour obtenir un format cohérent, puis le chargement des données dans un système de stockage auquel le modèle d’IA pourra facilement accéder. Ces types de processus peuvent également inclure des opérations plus avancées, comme l’extraction de caractéristiques, lors de laquelle certains points de données ou attributs sont identifiés comme entrées souhaitées à partir de jeux de données moins structurés.
Les workloads de machine learning (ML) sont directement liées au développement, à l’entraînement et au déploiement des algorithmes ML utilisés pour apprendre et faire des prédictions. Les workloads de ML traitent de grands jeux de données en ajustant de manière itérative les paramètres du modèle pour en améliorer la précision. Les modèles de ML sont utiles pour les tâches d’inférence (par exemple, prédire des événements en s’appuyant sur des schémas historiques). Ces types de workloads peuvent être particulièrement gourmandes en ressources pendant la phase d’entraînement, nécessitant des processeurs spécialisés comme les unités de traitement graphique (GPU) et les unités de traitement tensoriel (TPU) pour accélérer les opérations grâce aux calculs parallèles.
Les workloads d’apprentissage profond (DL) permettent d’entraîner et de déployer des réseaux de neurones qui imitent la façon dont l’humain réfléchit, apprend et résout les problèmes. Sous-catégorie du machine learning, l’apprentissage profond se définit par une plus grande profondeur puisqu’il implique plusieurs couches de neurones artificiels, ou nœuds, qui s’appuient sur des hiérarchies de données de plus en plus complexes pour établir des connexions et des abstractions. Les modèles DL sont particulièrement utiles dans les tâches de reconnaissance d’images et de reconnaissance vocale, mais ces types de workloads peuvent s’avérer encore plus exigeantes que les workloads de ML. En effet, ils demandent des accélérateurs d’IA aussi puissants que ceux utilisés dans les calculs haute performance (HPC).
Les tâches de traitement automatique du langage naturel (TAL) aident les humains à interagir avec les systèmes d’IA par le biais de prompts conversationnels. Ces types de workloads aident les modèles d’IA à comprendre et à interpréter le langage naturel, pour ensuite générer des réponses faciles à comprendre pour les humains. Parmi les tâches associées au TAL, citons l’analyse des sentiments, la traduction et la reconnaissance vocale. Les systèmes TAL doivent être capables d’analyser de grands volumes de données textuelles et audio pour en extraire le contexte, la grammaire et la sémantique. Les unités centrales de traitement (CPU) modernes sont capables de faire fonctionner les systèmes d’IA TAL. Les modèles linguistiques plus compliqués peuvent mettre à rude épreuve les processeurs standard et nécessiter un niveau plus élevé de ressources de calcul.
Les systèmes d’IA générative sont utilisés pour produire du nouveau contenu (du texte, des images ou des vidéos) basé sur de vastes jeux de données d’entraînement et des prompts utilisateur. Les workloads d’IA générative interprètent les commandes utilisateur et créent des inférences pour générer des productions cohérentes. Les grands modèles de langage s’appuient sur des workloads d’IA générative pour exécuter des tâches telles que la prédiction du meilleur mot suivant à utiliser dans une phrase. Les modèles de diffusion, utilisés pour la génération d’images et de vidéos, reposent sur ces types de workloads pour affiner de manière itérative un bruit aléatoire et obtenir des visuels cohérents et contextuellement pertinents, presque comme un sculpteur travaillant un bloc de marbre.
Les workloads de vision par ordinateur permettent aux ordinateurs d’utiliser des capteurs tels que les caméras et le LiDAR pour interpréter les données visuelles, identifier des objets et réagir en temps réel. Ces types de tâches sont essentielles aux applications telles que les véhicules autonomes et la surveillance automatisée. Les workloads de vision par ordinateur comprennent des tâches comme la classification d’images, la détection d’objets et la reconnaissance faciale.
Les workloads d’IA sont utiles pour chaque type d’application d’IA. Les récentes avancées technologiques ont propulsé l’IA dans une nouvelle ère de fonctionnalité, avec des applications couvrant des secteurs allant de l’automatisation et de l’automobile aux soins de santé à l’industrie lourde. Chaque jour, de nouvelles applications d’IA sont testées et d’anciennes applications sont affinées afin d’améliorer considérablement un large éventail de services et d’opérations.
Les chatbots alimentés par l’IA et les assistants virtuels sont de plus en plus utilisés par les entreprises qui cherchent à mieux répondre aux préoccupations de leurs clients et à gérer les tickets d’assistance, voire même les ventes. Ces outils associent traitement automatique du langage naturel et IA générative pour interpréter les questions des clients et y répondre promptement, ou transmettre les requêtes plus complexes aux agents physiques. Parce que l’IA se charge des tâches de bas niveau, comme répondre aux questions fréquemment posées et fournir une assistance disponible 24 heures sur 24, les agents humains peuvent se concentrer sur les tâches de haut niveau, ce qui améliore l’expérience globale de l’utilisateur.
L’IA est en train de s’imposer comme une défense extrêmement puissante contre les tactiques en constante évolution utilisées par les escrocs et les fraudeurs. Les algorithmes de machine learning et d’apprentissage profond analysent les schémas de transaction complexes et signalent les comportements suspects grâce à la détection des anomalies. Si le champ d’action des experts en détection des fraudes est limité, l’IA est capable d’examiner toujours plus de données à la seconde, ce qui en fait un outil inestimable pour des secteurs comme la banque.
Les détaillants, les banques et d’autres entreprises en contact avec les clients utilisent l’IA pour créer des expériences d’achat et de divertissement plus personnalisées, de sorte à améliorer la satisfaction de leurs clients et prévenir l’attrition. Les algorithmes d’IA peuvent s’appuyer sur certaines données des clients, comme leurs centres d’intérêt et leurs achats passés, pour adapter les recommandations de produits et de services.
L’embauche et la gestion d’un personnel qualifié peuvent représenter une charge énorme pour n’importe quel secteur. Les plateformes de recrutement alimentées par l’IA contribuent à rationaliser le processus d’embauche en sélectionnant les CV, en associant les bons candidats aux postes à pourvoir et en menant des entretiens préliminaires à l’aide de l’analyse vidéo. De tels outils peuvent aider les professionnels des ressources humaines à réduire le temps consacré aux tâches administratives mineures et à se concentrer davantage sur les candidats les plus prometteurs. En triant un grand nombre de potentielles recrues, l’IA permet de réduire les délais de recrutement et les temps de réponse, améliorant ainsi l’expérience des candidats, qu’ils obtiennent le poste ou non.
Les outils d’IA générative, qui peuvent produire des résultats détaillés basés sur des éléments conversationnels, démontrent une valeur unique pour les codeurs et les développeurs. Capables de produire du code exécutable, ces outils d’IA automatisés rationalisent les tâches répétitives associées à l’écriture de code, aident au développement d’applications et accélèrent les initiatives de migration et de modernisation des applications. Bien qu’ils ne remplacent pas les codeurs talentueux, les outils de codage par IA peuvent contribuer à réduire les erreurs et à garantir la cohérence du code.
Associés à des outils puissants comme la virtualisation, les modèles de machine learning peuvent analyser les données collectées à partir de capteurs, d’appareils compatibles avec l’Internet des objets (IdO) et de technologies opérationnelles (OT), afin de prédire avec précision les opérations de maintenance des équipements nécessaires pour prévenir les pannes. La maintenance prédictive optimisée par l’IA permet aux entreprises de réduire les temps d’arrêt et d’améliorer leur rentabilité.
La gestion des workloads, quelles qu’elles soient, est un élément critique de tout service informatique d’envergure. De mauvaises configurations peuvent directement entraver les performances globales du système, entraînant une augmentation des coûts, une réduction de la stabilité et une expérience négative pour les utilisateurs. Les fournisseurs de solutions d’IA comme IBM, Microsoft Azure, Nvidia et Amazon Web Services (AWS) recherchent constamment des moyens rentables d’optimiser la bande passante sur les principaux pipelines et d’améliorer les performances globales tout au long du cycle de vie des workloads de tous types.
Bien qu’il existe de nombreux types de workloads complexes, les workloads d’IA comptent parmi les plus exigeantes. Elles ont besoin de nombreuses solutions de stockage de données, sur site ou dans des centres de données distants, et d’un matériel puissant et spécialisé.
Voici quelques-uns des principaux défis liés à la mise en œuvre des workloads d’IA :
Associez cadres et outils open source pour appliquer IA et machine learning aux données les plus importantes de votre entreprise sur les mainframes IBM zSystems.
IBM propose des solutions d’infrastructure IA pour accélérer l’impact à l’échelle de l’entreprise grâce à une stratégie « hybrid by design ».
Avec IBM Consulting, exploitez les données de votre entreprise et développez une organisation basée sur les informations pour tirer des avantages métier.