Qu’est-ce qu’une workload d’IA ?

Auteurs

Staff Writer

IBM Think

Staff Editor

IBM Think

Qu’est-ce qu’une workload d’IA ?

Les workloads d’IA sont des ensembles de processus informatiques, d’applications et de ressources de calcul en temps réel que l’on emploie pour accomplir des tâches relatives aux systèmes d’intelligence artificielle, de machine learning et d’apprentissage profond.

Plus précisément, le terme « workload d’IA » désigne les tâches gourmandes en ressources, qui exigent que d’immenses quantités de données soient traitées à des fins de développement, d’entraînement et de déploiement de modèles d’IA.

En coulisses, les workloads individuelles d’IA permettent aux applications d’IA de simuler des caractéristiques humaines, telles que la compréhension, la prise de décision, la résolution de problèmes, la créativité et l’autonomie, associées à la manière dont les humains apprennent, pensent et tirent des conclusions.

La différence entre workloads d’IA et workloads traditionnelles

Dans le domaine de l’informatique, le terme « workload » a évolué et revêt des connotations différentes selon les contextes. En règle générale, une workload correspond à la demande totale du système, c’est-à-dire au temps et aux ressources nécessaires pour atteindre un résultat souhaité. Les workloads peuvent aller de tâches relativement simples, comme un calcul unique ou une application autonome, à des opérations complexes, comme le traitement d’analyses de données à grande échelle, des services de cloud hybride ou de cloud public, ou l’exécution d’une suite d’applications et de workflows interconnectés.

En tant que sous-ensemble, les workloads d’IA sont associées à des tâches liées aux applications d’IA, telles que l’IA générative, les grands modèles de langage (LLM) comme ChatGPT, le traitement automatique du langage naturel (NLP) et l’exécution d’algorithmes d’IA. Les workloads d’IA se différencient de la plupart des autres types de workloads par leurs niveaux élevés de complexité et les types de données traitées. Par rapport à d’autres types de workloads, les workloads d’IA traitent généralement des données non structurées comme des images et du texte.

Design 3D de balles roulant sur une piste

Les dernières actualités et informations en matière d’IA  

La newsletter hebdomadaire Think vous apporte toute l’actualité sur l’IA, le cloud et bien d’autres sujets.

Types de workloads d’IA

D’une manière générale, les workloads d’IA peuvent être divisées en deux catégories principales, à savoir l’entraînement et l’inférence de modèle :

Entraînement du modèle

Les workloads d’entraînement des modèles permettent d’apprendre aux cadres d’IA à identifier les schémas pour faire des prédictions précises.

Inférence de modèle

Les workloads d’inférence de modèle englobent des tâches (et la puissance de calcul associée) nécessaires aux modèles d’IA pour interpréter les nouvelles données et demandes, et y répondre.

Parmi les autres types de workloads d’IA plus nuancés, on peut citer les suivants :

Workloads de traitement des données

Ces types de workloads impliquent la préparation des données à des fins d’analyse approfondie ou d’entraînement des modèles. Essentiel à l’entraînement des modèles d’IA, le traitement des workloads garantit que les données d’entraînement répondent aux normes de qualité et de formatage prédéfinies. Les workloads de traitement des données comprennent des tâches telles que l’extraction et le regroupement de données provenant de différentes sources pour obtenir un format cohérent, puis le chargement des données dans un système de stockage auquel le modèle d’IA pourra facilement accéder. Ces types de processus peuvent également inclure des opérations plus avancées, comme l’extraction de caractéristiques, lors de laquelle certains points de données ou attributs sont identifiés comme entrées souhaitées à partir de jeux de données moins structurés.

Workloads de machine learning

Les workloads de machine learning (ML) sont directement liées au développement, à l’entraînement et au déploiement des algorithmes ML utilisés pour apprendre et faire des prédictions. Les workloads de ML traitent de grands jeux de données en ajustant de manière itérative les paramètres du modèle pour en améliorer la précision. Les modèles de ML sont utiles pour les tâches d’inférence (par exemple, prédire des événements en s’appuyant sur des schémas historiques). Ces types de workloads peuvent être particulièrement gourmandes en ressources pendant la phase d’entraînement, nécessitant des processeurs spécialisés comme les unités de traitement graphique (GPU) et les unités de traitement tensoriel (TPU) pour accélérer les opérations grâce aux calculs parallèles.

Workloads d’apprentissage profond

Les workloads d’apprentissage profond (DL) permettent d’entraîner et de déployer des réseaux de neurones qui imitent la façon dont l’humain réfléchit, apprend et résout les problèmes. Sous-catégorie du machine learning, l’apprentissage profond se définit par une plus grande profondeur puisqu’il implique plusieurs couches de neurones artificiels, ou nœuds, qui s’appuient sur des hiérarchies de données de plus en plus complexes pour établir des connexions et des abstractions. Les modèles DL sont particulièrement utiles dans les tâches de reconnaissance d’images et de reconnaissance vocale, mais ces types de workloads peuvent s’avérer encore plus exigeantes que les workloads de ML. En effet, ils demandent des accélérateurs d’IA aussi puissants que ceux utilisés dans les calculs haute performance (HPC).

Workloads de traitement automatique du langage naturel

Les tâches de traitement automatique du langage naturel (TAL) aident les humains à interagir avec les systèmes d’IA par le biais de prompts conversationnels. Ces types de workloads aident les modèles d’IA à comprendre et à interpréter le langage naturel, pour ensuite générer des réponses faciles à comprendre pour les humains. Parmi les tâches associées au TAL, citons l’analyse des sentiments, la traduction et la reconnaissance vocale. Les systèmes TAL doivent être capables d’analyser de grands volumes de données textuelles et audio pour en extraire le contexte, la grammaire et la sémantique. Les unités centrales de traitement (CPU) modernes sont capables de faire fonctionner les systèmes d’IA TAL. Les modèles linguistiques plus compliqués peuvent mettre à rude épreuve les processeurs standard et nécessiter un niveau plus élevé de ressources de calcul.

Workloads d’IA générative

Les systèmes d’IA générative sont utilisés pour produire du nouveau contenu (du texte, des images ou des vidéos) basé sur de vastes jeux de données d’entraînement et des prompts utilisateur. Les workloads d’IA générative interprètent les commandes utilisateur et créent des inférences pour générer des productions cohérentes. Les grands modèles de langage s’appuient sur des workloads d’IA générative pour exécuter des tâches telles que la prédiction du meilleur mot suivant à utiliser dans une phrase. Les modèles de diffusion, utilisés pour la génération d’images et de vidéos, reposent sur ces types de workloads pour affiner de manière itérative un bruit aléatoire et obtenir des visuels cohérents et contextuellement pertinents, presque comme un sculpteur travaillant un bloc de marbre.

Workloads de vision par ordinateur

Les workloads de vision par ordinateur permettent aux ordinateurs d’utiliser des capteurs tels que les caméras et le LiDAR pour interpréter les données visuelles, identifier des objets et réagir en temps réel. Ces types de tâches sont essentielles aux applications telles que les véhicules autonomes et la surveillance automatisée. Les workloads de vision par ordinateur comprennent des tâches comme la classification d’images, la détection d’objets et la reconnaissance faciale.

Smart Talks with IBM

Comment l’infrastructure alimente l’ère de l’IA

Découvrez comment les capacités matérielles permettent les calculs matriciels nécessaires à l’exécution de grands modèles de langage, et plongez-vous dans des exemples créatifs d’exploitation de l’IA, de votre banque à votre café local.

Découvrir les podcasts IBM

Cas d’utilisation des workloads d’IA

Les workloads d’IA sont utiles pour chaque type d’application d’IA. Les récentes avancées technologiques ont propulsé l’IA dans une nouvelle ère de fonctionnalité, avec des applications couvrant des secteurs allant de l’automatisation et de l’automobile aux soins de santé à l’industrie lourde. Chaque jour, de nouvelles applications d’IA sont testées et d’anciennes applications sont affinées afin d’améliorer considérablement un large éventail de services et d’opérations.

Expérience client, service client et support client

Les chatbots alimentés par l’IA et les assistants virtuels sont de plus en plus utilisés par les entreprises qui cherchent à mieux répondre aux préoccupations de leurs clients et à gérer les tickets d’assistance, voire même les ventes. Ces outils associent traitement automatique du langage naturel et IA générative pour interpréter les questions des clients et y répondre promptement, ou transmettre les requêtes plus complexes aux agents physiques. Parce que l’IA se charge des tâches de bas niveau, comme répondre aux questions fréquemment posées et fournir une assistance disponible 24 heures sur 24, les agents humains peuvent se concentrer sur les tâches de haut niveau, ce qui améliore l’expérience globale de l’utilisateur.

Détection des fraudes

L’IA est en train de s’imposer comme une défense extrêmement puissante contre les tactiques en constante évolution utilisées par les escrocs et les fraudeurs. Les algorithmes de machine learning et d’apprentissage profond analysent les schémas de transaction complexes et signalent les comportements suspects grâce à la détection des anomalies. Si le champ d’action des experts en détection des fraudes est limité, l’IA est capable d’examiner toujours plus de données à la seconde, ce qui en fait un outil inestimable pour des secteurs comme la banque.

Expériences personnalisées

Les détaillants, les banques et d’autres entreprises en contact avec les clients utilisent l’IA pour créer des expériences d’achat et de divertissement plus personnalisées, de sorte à améliorer la satisfaction de leurs clients et prévenir l’attrition. Les algorithmes d’IA peuvent s’appuyer sur certaines données des clients, comme leurs centres d’intérêt et leurs achats passés, pour adapter les recommandations de produits et de services.

Ressources humaines et recrutement

L’embauche et la gestion d’un personnel qualifié peuvent représenter une charge énorme pour n’importe quel secteur. Les plateformes de recrutement alimentées par l’IA contribuent à rationaliser le processus d’embauche en sélectionnant les CV, en associant les bons candidats aux postes à pourvoir et en menant des entretiens préliminaires à l’aide de l’analyse vidéo. De tels outils peuvent aider les professionnels des ressources humaines à réduire le temps consacré aux tâches administratives mineures et à se concentrer davantage sur les candidats les plus prometteurs. En triant un grand nombre de potentielles recrues, l’IA permet de réduire les délais de recrutement et les temps de réponse, améliorant ainsi l’expérience des candidats, qu’ils obtiennent le poste ou non.

Développement et modernisation d’applications

Les outils d’IA générative, qui peuvent produire des résultats détaillés basés sur des éléments conversationnels, démontrent une valeur unique pour les codeurs et les développeurs. Capables de produire du code exécutable, ces outils d’IA automatisés rationalisent les tâches répétitives associées à l’écriture de code, aident au développement d’applications et accélèrent les initiatives de migration et de modernisation des applications. Bien qu’ils ne remplacent pas les codeurs talentueux, les outils de codage par IA peuvent contribuer à réduire les erreurs et à garantir la cohérence du code.

Maintenance prédictive

Associés à des outils puissants comme la virtualisation, les modèles de machine learning peuvent analyser les données collectées à partir de capteurs, d’appareils compatibles avec l’Internet des objets (IdO) et de technologies opérationnelles (OT), afin de prédire avec précision les opérations de maintenance des équipements nécessaires pour prévenir les pannes. La maintenance prédictive optimisée par l’IA permet aux entreprises de réduire les temps d’arrêt et d’améliorer leur rentabilité.

Défis liés aux workloads d’IA

La gestion des workloads, quelles qu’elles soient, est un élément critique de tout service informatique d’envergure. De mauvaises configurations peuvent directement entraver les performances globales du système, entraînant une augmentation des coûts, une réduction de la stabilité et une expérience négative pour les utilisateurs. Les fournisseurs de solutions d’IA comme IBM, Microsoft Azure, Nvidia et Amazon Web Services (AWS) recherchent constamment des moyens rentables d’optimiser la bande passante sur les principaux pipelines et d’améliorer les performances globales tout au long du cycle de vie des workloads de tous types.

Bien qu’il existe de nombreux types de workloads complexes, les workloads d’IA comptent parmi les plus exigeantes. Elles ont besoin de nombreuses solutions de stockage de données, sur site ou dans des centres de données distants, et d’un matériel puissant et spécialisé.

Voici quelques-uns des principaux défis liés à la mise en œuvre des workloads d’IA :

Allocation de ressources : obtenir des workloads d’IA efficaces et à faible latence est un défi pour les processeurs traditionnels tels que les CPU. Les algorithmes d’IA complexes et le traitement de grands volumes de données nécessitent du matériel optimisé pour l’IA et conçu pour le traitement parallèle. À mesure que les systèmes d’IA gagnent en complexité et en densité de données, l’évolutivité devient un facteur essentiel.

Confidentialité et sécurité : les workloads d’IA dépendent de grandes quantités de données (et en produisent). Ces données peuvent souvent contenir des informations personnelles sensibles, des secrets commerciaux et des renseignements gouvernementaux classifiés. Les vulnérabilités potentielles en matière de sécurité augmentent avec la complexité d’un système et, face à une quantité de données aussi importante et variée, on ne saurait trop insister sur l’importance des contrôles de sécurité stricts.

Maintenance : au fil du temps, les modèles d’IA doivent occasionnellement être réentraînés et recalibrés pour garantir leur précision. Le réentraînement régulier des modèles d’IA peut s’avérer coûteux et laborieux, et il doit être effectué par des professionnels qualifiés.

Préoccupations éthiques : l’exploitation de systèmes d’IA avec des workloads d’IA soulève un certain nombre de nouvelles considérations éthiques. Des questions telles que la gestion des biais algorithmiques, la transparence des modèles et la garantie de la responsabilité continuent de susciter des débats. Dans le cas de l’IA générative, qui est souvent entraînée sur la propriété intellectuelle originale, les préoccupations liées aux droits d’auteur et à l’attribution soulèvent des questions intéressantes et importantes.

Transformez votre infrastructure en un avantage pour l’IA

Participez à ce webinaire pour découvrir comment les équipes de pointe personnalisent l’IA grâce au cloud hybride et à une infrastructure alimentée par des GPU. Découvrez les possibilités offertes par un environnement conçu pour accélérer l’IA et comment vous lancer.

Qu’est-ce qu’une workload d’IA ?

Auteurs

Qu’est-ce qu’une workload d’IA ?

La différence entre workloads d’IA et workloads traditionnelles

Les dernières actualités et informations en matière d’IA

Types de workloads d’IA

Comment l’infrastructure alimente l’ère de l’IA

Cas d’utilisation des workloads d’IA

Expérience client, service client et support client

Détection des fraudes

Expériences personnalisées

Ressources humaines et recrutement

Développement et modernisation d’applications

Maintenance prédictive

Défis liés aux workloads d’IA

Share

IBM z17 : le premier mainframe entièrement conçu pour l’ère de l’IA

Les dernières actualités et informations en matière d’IA