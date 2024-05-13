Balises
Intelligence artificielle

Faire évoluer l’IA générative grâce à des choix de modèles flexibles

Homme assis près d’une grande fenêtre dans une bibliothèque moderne et travaillant sur son ordinateur portable.

Cette série d’articles démystifie l’IA générative pour les entreprises à l’intention des dirigeants commerciaux et technologiques. Elle fournit des cadres simples et des principes directeurs pour votre parcours de transformation vers l’intelligence artificielle (IA). Dans l’article précédent, nous avons abordé l’approche unique d’IBM pour fournir des modèles dédiés aux entreprises. Dans cet article, nous explorons pourquoi le choix des modèles de fondation est important et comment ils permettent aux entreprises de dimensionner l’IA générative en toute confiance.

Pourquoi le choix des modèles est-il important ?

Dans le monde dynamique de l’IA générative, les approches universelles ne sont pas adaptées. Alors que les entreprises s’efforcent d’exploiter la puissance de l’IA, elles doivent disposer d’un large éventail de modèles pour :

  • Stimuler l’innovation : une palette diversifiée de modèles favorise non seulement l’innovation en apportant des forces distinctes pour résoudre un large éventail de problèmes, mais permet également aux équipes de s’adapter à l’évolution des besoins de l’entreprise et des attentes des clients.
  • Personnalisez pour obtenir un avantage concurrentiel : Une gamme de modèles permet aux entreprises d'adapter les applications d'IA à leurs besoins spécifiques, ce qui leur confère un avantage concurrentiel. L’IA générative peut être adaptée à des tâches spécifiques, qu’il s’agisse de répondre à des questions sur des applications de chat ou d’écrire du code pour générer des résumés rapides.
  • Accélérer le délai de mise sur le marché : dans l’environnement commercial dynamique d’aujourd’hui, le temps est un facteur essentiel. Un portefeuille diversifié de modèles peut accélérer le processus de développement, ce qui permet aux entreprises de lancer rapidement des offres alimentées par l’IA. Cela est particulièrement important dans le domaine de l’IA générative, où l’accès aux dernières innovations offre un avantage concurrentiel indéniable.
  • Rester flexible face au changement : les conditions du marché et les stratégies commerciales évoluent constamment. Les différents choix de modèles permettent aux entreprises de pivoter rapidement et efficacement. L’accès à de multiples options permet de s’adapter rapidement aux nouvelles tendances ou aux changements stratégiques, tout en préservant l’agilité et la résilience.
  • Optimiser les coûts dans différents cas d’utilisation : les différents modèles ont des implications différentes en termes de coûts. En accédant à une gamme de modèles, les entreprises peuvent choisir l’option la plus rentable pour chaque application. Si certaines tâches nécessitent la précision de modèles coûteux, d’autres peuvent être accomplies avec des solutions plus abordables sans sacrifier la qualité. Par exemple, dans le domaine de l’assistance client, le débit et la latence peuvent être plus critiques que la précision, alors que dans le domaine de la recherche et développement, la précision est plus importante.
  • Atténuer les risques : s’appuyer sur un seul modèle ou sur une sélection limitée peut s’avérer risqué. Un portefeuille diversifié de modèles permet d’atténuer les risques de concentration et aide à s’assurer que les entreprises restent résilientes aux lacunes ou à l’échec d’une approche spécifique. Cette stratégie permet une répartition des risques et propose des solutions alternatives en cas de difficulté.
  • Respecter les réglementations : le paysage réglementaire concernant l’IA ne cesse d’évoluer, avec des considérations éthiques au premier plan. Les différents modèles peuvent avoir des implications variées en matière d’équité, de respect de la vie privée et de conformité. Un large choix permet aux entreprises de naviguer sur ce terrain complexe et de choisir des modèles qui répondent aux normes légales et éthiques.

Sélectionner les bons modèles IA

Maintenant que nous avons compris l’importance du choix du modèle, comment résoudre le problème de la pléthore de choix lors de la sélection du bon modèle pour un cas d’utilisation ? Nous pouvons décomposer ce problème complexe en une série de mesures simples que vous pouvez appliquer dès aujourd’hui :

  1. Identifier un cas d’utilisation clair : déterminez les besoins et les exigences spécifiques de votre application métier. Pour ce faire, vous devez rédiger des prompts détaillés qui tiennent compte des subtilités de votre secteur et de votre entreprise pour vous assurer que le modèle correspond étroitement à vos objectifs.
  2. Dresser la liste de toutes les options du modèle : évaluez les différents modèles en fonction de leur taille, de leur précision, de leur temps de latence et des risques associés. Il s’agit notamment de comprendre les forces et les faiblesses de chaque modèle, comme les compromis entre la précision, la latence et le débit.
  3. Évaluer les caractéristiques du modèle : évaluez la pertinence de la taille du modèle par rapport à vos besoins, en tenant compte de la manière dont l’échelle du modèle peut affecter ses performances et les risques encourus. Cette étape consiste à ajuster la taille du modèle pour l’adapter de manière optimale au cas d’utilisation, car plus grand n’est pas nécessairement mieux. Les petits modèles peuvent être plus performants que les grands dans des domaines et des cas d’utilisation ciblés.
  4. Tester les options de modèle : effectuez des tests pour voir si le modèle fonctionne comme prévu dans des conditions imitant des scénarios réels. Il s’agit d’utiliser des références universitaires et des ensembles de données spécifiques à un domaine pour évaluer la qualité des résultats et d’ajuster le modèle, par exemple par le biais du prompt engineering ou d’une mise au point du modèle afin d’optimiser sa performance.
  5. Affiner votre sélection en fonction des coûts et des besoins de déploiement:  après les tests, affinez votre choix en tenant compte de facteurs tels que le retour sur investissement, la rentabilité et les possibilités de déploiement du modèle dans vos systèmes et infrastructures existants. Ajustez le choix en fonction d’autres avantages comme une latence plus faible ou une transparence plus élevée.
  6. Choisir le modèle qui offre le plus de valeur : faites le choix final d’un modèle d’IA qui offre le meilleur équilibre entre la performance, le coût et les risques associés, adapté aux exigences spécifiques de votre cas d’utilisation.

Bibliothèque de modèles IBM watsonx®

En adoptant une stratégie multimodèle, la bibliothèque IBM Watsonx propose des modèles propriétaires, open source et tiers, comme le montre l’image :

Liste des modèles de fondation watsonx au 8 mai 2024. Liste des modèles de fondation watsonx au 8 mai 2024.

Les clients disposent ainsi d’un large éventail de choix, ce qui leur permet de sélectionner le modèle qui correspond le mieux à leurs préférences en matière d’activité, de région et de risque.

De plus, watsonx permet aux clients de déployer des modèles sur l’infrastructure de leur choix, avec des options multicloud hybride et sur site, afin d’éviter l’enfermement propriétaire et de réduire le coût total de possession.

IBM Granite : modèles de fondation dédiés aux entreprises d’IBM

Les caractéristiques des modèles de fondation peuvent être regroupées en 3 attributs principaux. Les entreprises doivent comprendre que trop insister sur un attribut peut compromettre les autres. Il est essentiel d’équilibrer ces attributs pour adapter le modèle aux besoins spécifiques d’une entreprise :

  1. Fiabilité : des modèles clairs, explicables et inoffensifs.
  2. Performance : le bon niveau de performance pour les domaines d’activité et les cas d’utilisation ciblés.
  3. Rentabilité : modèles qui offrent l’IA générative à un coût total de possession inférieur et à un risque réduit.

IBM Granite est une série phare de modèles dédiés aux entreprises développés par IBM Research. Ces modèles offrent une fonctionnalité optimale de ces attributs, en mettant l’accent sur la confiance et la fiabilité, afin de permettre aux entreprises de réussir leurs initiatives en matière d’IA générative. N’oubliez pas que les entreprises ne peuvent pas mettre leur solution d’IA générative à l’échelle avec des modèles de fondation auxquels elles ne peuvent pas faire confiance.

IBM watsonx propose des modèles d’IA dédiés aux entreprises résultant d’un processus d’affinement rigoureux. Ce processus commence par une innovation de modèle menée par IBM Research, impliquant des collaborations ouvertes et des formations sur du contenu pertinent pour l’entreprise, conformément au code d’éthique de l’IA d’IBM afin de promouvoir la transparence des données.

IBM Research a mis au point une technique d’ajustement d’instructions qui permet d’améliorer les modèles développés par IBM et certains modèles open source en leur apportant des capacités essentielles pour une utilisation en entreprise. Au-delà des références universitaires, notre ensemble de données « FM_EVAL » simule des applications d’IA d’entreprise réelles. Les modèles les plus robustes de ce pipeline sont disponibles sur IBM watsonx.ai® et fournissent aux clients des modèles de fondation d’IA générative fiables et dédiés aux entreprises, comme le montre l’image :

Modèles de fondation d’IA générative dédiés aux entreprises

Dernières annonces de modèles :

  • Modèles de code Granite : une famille de modèles entraînés dans 116 langages de programmation et dont la taille varie de 3 à 34 milliards de paramètres, dans un modèle de base et dans des variantes de modèle à suivi d’instructions.
  • Granite-7b-lab : Prend en charge les tâches polyvalentes et est optimisé grâce à la méthodologie à grande échelle d’alignement des chatbots (LAB) d’IBM pour intégrer de nouvelles compétences et connaissances.

Essayez nos modèles de fondation dédiés aux entreprises sur watsonx avec notre nouvelle démonstration par chat watsonx.ai. Découvrez leurs capacités en matière de synthèse, de génération de contenu et de traitement de documents via une interface de chat simple et intuitive.