Il est essentiel de disposer d’options pour adopter avec succès l’IA au sein de votre entreprise. Tous les modèles ne se valent pas. Les meilleurs modèles dépendent de votre secteur, de votre domaine et de votre cas d’utilisation. Watsonx.ai offre à ses clients et partenaires une sélection de modèles comprenant des modèles de base développés par IBM, des modèles open source et des modèles provenant de fournisseurs tiers. Nous offrons du choix et de la flexibilité qui s’articulent autour de deux axes : les modèles et les environnements de déploiement. Vous pouvez déployer les modèles d’IA partout où se trouve votre workload.
Depuis plus d’un siècle, IBM s’efforce de gagner la confiance des entreprises et de la société en introduisant dans le monde de nouvelles technologies puissantes, y compris l’IA, de manière responsable et avec un objectif clair.
En savoir plus sur la puissance de l’IA adaptée à vos besoins uniques
Découvrir comment construire des modèles de base adaptés à l’entreprise
Travaillez avec un modèle de base développé par IBM et formé à partir de données pertinentes pour l’entreprise, qui vous aide à saisir les nuances de votre domaine d’activité, y compris les domaines universitaire, juridique, financier, Internet et de code.
Accédez à des modèles de tailles et d’architectures diverses, y compris des modèles open source, des modèles tiers et des modèles de base développés par IBM, afin d’améliorer les performances, la vitesse, la flexibilité des options de déploiement et l’efficacité.
Instruisez et incitez les modèles à créer des actifs IA différenciés avec vos propres données propriétaires pour vous donner un avantage concurrentiel.
La version initiale de watsonx.ai comprenait la famille Slate de modèles d’encodeurs uniquement destinés aux cas d’utilisation du traitement automatique du langage naturel (NLP) en entreprise. Avec les nouveaux modèles de base Granite, vous pouvez profiter d’une architecture de décodeur uniquement conçue pour les tâches génératives, telles que le résumé, la génération de contenu et l’extraction d’informations.
Formés à l’aide de jeux de données axés sur l’entreprise et organisés par IBM et régis par des règles et des mesures de protection qui permettent de filtrer les contenus répréhensibles, les modèles Granite donnent aux utilisateurs accès à des modèles adaptés à l’entreprise et développés avec soin. La collection initiale de Granite comprend deux variantes d’un modèle de 13 milliards de paramètres : granite-13b-chat et granite-13b-instruct. Grâce au nombre élevé de paramètres, ces variantes sont potentiellement plus efficaces que les modèles plus grands puisqu’elles peuvent être intégrées dans un seul processeur graphique A100-80 Go, réduisant potentiellement le coût total de possession.
Développés par IBM Research et conçus pour des tâches génératives, les modèles Granite sont entraînés sur des domaines pertinents pour l’entreprise, notamment des domaines financiers, juridiques, informatiques, de codage et universitaires. Ils répondent à des cas d’utilisation spécialisés en entreprise, tels que l’évaluation des sentiments dans les transcriptions d’appels d’offres et de résultats, la réponse à des questions financières ou liées à l’assurance, ainsi qu’à des cas d’utilisation généraux pour la génération de contenu, le résumé, la classification, l’extraction d’informations et la génération améliorée de données de recherche.
Les 153 millions de modèles multilingues de Slate servent au traitement automatique du langage naturel (NLP) en entreprise et aux cas d’utilisation de l’IA non générative. Développés par IBM Research, ces grands modèles de langage encodés uniquement sont rapides et efficaces pour les tâches de NLP d’entreprise telles que l’analyse des sentiments, l’extraction d’entités, la détection des relations et la classification, mais nécessitent des données étiquetées spécifiques à la tâche pour un réglage précis. Pour utiliser nos modèles Slate, accédez à nos blocs-notes.
L’approche d’IBM en matière de développement de modèles d’IA est guidée par des principes fondamentaux fondés sur des engagements de confiance et de transparence pour une IA responsable.
Les modèles Granite ont été entraînés sur des jeux de données d’entreprise organisés par IBM, couvrant cinq domaines : Internet, universitaire, code, juridique et financier. Ces jeux de données ont été filtrés pour exclure tout contenu répréhensible et ont été comparés à des tâches universitaires et à des tâches adaptées à l’entreprise.
Découvrez comment IBM Research a développé Granite pour en savoir plus sur la formation de ces modèles et sur les sources de données utilisées.
Sélectionnez le modèle qui correspond le mieux à vos besoins. Après avoir dressé une liste restreinte de modèles pour votre cas d’utilisation, testez systématiquement les modèles à l’aide de techniques d’ingénierie rapide pour voir lesquels renvoient systématiquement les résultats souhaités.
granite-13b-chat
IBM
Prend en charge des tâches Question-réponse et Générer.
8192
0,005
granite-13b-instruct
IBM
Prend en charge les tâches d’extraction, de synthèse et de classification.
8192
0,005
llama-2-70b-chat
Meta
Prend en charge les tâches Question-réponse, Générer, Extraire, Résumer, Classifier. Optimisé pour les cas d'utilisation de dialogues.
4096
0,005
flan-t5-xxl-11b
Prend en charge les tâches de Question-réponse, Générer, Résumer, Classifier.
4096
0,0018
flan-ul2-20b
Prend en charge les tâches Question-réponse, Générer, Extraire, Résumer, Classifier.
4096
0,005
gpt-neox-20b
EleutherAI
Prend en charge des tâches Question-réponse et Générer. Fonctionne bien avec les caractères spéciaux, ce qui peut être utile pour générer des résultats structurés.
8192
0,005
mpt-7b-instruct2
Mosaic, perfectionné par IBM
Prend en charge des tâches Question-réponse et Générer.
2048
0,0006
mt0-xxl-13b
BigScience
Prend en charge les tâches Question-réponse, Générer, Extraire, Résumer, Classifier.
4096
0,0018
starcoder-15.5b
BigCode
Modèle de code spécifique à une tâche en générant et en traduisant le code à partir d’une invite en langage naturel.
8192
0,0018
IBM croit en la création, le déploiement et l’utilisation de modèles d’IA qui font progresser l’innovation dans l’entreprise de manière responsable. La plateforme de données et d’IA watsonx d’IBM dispose d’un processus de bout en bout pour construire et tester les modèles de base et l’IA générative. Pour les modèles développés par IBM, nous recherchons et supprimons les doublons, et nous utilisons des listes de blocage d’URL, des filtres pour le contenu répréhensible et la qualité des documents, des techniques de découpage des phrases et de symbolisation, le tout avant l’apprentissage du modèle. Au cours du processus de formation des données, nous nous efforçons d’éviter les défauts d’alignement dans les sorties du modèle et nous utilisons un réglage précis supervisé pour permettre un meilleur suivi des instructions afin que le modèle puisse être utilisé pour accomplir les tâches de l’entreprise via prompt engineering. Nous continuons à développer les modèles Granite dans plusieurs directions, y compris d’autres modalités, un contenu spécifique aux secteurs et des annotations de données supplémentaires pour la formation, tout en déployant des garanties régulières et continues de protection des données pour les modèles développés par IBM.
Compte tenu de l’évolution rapide du paysage technologique de l’IA générative, notre processus de bout en bout est appelé à évoluer et à s’améliorer en permanence. Pour témoigner de la rigueur avec laquelle IBM développe et teste son modèle de base, l’entreprise fournit pour les modèles développés par IBM une indemnisation contractuelle standard en matière de propriété intellectuelle, similaire à celle qu’elle fournit pour le matériel et les produits logiciels d’IBM. En outre, contrairement à d’autres fournisseurs de grands modèles de langage et conformément à l’approche standard d’IBM en matière d’indemnisation, IBM n’exige pas de ses clients qu’ils l’indemnisent pour l’utilisation qu’ils font des modèles qu’elle a développés. Conformément à son approche de l’obligation d’indemnisation, IBM ne plafonne pas sa responsabilité en matière d’indemnisation pour les modèles qu’elle a développés.
Voici les modèles actuels de watsonx bénéficiant de ces protections :
(1) Famille Slate des modèles à encodeur seul
(2) Famille Granite des modèles à décodeur seul
1Les prix d’inférences sont calculés pour 1 000 jetons (1 unité de ressources). Les jetons d’entrée et de fin sont facturés au même taux. 1 000 jetons correspondent généralement à environ 750 mots.
Certains modèles ne sont pas disponibles dans toutes les régions, voir notre documentation pour plus de détails.
Longueur du contexte exprimée en jetons.
Les déclarations relatives aux projets, à l’orientation et aux intentions d’IBM sont susceptibles d’être modifiées ou retirées sans préavis, à la seule discrétion d’IBM. Consultez la page dédiée à la tarification pour en savoir plus. Sauf indication contraire spécifiée dans la tarification du logiciel, toutes les fonctionnalités, capacités et mises à jour potentielles se rapportent exclusivement au SaaS. IBM ne garantit pas que la fonctionnalité et les capacités du SaaS et du logiciel seront les mêmes.