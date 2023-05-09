Nous sommes à la veille d'une révolution de l'IA. Au cours de la dernière décennie, l’apprentissage profond est né d’une collision majeure entre la disponibilité des données et la puissance de calcul, permettant une multitude de capacités d’IA impressionnantes. Mais nous avons été confrontés à un défi paradoxal : l’automatisation demande beaucoup de main-d’œuvre. Cela ressemble à une blague, mais ce n'en est pas une, comme le savent tous ceux qui ont essayé de résoudre des problèmes professionnels avec l'IA.
Les outils d'IA traditionnels, bien que puissants, peuvent être coûteux, longs et difficiles à utiliser. Les données doivent être collectées, organisées et étiquetées avec des annotations spécifiques aux tâches pour entraîner les modèles IA. La construction d'un modèle nécessite des compétences spécialisées et difficiles à trouver, et chaque nouvelle tâche exige de répéter le processus. En conséquence, les entreprises se sont principalement concentrées sur l’automatisation des tâches comportant des données abondantes et une valeur commerciale élevée, laissant tout le reste sur la table. Mais ceci commence à changer.
L'émergence des transformateurs et des méthodes d'apprentissage auto-supervisé nous a permis d'exploiter de vastes quantités de données non étiquetées, ouvrant la voie à de grands modèles pré-entraînés, parfois appelés « modèles de fondation ». Ces grands modèles ont permis de réduire les coûts et la main-d'œuvre liés à l'automatisation.
Les modèles de fondation constituent une base puissante et polyvalente pour de nombreuses applications d’IA. Nous pouvons utiliser les modèles de fondation pour effectuer rapidement des tâches avec peu de données annotées et d’effort. Dans certains cas, il nous suffit de décrire la tâche à accomplir pour inciter le modèle à la résoudre.
Mais ces technologies puissantes introduisent également de nouveaux risques et défis pour les entreprises. De nombreux modèles actuels sont formés sur des jeux de données dont la qualité et la provenance sont inconnues, ce qui entraîne des réponses offensantes, biaisées ou factuellement incorrectes. Les plus grands modèles sont coûteux, énergivores à entraîner et à faire fonctionner, et complexes à déployer.
Chez IBM, nous avons développé une approche qui répond aux défis fondamentaux liés à l’utilisation des modèles de fondation pour l’entreprise. Aujourd’hui, nous avons annoncé watsonx.ai, la passerelle d’IBM vers les outils et technologies d’IA désormais disponibles sur le marché. Pour témoigner de la rapidité avec laquelle le domaine évolue, certains outils ne datent que de quelques semaines, et nous en ajoutons de nouveaux au fur et à mesure que j’écris.
Le contenu de watsonx.ai - qui fait partie des offres watsonx d'IBM annoncées cette semaine - est varié et continuera d'évoluer, mais notre promesse principale reste la même : fournir des produits d'automatisation sûrs et prêts pour l'entreprise.
Cela fait partie de notre travail continu chez IBM pour accélérer le parcours de nos clients afin qu'ils tirent de la valeur de ce nouveau paradigme de l'IA. Je vais décrire ici notre travail visant à créer une suite de modèles de fondation dédiés aux entreprises et formés par IBM, y compris notre approche des architectures de données et de modèles. Je vous présenterai également notre nouveau portefeuille et nos nouveaux outils qui permettent aux entreprises de construire et de déployer des solutions basées sur des modèles de fondation en utilisant un large catalogue de modèles open source, en plus des nôtres.
La qualité des données compte. Un modèle d’IA entraîné sur des données biaisées ou toxiques aura naturellement tendance à produire des sorties biaisées ou toxiques. Ce problème est aggravé à l’ère des modèles de fondation, où les données utilisées pour entraîner des modèles proviennent généralement de nombreuses sources et sont si abondantes qu’aucun être humain ne peut raisonnablement les passer au crible.
Les données étant le carburant des modèles de fondation, IBM s’est concentré sur l'organisation méticuleuse de tout ce qui entre dans nos modèles. Nous avons développé des outils d'IA pour filtrer de manière agressive nos données afin d'éviter les propos haineux et blasphématoires, les restrictions de licence et les préjugés. Lorsque des données indésirables sont identifiées, nous les supprimons, entraînons à nouveau le modèle et répétons l'opération.
La curation des données est une tâche qui n'est jamais vraiment terminée. Nous continuons à développer et à affiner de nouvelles méthodes pour améliorer la qualité des données et les contrôles, afin de répondre à un ensemble d'exigences légales et réglementaires en constante évolution. Nous avons mis en place un cadre des exigences pour suivre les données brutes qui ont été nettoyées, les méthodes qui ont été utilisées et les modèles que chaque point de données a touchés.
Nous Continuer à collecter des données de haute qualité pour contribuer à relever certains des défis commerciaux les plus urgents dans divers domaines tels que la finance, le droit, la cybersécurité et la durabilité. Nous visons actuellement plus d'un téraoctet de texte organisé pour l'entraînement de nos modèles de fondation, tout en ajoutant du code logiciel organisé, des données de satellite et des données et journaux d'événements de réseau informatique.
IBM Research développe également des techniques pour intégrer la confiance tout au long du cycle de vie du modèle de fondation, afin d’atténuer les biais et d’améliorer la sécurité des modèles. Notre travail dans ce domaine inclut FairIJ, qui identifie les points de données biaisés dans les données utilisées pour régler un modèle, afin de pouvoir les modifier. D’autres méthodes, comme la reprogrammation de l’équité, nous permettent d’atténuer les biais d’un modèle même après son entraînement.
Le nouveau studio watsonx.ai d’IBM propose une suite de modèles de fondation conçus pour créer de la valeur pour l’entreprise. Ils ont été intégrés à une gamme de produits IBM qui seront mis à la disposition des clients IBM dans les prochains mois.
Conscients qu’un même modèle ne convient pas à tous, nous créons une famille de modèles de fondation de langage et de code de tailles et d’architectures variées. Chaque famille de modèles porte un nom de code à thème géologique (Granite, Sandstone, Obsidian, et Slate) et rassemble des innovations de pointe issues de l’équipe IBM Research et de la communauté de recherche ouverte. Chaque modèle peut être personnalisé pour gérer une série de tâches d’entreprise.
Nos modèles Granite s’appuient sur une architecture de type GPT basée sur un décodeur uniquement pour les tâches génératives. Les modèles Sandstone utilisent une architecture encodeur-décodeur et sont bien adaptés à un affinage sur des tâches spécifiques, interchangeables avec les modèles T5 populaires de Google. Les modèlesObsidian utilisent une nouvelle architecture modulaire développée par IBM Research, offrant une grande efficacité d’inférence et des niveaux de performance élevés pour toute une variété de tâches. Slate fait référence à une famille de modèles encodeurs uniquement (basés sur RoBERTa), qui, bien que non génératifs, sont rapides et efficaces pour de nombreuses tâches de NLP d’entreprise. Tous les modèles watsonx.ai sont entraînés sur le data lake organisé et axé sur l’entreprise d’IBM, sur notre supercalculateur d’IA cloud natif conçu sur mesure, Vela.
L'efficacité et la durabilité sont les principes de conception fondamentaux de watsonx.ai. Chez IBM recherche, nous avons inventé de nouvelles technologies pour un entraînement efficace des modèles, notamment notre algorithme « LiGO » qui recycle les petits modèles et les « développe » en modèles plus grands. Cette méthode permet d'économiser entre 40 % et 70 % du temps, du coût et de la production de carbone nécessaires pour entraîner un modèle. Pour améliorer les vitesses d'inférence, nous tirons parti de notre expertise approfondie en matière de quantification, ou nous réduisons les modèles, passant de l'arithmétique à 32 virgules flottantes à des formats de bits entiers beaucoup plus petits. La réduction de la précision des modèles IA apporte des avantages en termes d’efficacité, sans sacrifier la précision. Nous espérons pouvoir bientôt faire fonctionner ces modèles compressés sur notre puce optimisée pour l'IA, l'IBM AIU.
La dernière pièce du puzzle du modèle de fondation ? La conception d’un logiciel facile à utiliser pour le réglage et le déploiement des modèles. La pile d’inférence hybride et cloud native d’IBM, construite sur RedHat OpenShift, a été optimisée pour l’entraînement et la livraison de modèles de fondation. Les entreprises peuvent tirer parti de la flexibilité d’OpenShift pour exécuter des modèles depuis n’importe où, y compris sur site.
Nous avons créé une suite d'outils dans watsonx.ai qui fournit aux clients une interface utilisateur conviviale et des bibliothèques adaptées aux développeurs pour créer des solutions basées sur des modèles de fondation. Notre Prompt Lab permet aux utilisateurs d'effectuer rapidement des tâches d'IA à l'aide de quelques exemples étiquetés. Le Studio Tuning permet une personnalisation rapide et robuste du modèle à partir de vos propres données, basée sur des techniques de fine tuning efficientes et de pointe développées par IBM recherche
En plus des propres modèles d’IBM, watsonx.ai offre un accès fluide à un large catalogue de modèles open source, permettant aux entreprises de les tester et de rapidement les améliorer. Grâce à un nouveau partenariat avec Hugging Face, IBM proposera des milliers de modèles de fondation, jeux de données et bibliothèques Hugging Face open source dans watsonx.ai. Hugging Face, à son tour, proposera tous les modèles et outils exclusifs et en accès libre d’IBM sur watsonx.ai.
Pour essayer un nouveau modèle, il suffit de le sélectionner dans un menu déroulant. Vous pouvez en savoir plus sur le studio ici.
Les modèles de fondation modifient le paysage de l’IA, et ces dernières années, les progrès n’ont fait que s’accélérer. Chez IBM, nous sommes ravis de contribuer à tracer les frontières de ce domaine en évolution rapide et de traduire l’innovation en valeur réelle pour l’entreprise.
