Avec une approche API uniforme utilisant une API compatible avec OpenAI, les entreprises peuvent passer d’un modèle à l’autre de façon fluide sans avoir à procéder à une reconfiguration coûteuse.

Dans le cadre de notre mission visant à offrir à nos utilisateurs davantage d’options pour la mise à disposition des modèles de fondation, watsonx.ai Model Gateway se connecte également à Cerebras, l’un des principaux fournisseurs d’inférence rapide qui utilise ses propres puces à l’échelle de la plaquette.

« Nous sommes ravis d’apporter les capacités record d’inférence d’IA de Cerebras à watsonx.ai Model Gateway d’IBM », a déclaré Alan Chhabra, vice-président exécutif, Worldwide Partners, de Cerebras. Cette collaboration répond directement à la demande croissante de performance en IA, permettant aux entreprises de déployer de façon fluide des modèles de fondation puissants pour le raisonnement avancé et l’IA agentique, sans latence. C’est une véritable révolution pour les entreprises qui cherchent à opérationnaliser leurs initiatives les plus ambitieuses en matière d’IA à grande échelle.

Nous sommes ravis de partager cette fonctionnalité avec vous et nous attendons avec impatience vos retours afin de continuer à l’améliorer.