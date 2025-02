PyTorch est devenu très populaire dans l'écosystème de l'IA. Son interface conviviale et ses fonctionnalités puissantes en ont fait le cadre des exigences de choix pour la recherche universitaire et les applications commerciales. PyTorch a joué un rôle crucial dans le développement de l'apprentissage profond en fournissant des outils qui simplifient le processus de création et d'entraînement de modèles complexes. Sa flexibilité permet aux développeurs d’expérimenter différentes architectures et techniques, pour créer des solutions plus innovantes. Des fonctionnalités telles que la différenciation automatique et la manipulation intuitive des tenseurs ont facilité la mise en œuvre d'algorithmes avancés, ce qui a permis d'accélérer les progrès en matière de recherche et d'application.

L’un des domaines les plus importants dans lesquels PyTorch a eu un impact est le développement de grands modèles de langage (LLM). Ces modèles, qui peuvent comprendre et générer un texte semblable à celui d’un humain, ont révolutionné le traitement automatique du langage naturel. Des cadres comme PyTorch ont facilité la création et l'ajustement de ces modèles, permettant aux chercheurs d'explorer de nouvelles architectures et méthodes d'entraînement plus efficacement.

Notamment, un grand nombre des derniers modèles de langage de pointe, y compris ceux développés par les grandes entreprises technologiques, ont été mis en œuvre à l'aide de PyTorch. La capacité du cadre des exigences à gérer de grandes quantités de données et sa prise en charge de l’entraînement distribué ont permis de faire évoluer des modèles qui peuvent comprendre le contexte et les nuances du langage.

Avec IBM Z Accelerated for PyTorch fourni par le biais de la boîte à outils IA pour IBM Z et LinuxONE, nos clients peuvent utiliser les déploiements de modèles PyTorch avec la fiabilité, la disponibilité et l’évolutivité d’IBM Z, ainsi que les capacités d’accélération de l’inférence de Telum sur puce. Cette accélération de l’inférence est transparente pour les clients, car les conteneurs sont conçus pour tirer parti des instructions Neural Network Processing Assist (NNPA) de Telum de manière transparente et automatique.

Les clients peuvent désormais utiliser cette fonctionnalité pour des cas d’utilisation à forte valeur ajoutée tels que la détection des fraudes, le traitement des réclamations, le traitement automatique du langage naturel, la détection d’images, etc. Ces modèles peuvent être déployer au format PyTorch natif ou exportés vers des formats comme ONNX, qui sont hautement optimisés pour l'inférence.

Que les modèles PyTorch soient déployés sur z/OS ou dans un environnement Linux sur IBM Z, la colocation de ces modèles avec les données et les applications essentielles de nos clients leur permet d’obtenir des informations à l’échelle tout en continuant à répondre aux exigences les plus strictes des accords de niveau de service.