Harvard | IBM

L’équipe de recherche de Harvard a été confrontée à des problèmes de performances GPU

À la pointe de la recherche responsable sur l’IA, le Calmon Lab de la Harvard John A. Paulson School of Engineering and Applied Sciences s’est attaqué à l’un des défis les plus urgents dans le domaine de l’IA, à savoir mettre en adéquation les grands modèles de langage (LLM) avec les valeurs humaines et les normes de sécurité. Ces travaux visaient à améliorer les performances du raisonnement en chaîne de pensée dans les modèles couramment utilisés, tels que DeepSeek-R1 et Llama, en appliquant des méthodes d’alignement au moment de l’inférence.

Cependant, leur progression a été ralentie par les contraintes liées à l’infrastructure. Le cluster de Harvard s’est retrouvé submergé par la demande, l’exécution de modèles de pointe nécessitant l’accès à plusieurs GPU NVIDIA H100. Ces retards ont considérablement limité la capacité des chercheurs à mener des expériences sur des modèles de grande taille, ralentissant ainsi le rythme global de leurs travaux.

Plus de 2 000 tokens

par seconde

Exécution d’inférences à des vitesses supérieures à 2 000 tokens par seconde

Aucun temps d’attente

Entraînement et déploiement des LLM sans temps d’attente

Entraînement et expérimentation de modèles à grande vitesse grâce à IBM Cloud

Le Calmon Lab a alors fait appel à IBM afin de surmonter ces contraintes d’infrastructure. Grâce à IBM® Cloud, il a pu se procurer deux serveurs NVIDIA HGX H100 8-GPU, au sein d’un cloud privé virtuel sécurisé, chaque serveur étant équipé de 640 Go de mémoire GPU et de 2 To de mémoire physique. La configuration comprenait un stockage en blocs avec un nombre élevé d’opérations d’entrée/sortie par seconde, un partage de fichiers réseau rapide et IBM Cloud Object Storage pour un transfert de données fluide.

Grâce à Red Hat Enterprise Linux 9, à la plateforme Anaconda et au grand modèle de langage virtuel (vLLM) pour la mise en service des modèles, le laboratoire a pu passer rapidement à un environnement hautement performant. En moins d’une semaine, l’équipe effectuait des inférences à plus de 2 000 tokens par seconde et entraînait des modèles sans délai. Cette transformation lui a permis de repousser les limites de la sécurité de l’IA, notamment en identifiant les chemins de raisonnement non productifs et en affinant les techniques d’alignement des modèles.

Notre équipe de recherche, qui travaille à la pointe de la théorie de l’information et de l’IA générative, a besoin d’une infrastructure informatique de plus en plus puissante. Notre expérience avec IBM Cloud a été remarquable. Les capacités et l’expertise d’IBM nous ont permis d’exécuter rapidement et efficacement des modèles d’IA volumineux nécessitant de grands clusters de GPU. Nos travaux sur la sécurité de l’IA ont ainsi abouti à des résultats inédits en un temps record.

Professeur Flavio du Pin Calmon

Thomas D. Cabot Associate Professor

Harvard School of Engineering and Applied Sciences

Un accès aux informations plus rapide. Un impact plus important sur la sécurité de l’IA.

À la suite de cette transformation, le Calmon Lab a constaté une amélioration significative de la vitesse des travaux de recherche grâce à l’accès à une infrastructure GPU fiable et facile à utiliser sur IBM Cloud. Le laboratoire a pu :

Entraîner et déployer des LLM, tels que DeepSeek et Llama, à la demande, sans aucun temps d’attente.
Exécuter des inférences à des vitesses supérieures à 2 000 tokens par seconde.
Collaborez à grande échelle grâce au stockage partagé et au transfert de données à haute vitesse.
Réaliser de nouvelles avancées dans la recherche en matière de multiplicité des modèles et de sécurité de l’IA.

IBM continue de soutenir la mission du laboratoire en fournissant une infrastructure évolutive, sécurisée et à haute performance, ce qui donne les moyens aux chercheurs de repousser les limites de l'IA digne de confiance.

À propos de Harvard

Harvard , située à Cambridge, dans le Massachusetts, est une prestigieuse université de l'Ivy League fondée en 1636. Ils sont réputés pour leur excellence universitaire et leurs vastes contributions dans divers domaines, y compris l'éducation, la recherche et la culture. Harvard sert un corps étudiant diversifié et offre un large éventail de programmes dans ses 12 écoles qui octroient des diplômes. Cette université estimée est toujours classée parmi les meilleures universités au monde, ce qui reflète son influence et ses ressources importantes.

Composants de la solution

IBM Cloud

Red Hat Enterprise Linux 9

Processeurs graphiques NVIDIA sur IBM Cloud

IBM Cloud Object Storage

Découvrez comment faire évoluer l’IA en toute confiance

Découvrez comment les solutions IBM vous aideront à automatiser l’analyse des données et à améliorer l’engagement des supporters.

En savoir plus sur IBM Cloud

Commencer gratuitement

Mentions légales

© Copyright IBM Corporation 2025. IBM, le logo IBM, Granite, watsonx.ai watsonx.datawatsonx.governance et watsonx Orchestrate sont des marques IBM Corp. déposées dans de nombreux pays.

Exemples donnés à titre indicatif uniquement. Les résultats dépendent des configurations et des conditions du client et ne peuvent donc être généralisés.

Accélérer la recherche sur la sécurité de l’IA grâce à une infrastructure cloud évolutive

Mentions légales