Les chercheurs de Harvard ont surmonté les limites de leur infrastructure avec l’aide d’IBM
À la pointe de la recherche responsable sur l’IA, le Calmon Lab de la Harvard John A. Paulson School of Engineering and Applied Sciences s’est attaqué à l’un des défis les plus urgents dans le domaine de l’IA, à savoir mettre en adéquation les grands modèles de langage (LLM) avec les valeurs humaines et les normes de sécurité. Ces travaux visaient à améliorer les performances du raisonnement en chaîne de pensée dans les modèles couramment utilisés, tels que DeepSeek-R1 et Llama, en appliquant des méthodes d’alignement au moment de l’inférence.
Cependant, leur progression a été ralentie par les contraintes liées à l’infrastructure. Le cluster de Harvard s’est retrouvé submergé par la demande, l’exécution de modèles de pointe nécessitant l’accès à plusieurs GPU NVIDIA H100. Ces retards ont considérablement limité la capacité des chercheurs à mener des expériences sur des modèles de grande taille, ralentissant ainsi le rythme global de leurs travaux.
Exécution d’inférences à des vitesses supérieures à 2 000 tokens par seconde
Entraînement et déploiement des LLM sans temps d’attente
Le Calmon Lab a alors fait appel à IBM afin de surmonter ces contraintes d’infrastructure. Grâce à IBM® Cloud, il a pu se procurer deux serveurs NVIDIA HGX H100 8-GPU, au sein d’un cloud privé virtuel sécurisé, chaque serveur étant équipé de 640 Go de mémoire GPU et de 2 To de mémoire physique. La configuration comprenait un stockage en blocs avec un nombre élevé d’opérations d’entrée/sortie par seconde, un partage de fichiers réseau rapide et IBM Cloud Object Storage pour un transfert de données fluide.
Grâce à Red Hat Enterprise Linux 9, à la plateforme Anaconda et au grand modèle de langage virtuel (vLLM) pour la mise en service des modèles, le laboratoire a pu passer rapidement à un environnement hautement performant. En moins d’une semaine, l’équipe effectuait des inférences à plus de 2 000 tokens par seconde et entraînait des modèles sans délai. Cette transformation lui a permis de repousser les limites de la sécurité de l’IA, notamment en identifiant les chemins de raisonnement non productifs et en affinant les techniques d’alignement des modèles.
À la suite de cette transformation, le Calmon Lab a constaté une amélioration significative de la vitesse des travaux de recherche grâce à l’accès à une infrastructure GPU fiable et facile à utiliser sur IBM Cloud. Le laboratoire a pu :
IBM continue de soutenir la mission du laboratoire en fournissant une infrastructure évolutive, sécurisée et à haute performance, ce qui donne les moyens aux chercheurs de repousser les limites de l'IA digne de confiance.
Harvard , située à Cambridge, dans le Massachusetts, est une prestigieuse université de l'Ivy League fondée en 1636. Ils sont réputés pour leur excellence universitaire et leurs vastes contributions dans divers domaines, y compris l'éducation, la recherche et la culture. Harvard sert un corps étudiant diversifié et offre un large éventail de programmes dans ses 12 écoles qui octroient des diplômes. Cette université estimée est toujours classée parmi les meilleures universités au monde, ce qui reflète son influence et ses ressources importantes.
© Copyright IBM Corporation 2025. IBM, le logo IBM, Granite, watsonx.ai watsonx.datawatsonx.governance et watsonx Orchestrate sont des marques IBM Corp. déposées dans de nombreux pays.
Exemples donnés à titre indicatif uniquement. Les résultats dépendent des configurations et des conditions du client et ne peuvent donc être généralisés.