Université du Queensland
Des informations disponibles plus rapidement grâce à un stockage de données haute performance pour la recherche basée sur l’IA
En savoir plus
Deux personnes analysant des données sur une tablette

Etablissement de recherche de classe mondiale, l’Université du Queensland (UQ) cherchait à simplifier la capture, le stockage, l’analyse et la gestion des données pour son environnement informatique haute performance (HPC). En collaborant avec le partenaire commercial d’IBM, Sundata, l’université a développé une data fabric unifiée avec le logiciel IBM Spectrum Scale, accélérant considérablement les workloads contenant beaucoup d’images et d’IA.

Défi

Pour accélérer la collaboration dans le domaine de la recherche, notamment pour les projets complexes pilotés par l’IA, UQ avait besoin d’une solution de stockage prenant en charge des centaines de téraoctets de données générées quotidiennement.

Transformation

UQ a créé une data fabric haute performance optimisée et gérée de manière centralisée avec IBM Spectrum Scale, ajoutant récemment une solution IBM Elastic Storage System (ESS) pour prendre en charge son environnement HPC le plus rapide.

Résultats 2 heures pour obtenir un ROI sur le stockage défini par logiciel
permettant aux chercheurs de gagner des centaines d’heures de traitement par semaine
Exécution environ 74 % plus rapide dans l’analyse de l’imagerie médicale
permettant d’accélérer le délai de découverte des recherches critiques
Augmentation exponentielle des volumes de données
soutenue par une structure de stockage hautement évolutive et rentable
Description du défi
A l’avant-garde de la recherche UQ pilotée par l’IA

Comment utiliser les technologies à ultrasons pour que les anticorps thérapeutiques puissent franchir la barrière hémato-encéphalique et ralentir la maladie d’Alzheimer ? Que peuvent nous apprendre les circuits neuronaux des drosophiles dans la conception des mouvements robotiques ? Pourquoi l’inflammation cellulaire conduit-elle au cancer et comment pouvons-nous en savoir plus en imagerie des cellules vivantes à l’échelle nanométrique et en temps réel ? Au sein de l’UQ, des chercheurs créatifs s’attaquent à ces questions et à d’autres thématiques complexes, ce qui conduit souvent à des découvertes qui peuvent changer le monde et la vie des gens.

Les équipes de recherche qui se consacrent à ces questions utilisent l’ordinateur accéléré par GPU le plus rapide de l’université pour mener à bien leurs travaux de pointe. Spécialement conçu pour les workloads scientifiques et d’IA intensives, ce superordinateur, ainsi que d’autres systèmes HPC de l’université, ont besoin d’un stockage de données extrêmement rapide, évolutif et flexible, à tout moment et en tout lieu.

Pour accélérer le processus d’intégration des informations, le Research Computing Centre (RCC) de UQ cherchait à déployer une stratégie de stockage uniforme et haute performance, ainsi qu’une architecture pour prendre en charge et gérer efficacement la capture et l’analyse des données à l’échelle de l’université.

Le RCC souhaitait une solution capable non seulement de s’adapter à la croissance exponentielle du volume, de la vitesse et de la variété des données, mais aussi de fournir un accès rapide aux données. Les chercheurs de l’Université génèrent des données structurées et non structurées à l’aide d’une variété de systèmes informatiques (des ordinateurs de bureau aux clusters HPC) et d’une vaste gamme d’instruments scientifiques, tels que des scanners IRM, des microscopes optiques et des séquenceurs d’ADN, explique le professeur David Abramson, directeur du RCC. « Notre paradigme en matière de données consiste à en conserver une copie logique, puis à la restituer de différentes manières, en rendant les données disponibles quand un chercheur en a besoin, là où il en a besoin », ajoute-t-il. Tout en évaluant les solutions potentielles, le RCC a également recherché des technologies qui pourraient s’adapter aux besoins de l’Université à long terme.

Grâce à la solution ESS, nous obtenons tous les avantages d’un système de fichiers parallèles à grande vitesse à l’intérieur d’un superordinateur avec la transparence de gestion des données fournie par AFM et d’autres fonctionnalités d’IBM Spectrum Scale. Jake Carroll Directeur de la technologie, Research Computing Centre Université du Queensland
Description de la transformation
Stockage HPC avec accès à la demande

Le RCC a créé une structure de stockage de données hautes performances connue sous le nom de MeDiCi (Metropolitan Data Caching Infrastructure), alimentée et gérée de manière centralisée par IBM Spectrum Scale. « Pour favoriser l’innovation, les chercheurs doivent pouvoir effectuer des recherches de haute qualité de manière opportune, évolutive et contraignante, en tirant parti d’une infrastructure informatique de recherche de pointe. Notre partenariat avec IBM aide à répondre à ces besoins », explique Jake Carroll, directeur de la technologie, Research Computing Centre au sein de UQ. « Avec MeDiCI, les chercheurs et les étudiants de l’Université et d’autres instituts internationaux peuvent travailler de façon fluide avec les données stockées sur n’importe quel cluster de calcul. »

« Lorsque les chercheurs travaillent, ils voient toutes leurs données. Ils ne se rendent pas compte qu’ils se déplacent sur des fils optiques à une vitesse éclair à partir d’un centre de données distant », explique M. Abramson.

De plus, l’écosystème MeDiCI prend en charge une variété de plateformes, d’instruments et de données. « Le logiciel IBM Spectrum Scale nous permet d’unifier tous nos silos de sources de stockage en une infrastructure de stockage intelligente intégrée, puis de restituer les données dans le protocole approprié, ce qui permet une analyse plus rapide et une plus grand efficacité », déclare M. Abramson. MeDiCI capture également automatiquement les métadonnées du projet, y compris les utilisateurs, les instruments et les paramètres de données.

L’équipe RCC continue de faire évoluer l’infrastructure MeDiCI, notamment avec un déploiement récent en tant que solution de stockage pour UQ HPC Wiener (lien externe à ibm.com). L’objectif est de permettre aux chercheurs de faire plus dans la même période de temps grâce à l’augmentation du débit fourni par la plateforme. « Nous avions besoin d’une solution capable de supporter non seulement une bande passante assez importante du point de vue des gigaoctets par seconde, mais aussi une exigence d’IOPS très élevée pour prendre en charge des quantités massives de données provenant simultanément de systèmes de disques et de stockage flash, à un rythme sans précédent », explique M. Carroll.

« Nous voulions [une plateforme matérielle avec] IBM Spectrum Scale parce que ses fonctionnalités sont assez exceptionnelles », explique M. Carroll. « Avec la solution ESS, nous bénéficions de tous les avantages d’un système de fichiers parallèle à grande vitesse à l’intérieur d’un superordinateur avec la transparence de la gestion des données qu’offrent AFM et d’autres fonctionnalités d’IBM Spectrum Scale. Cette intégration s’intègre dans le workflow de nos utilisateurs, et dans les productions scientifiques, le workflow est roi. C’est pourquoi nous tirons parti du stockage défini par logiciel », ajoute-t-il.

Avec la solution ESS, UQ peut prendre en charge des volumes de données massifs avec un débit allant jusqu’à 40 Go et la possibilité d’évoluer vers des exaoctets de stockage, et son modèle de cloud hybride offre un accès rapide aux métadonnées. Avec la fonction de codage d’effacement IBM Spectrum Scale RAID, la solution est conçue pour prendre en charge des niveaux élevés en termes de fiabilité, de disponibilité et de performance de stockage. Combiné à AFM, il permet également au RCC de rationaliser l’accès aux données dans des workflows de projet spécifiques tout en conservant une architecture de stockage unique et commune.

Les équipes techniques d’IBM Systems Lab Services et IBM Systems en Australie ont travaillé avec Sundata et RCC pour déployer rapidement la solution ESS GH14S sur un réseau InfiniBand et l’intégrer à l’architecture informatique MeDiCI de bout en bout. Les équipes ont travaillé de manière cohérente en faisant attention à chaque détail, à chaque étape, dans un délai de mise en œuvre de cinq jours.

Le RCC a récemment mis en place l’offre IBM Storage Insights , la gestion du stockage dans le cloud et la plateforme de support avec analyse prédictive. Elle offre à l’équipe une visibilité plus approfondie et plus cohérente sur l’ensemble de l’infrastructure, ce qui permet d’améliorer les performances grâce à une résolution plus rapide des problèmes.

IBM a récemment placé un nouvel ESS 5000 chez UQ pour des tests et des évaluations approfondis. M. Abramson affirme qu’IBM s’associe à RCC, car il a développé une réputation en termes d’extension des technologies existantes.

« Nous avons déjà fait la preuve d’une grande innovation dans l’application de Spectrum Scale au sein de l’Université. Nous avons été en mesure de fournir des commentaires sur son fonctionnement dans notre environnement et sur les points à améliorer », explique M. Abramson. « Je suis très enthousiaste à l’idée de pouvoir tester l’autre matériel de pointe d’IBM dans nos domaines de recherche les plus exigeants ».

Grâce à la solution ESS, nous obtenons tous les avantages d’un système de fichiers parallèles à grande vitesse à l’intérieur d’un superordinateur avec la transparence de gestion des données fournie par AFM et d’autres fonctionnalités d’IBM Spectrum Scale. Cette intégration s’intègre dans le workflow de nos utilisateurs, et dans les productions scientifiques, le workflow est roi. C’est pourquoi nous tirons parti du stockage défini par logiciel. Jake Carroll Directeur de la technologie, Research Computing Centre Université du Queensland
Description des résultats
Des délais de découverte plus rapides

Avec une data fabric uniforme dotée des technologies IBM Spectrum Scale telles que la gestion active des fichiers (AFM) pour accéder aux fichiers de l’Université, le RCC peut optimiser le temps et les ressources universitaires des chercheurs tout en centralisant la gestion des données et en contrôlant les coûts informatiques. Au sein d’UQ, les chercheurs disposent désormais de capacités complètes de calcul et de stockage pour prendre en charge la création d’énormes quantités de données à grande échelle et exécuter des workloads complexes.

Grâce à la bande passante étendue et aux IOPS disponibles sur l’appareil ESS, les équipes de recherche qui s’appuient sur le système Wiener HPC peuvent traiter les données à des vitesses sans précédent. « Le machine learning et l’IA sont au premier plan avec l’ESS GH14S qui permet d’utiliser les GPU de notre superordinateur, ce qui permet aux chercheurs d’en faire plus dans le même laps de temps et de réduire les délais de découverte », déclare M. Carroll. En fait, le nouveau réseau de stockage a généré un ROI en seulement deux heures, grâce à des améliorations de performances qui permettent aux chercheurs en imagerie médicale d’UQ d’économiser des centaines d’heures de traitement par semaine.

Au Queensland Brain Institute (QBI) de l’UQ, par exemple, les neuroscientifiques qui étudient la maladie d’Alzheimer ont réduit d’environ 74 % le temps nécessaire à l’exécution du workload de leur projet, connu sous le nom d’analyse par éléments finis, réduisant le temps d’exécution à 18,72 heures. Grâce à une meilleure compréhension de la distribution des ondes ultrasonores sur le crâne humain, les chercheurs peuvent développer la technologie nécessaire pour franchir la barrière hémato-encéphalique afin d’administrer des médicaments. « C’est une initiative très complexe, et elle a besoin d’une énorme quantité de puissance de calcul et de stockage », assure M. Carroll.

Dans un autre cas, le QBI et d’autres chercheurs examinant des circuits neuronaux des drosophiles ont développé des méthodes génétiques pour étiqueter et manipuler des types de neurones individuels. Grâce à Wiener, ils peuvent traiter rapidement des téraoctets de vidéos à haute vitesse des petits insectes en mouvement, en mesurant les mouvements précis des antennes, de l’abdomen et des articulations des six pattes. Grâce à de nouvelles informations sur le rôle de chaque neurone, ils peuvent mieux comprendre les principes régissant les tâches motrices complexes, telles que la marche et le vol.

Au sein de l’Institute for Molecular Bioscience d’UQ, les chercheurs qui étudient l’inflammation cellulaire utilisent la microscopie à réseau de feuilles de lumière pour capturer des images 4D à haute résolution de processus cellulaires vivants. Observées à l’aide d’un processus de modélisation mathématique connu sous le nom de microscopie à déconvolution, les images fournissent un aperçu sans précédent, en temps réel, de la manière dont le cancer se forme. La solution de stockage Wiener aide à rendre cela possible, notamment en réduisant le temps de déconvolution de plus de 70 %. Le RCC a permis aux chercheurs d’économiser plus de temps en créant un portail convivial pour rationaliser les tâches de déconvolution.

« Nous devons fournir la meilleure infrastructure possible pour soutenir un vaste éventail d’efforts de recherche. Compte tenu de la croissance exponentielle des données, nous devons également réaliser des économies d’échelle », déclare Jack Carroll. « IBM et Sundata contribuent à rendre cela possible. » 

Logo de l’Université du Queensland en Australie avec blason violet
Université du Queensland

Depuis plus d’un siècle, l’Université du Queensland (UQ) (lien externe à ibm.com) jouit d’une réputation mondiale de leader en matière d’enseignement pour un monde meilleur. Les classements les plus prestigieux et les plus reconnus des universités mondiales placent régulièrement UQ parmi les meilleures universités du monde. UQ a également remporté plus de prix nationaux d’enseignement que toute autre université australienne. Cet engagement en faveur d’un enseignement de qualité permet à nos 53 600 étudiants actuels, qui étudient sur les trois campus de UQ, d’agir positivement en faveur de la société. Sous l’égide d’une communauté de recherche interdisciplinaire composée de plus de 1 500 chercheurs répartis dans nos six facultés, huit instituts de recherche et plus de 100 centres de recherche, notre recherche a un impact international.

Passez à l’étape suivante

Pour en savoir plus sur les solutions IBM Storage, contactez votre interlocuteur IBM habituel ou votre partenaire commercial IBM, ou rendez-vous sur le site Web suivant : ibm.com/storage

A propos de Sundata

Fondée en 1986, le partenaire commercial d’IBM, Sundata, aide les entreprises, les gouvernements et les établissements d’enseignement à aligner leur stratégie commerciale sur la technologie. Intégrateur de systèmes de taille moyenne et revendeur basé à Brisbane, l’entreprise fournit un large éventail de services de planification, d’installation, de support et de financement.

Vous trouverez d’autres études de cas ici Centre d’excellence IBM@UQ
Mentions légales

© Copyright IBM Corporation 2020. IBM Corporation, IBM Systems Hardware, New Orchard Road, Armonk, NY 10504. 
Produit aux Etats-Unis d’Amérique, octobre 2020.

IBM, le logo IBM, ibm.com, IBM Elastic Storage et IBM Spectrum sont des marques d’International Business Machines Corp., déposées dans de nombreux pays. Les autres noms de produits et de services peuvent être des marques d’IBM ou d’autres sociétés. La liste actualisée des marques d’IBM est disponible sur la page web « Copyright and trademark information » à l’adresse www.ibm.com/fr-fr/legal/copytrade.shtml.

Les informations contenues dans le présent document étaient à jour à la date de sa publication initiale. Elles peuvent être modifiées sans préavis par IBM. Les partenaires commerciaux IBM fixent leurs propres prix, lesquels sont susceptibles de varier. Les offres mentionnées dans le présent document ne sont pas toutes disponibles dans tous les pays où la société IBM est présente.

Les données de performance et les exemples de clients cités sont présentés à titre informatif uniquement. Les résultats des performances peuvent varier en fonction des configurations et des conditions de fonctionnement. Il incombe à l'utilisateur d'évaluer et de vérifier le fonctionnement de tout autre produit ou programme avec les produits et programmes IBM. LES INFORMATIONS CONTENUES DANS LE PRÉSENT DOCUMENT SONT FOURNIES « EN L’ÉTAT », SANS AUCUNE GARANTIE EXPLICITE OU IMPLICITE, NOTAMMENT SANS AUCUNE GARANTIE DE QUALITÉ MARCHANDE, D’ADÉQUATION À UN USAGE PARTICULIER ET AUCUNE GARANTIE OU CONDITION D’ABSENCE DE CONTREFAÇON. Les produits IBM sont garantis conformément aux dispositions des contrats qui régissent leur utilisation.

La capacité de stockage réelle disponible peut être signalée à la fois pour les données non compressées et compressées, peut varier ou être inférieure à celle indiquée.

Remarque : l’image de l’espace principal dans l’étude de cas est une photo d’archive.