Università del Queensland
Tempi di insight più rapidi con data storage ad alte prestazioni per la ricerca sull'AI
Scopri di più
Due persone analizzano i dati su un tablet

Un istituto di ricerca di eccellenza, l'Università del Queensland (UQ) ha cercato di semplificare l'acquisizione, l'archiviazione, l'analisi e la gestione dei dati per il proprio ambiente di elaborazione ad alte prestazioni (HPC). Collaborando con il Business Partner IBM Sundata, l'Università del Queensland ha sviluppato un data fabric unificato con il software IBM® Spectrum® Scale, accelerando in modo significativo i workload ad uso intensivo di immagini e AI.

Sfida di business

Per velocizzare la collaborazione di ricerca, anche per progetti complessi basati sull'AI, l'Università del Queensland aveva bisogno di una soluzione di storage che supportasse centinaia di terabyte di dati generati quotidianamente.

Trasformazione

L'Università del Queensland ha creato un data fabric ad alte prestazioni supportato e gestito centralmente con IBM Spectrum Scale, aggiungendo di recente una soluzione IBM Elastic Storage System (ESS) per supportare il suo ambiente HPC più veloce.

Risultati 2 ore per ottenere il ROI sullo storage software-defined
che consente ai ricercatori di risparmiare centinaia di ore di elaborazione a settimana
tempi di esecuzione ~74% più veloci per l'analisi di imaging medico
accelerazione dei tempi di scoperta per la ricerca critica
Aumento esponenziale dei volumi di dati
supportato da una struttura di storage altamente scalabile e conveniente
Storia di una sfida aziendale
In prima linea nella ricerca basata sull'AI dell'Università del Queensland

Come possiamo utilizzare le tecnologie a ultrasuoni in modo che gli anticorpi terapeutici possano superare la barriera emato-encefalica e contrastare il morbo di Alzheimer? Cosa possono insegnarci i circuiti neurali dei moscerini della frutta sulla progettazione dei movimenti robotici? Perché l'infiammazione cellulare porta al cancro e come possiamo saperne di più immaginando cellule vive su scala nanometrica in tempo reale? In tutta l'Università del Queensland, i ricercatori creativi affrontano queste e altre domande difficili, spesso arrivando a scoperte che possono cambiare il mondo e la vita delle persone.

I team di ricerca che si occupano di queste tematiche si affidano al computer più veloce dell'Università con accelerazione GPU per svolgere il loro lavoro all'avanguardia. Progettato specificamente per workload scientifici e di AI ad alta intensità di imaging, questo supercomputer, insieme ad altri sistemi HPC dell'Università, necessita di un data storage estremamente veloce, scalabile e flessibile disponibile sempre e ovunque.

Per creare un percorso più rapido dall'inserimento agli insight, il Research Computing Centre (RCC) presso l'Università del Queensland ha tentato di implementare una strategia di storage uniforme e ad alte prestazioni e un'architettura in grado di supportare e gestire efficacemente l'acquisizione e l'analisi dei dati a livello universitario.

L'RCC desiderava una soluzione che non solo potesse soddisfare la crescita esponenziale del volume, della velocità e della varietà dei dati, ma che fornisse anche un rapido accesso ai dati. I ricercatori dell'Università generano dati strutturati e non strutturati utilizzando una varietà di sistemi informatici – dai desktop ai cluster HPC – e da una vasta gamma di strumenti scientifici, come scanner MRI, microscopi ottici e sequenziatori di DNA, spiega David Abramson, Director presso la RCC. "Il nostro paradigma sui dati è quello di conservarne una copia logica e poi riproporla in molti modi diversi, rendendo i dati disponibili quando un ricercatore ne ha bisogno e dove ne ha bisogno," afferma. Nel valutare le potenziali soluzioni, l'RCC ha cercato anche tecnologie che potessero espandersi in linea alle esigenze future dell'Università.

Con la soluzione ESS, otteniamo tutti i benefici di un file system parallelo ad alta velocità all'interno di un supercomputer con la trasparenza della gestione dei dati fornita da AFM e da altre funzionalità di IBM Spectrum Scale. Jake Carroll Chief Technology Officer, Research Computing Centre Università del Queensland
Storia della trasformazione
Storage HPC con accesso on-demand

L'RCC ha creato un data storage fabric ad alte prestazioni noto come MeDiCI (Metropolitan Data Caching Infrastructure), supportato e gestito centralmente con IBM Spectrum Scale. "Per promuovere l'innovazione, i ricercatori devono essere in grado di intraprendere ricerche di alta qualità in modo tempestivo, scalabile e senza limiti, sfruttando un'infrastruttura informatica di ricerca all'avanguardia. La nostra partnership con IBM aiuta a soddisfare queste esigenze," spiega Jake Carroll, Chief Technology Officer, Research Computing Center presso UQ. "Con MeDiCI, ricercatori e studenti di tutta l'Università e di altri istituti internazionali possono lavorare senza soluzione di continuità con i dati memorizzati su qualsiasi cluster di calcolo dell'Università del Queensland e collaborare."

"Quando i ricercatori si mettono a lavorare, vedono tutti i loro dati. Non si rendono conto che in realtà tutto si sta muovendo su cavi ottici a velocità cieca da un data center remoto”, afferma Abramson.

Inoltre, l'ecosistema MeDiCI supporta una varietà di piattaforme, strumenti e dati. "Il software IBM Spectrum Scale ci consente di unificare tutti i nostri diversi silo di fonti di storage in un'unica infrastruttura di storage integrata e intelligente e quindi restituire i dati in un qualsiasi protocollo appropriato, ottenendo analisi più rapide e una maggiore utilità delle risorse," afferma Abramson. MeDiCI acquisisce automaticamente anche i metadati del progetto, inclusi utenti, strumenti e parametri di dati.

Il team RCC continua a far evolvere l'infrastruttura MeDiCI, implementandola di recente come soluzione di storage per UQ HPC Wiener (link esterno a ibm.com). L'obiettivo è quello di consentire ai ricercatori di fare di più nello stesso intervallo di tempo, grazie alla maggiore produttività offerta dalla piattaforma. "Avevamo bisogno di una soluzione in grado di sostenere non solo una larghezza di banda piuttosto consistente dal punto di vista dei gigabyte al secondo, ma anche un requisito IOPS molto elevato per supportare elevate quantità di dati provenienti contemporaneamente da sistemi a disco e da flash storage a una velocità senza precedenti," spiega Carroll.

"Volevamo [una piattaforma hardware con] IBM Spectrum Scale perché la sua funzionalità è quasi unica," spiega Carroll. "Con la soluzione ESS, usufruiamo di tutti i benefici di un file system parallelo ad alta velocità all'interno di un supercomputer con la trasparenza nella gestione dei dati fornita da AFM e altre funzionalità IBM Spectrum Scale. Tale integrazione si adatta al workflow dei nostri utenti e, nei risultati scientifici, il workflow è fondamentale. Ecco perché ci avvaliamo dello storage software-defined," aggiunge.

Con la soluzione ESS, l'Università è in grado di supportare elevati volumi di dati con una velocità effettiva fino a 40 GB e la possibilità di scalare orizzontalmente fino a exabyte di storage, e il suo modello di cloud ibrido fornisce un rapido accesso ai metadati. Con la funzione di codifica di cancellazione IBM Spectrum Scale RAID, la soluzione è progettata per supportare elevati livelli di affidabilità, disponibilità e prestazioni dello storage. In combinazione con AFM, consente inoltre all'RCC di semplificare l'accesso ai dati nell'ambito di specifici workflow di progetto— pur mantenendo un'unica architettura di archiviazione comune.

I team di vendita tecnica di IBM Systems Lab Services e IBM Systems in Australia hanno collaborato con Sundata e RCC per implementare rapidamente la soluzione ESS GH14S su una rete InfiniBand e integrarla con l'architettura IT MeDiCI end-to-end. I team hanno lavorato in modo coeso e con attenzione ai dettagli in ogni fase, implementando l'array in cinque giorni.

L'RCC ha recentemente implementato l'offerta IBM Storage Insights , la gestione dello storage basata su cloud e la piattaforma di supporto con analisi predittiva. Fornisce al team una visibilità più approfondita e coerente sull'intera infrastruttura, consentendo prestazioni più elevate attraverso una risoluzione dei problemi più rapida.

Recentemente l'Università del Queensland ha ricevuto da IBM un nuovo ESS 5000 per eseguire valutazioni e test approfonditi. Abramson afferma che IBM sta collaborando con RCC in quanto si è affermato nello sviluppo delle tecnologie esistenti.

"Abbiamo già dimostrato un'innovazione significativa nell'applicazione di Spectrum Scale all'Università. Siamo stati in grado di fornire un feedback su quanto funziona bene nel nostro ambiente e su dove può essere migliorato," spiega Abramson. "Sono molto entusiasta di poter testare l'altro hardware all'avanguardia di IBM per le nostre esigenze di ricerca più impegnative."

Con la soluzione ESS, otteniamo tutti i benefici di un file system parallelo ad alta velocità all'interno di un supercomputer con la trasparenza della gestione dei dati fornita da AFM e da altre funzionalità di IBM Spectrum Scale. Questa integrazione si adatta al workflow dei nostri utenti e, negli output scientifici, il workflow è fondamentale. Ecco perché utilizziamo lo storage software-defined. Jake Carroll Chief Technology Officer, Research Computing Centre Università del Queensland
Storia dei risultati
Tempi di scoperta più rapidi

Con un data fabric uniforme dotato di tecnologie IBM Spectrum Scale come la gestione attiva dei file (AFM) per l'accesso ai file in tutta l'università, l'RCC è in grado di ottimizzare i tempi dei ricercatori e le risorse dell'università, centralizzando al contempo la gestione dei dati e controllando i costi IT. Nell'Università, i ricercatori ora dispongono di funzionalità di elaborazione e storage complete per supportare la creazione di enormi quantità di dati su larga scala ed eseguire workload complessi.

Con la larghezza di banda ampliata e l'IOPS disponibile sul dispositivo ESS, i team di ricerca che si affidano al sistema Wiener HPC possono elaborare i dati a velocità senza precedenti. "L'apprendimento automatico e l'AI sono al centro dell'attenzione con l'ESS GH14S che migliora il modo in cui vengono utilizzate le GPU del nostro supercomputer, consentendo ai ricercatori di fare di più nello stesso intervallo di tempo e accelerando i tempi di scoperta," afferma Carroll. In effetti, il nuovo array di storage ha prodotto un ROI in sole due ore, sulla base di miglioramenti delle prestazioni che consentono ai ricercatori di imaging medicale dell'Università di risparmiare centinaia di ore di elaborazione ogni settimana.

Al Queensland Brain Institute (QBI) dell'Università del Queensland, ad esempio, i neuroscienziati che studiano il morbo di Alzheimer hanno ridotto il tempo necessario per eseguire il loro workload di progetto, noto come analisi di elementi finiti, di circa il 74%, riducendo il tempo di esecuzione fino a 18,72 ore. Con una comprensione più approfondita della distribuzione delle onde a ultrasuoni sul cranio umano, i ricercatori possono sviluppare la tecnologia necessaria per superare la barriera emato-encefalica per la somministrazione dei farmaci. "È un'impresa molto complessa e richiede un'enorme quantità di potenza di elaborazione e storage," spiega Carroll.

In un altro caso, QBI e altri ricercatori che esaminavano i circuiti neurali nei moscerini della frutta hanno sviluppato metodi genetici per etichettare e manipolare i singoli tipi di neuroni. Con Wiener, possono elaborare rapidamente terabyte di video ad alta velocità dei minuscoli insetti quando sono in movimento, misurando movimenti precisi delle antenne, dell'addome e delle articolazioni su sei zampe. Con nuove conoscenze sul ruolo di ciascun neurone, possono comprendere meglio i principi che governano compiti motori complessi, come il muoversi e il volare.

All'Institute for Molecular Bioscience dell'Università del Queensland, i ricercatori che studiano l'infiammazione cellulare impiegano la microscopia a fogli leggeri reticolari per acquisire immagini 4D ad alta risoluzione di processi cellulari viventi. Visualizzate utilizzando un processo di modellazione matematica noto come microscopia a deconvoluzione, le immagini forniscono un punto di osservazione senza precedenti e in tempo reale su come si forma il cancro. La soluzione di storage Wiener contribuisce a rendere tutto ciò possibile, riducendo i tempi di deconvoluzione di oltre il 70%. L'RCC ha consentito ai ricercatori di risparmiare ulteriore tempo costruendo un portale di facile utilizzo per semplificare le attività di deconvoluzione.

"Dobbiamo fornire la migliore infrastruttura possibile per supportare un'enorme gamma di attività di ricerca. Data la crescita esponenziale dei dati, dobbiamo anche realizzare economie di scala," afferma Carroll. "IBM e Sundata contribuiscono a rendere possibile tutto ciò." 

Logo della Università del Queensland Australia con stemma in viola
Università del Queensland

Per più di un secolo, l'Università del Queensland (UQ) (link esterno a ibm.com) ha mantenuto una reputazione globale nella leadership nella conoscenza per un mondo migliore. Le classifiche più prestigiose e ampiamente riconosciute delle università mondiali posizionano costantemente l'Università del Queensland tra le migliori università del mondo. L'Università del Queensland ha anche vinto vari premi nazionali per l'insegnamento di qualsiasi altra università australiana. Questo impegno per un insegnamento di qualità consente ai nostri 53.600 studenti attuali, che studiano nei tre campus dell'università, di creare un cambiamento positivo nella società. La nostra ricerca ha un impatto globale, offerto da una comunità di ricerca interdisciplinare di oltre 1500 ricercatori nelle nostre sei facoltà, otto istituti di ricerca e più di 100 centri di ricerca. 

Fasi successive

Per maggiori informazioni sulle soluzioni IBM Storage, contatta il tuo rappresentante IBM o il tuo Business Partner IBM oppure visita il seguente sito Web: ibm.com/storage

Informazioni su Sundata

Fondato nel 1986, il Business Partner IBM Sundata aiuta le aziende, i governi e gli istituti scolastici ad allineare la propria strategia aziendale alla tecnologia. Integratore e rivenditore di sistemi di medie dimensioni con sede a Brisbane, l'azienda fornisce un'ampia gamma di servizi di pianificazione, installazione, supporto e finanziamento.

Trova altri case study qui Centro di eccellenza IBM@UQ
Legale

© Copyright IBM Corporation 2020. IBM Corporation, IBM Systems Hardware, New Orchard Road, Armonk, NY 10504. 
Prodotto negli Stati Uniti, ottobre 2020.

IBM, il logo IBM, ibm.com, IBM Elastic Storage e IBM Spectrum sono marchi di International Business Machines Corp., registrati in diverse giurisdizioni del mondo. Altri nomi di prodotti e servizi potrebbero essere marchi di IBM o di altre società. Un elenco aggiornato dei marchi IBM è disponibile sul web alla pagina "Copyright and trademark information" all’indirizzo www.ibm.com/it-it/legal/copytrade.shtml.

Le informazioni contenute nel presente documento sono aggiornate alla data della prima pubblicazione e possono essere modificate da IBM senza preavviso. I business partner IBM stabiliscono i propri prezzi, che possono variare. Non tutte le offerte sono disponibili in ogni Paese in cui opera IBM.

Gli esempi citati relativi a dati di prestazione e clienti sono presentati unicamente a scopo illustrativo. Gli attuali risultati in termini di performance possono variare a seconda delle specifiche configurazioni e delle condizioni operative. La valutazione e la verifica del funzionamento di qualsiasi altro prodotto o programma con prodotti e programmi IBM sono responsabilità dell’utente. LE INFORMAZIONI RIPORTATE NEL PRESENTE DOCUMENTO SONO DA CONSIDERARSI “NELLO STATO IN CUI SI TROVANO”, SENZA GARANZIE, ESPLICITE O IMPLICITE, IVI INCLUSE GARANZIE DI COMMERCIABILITÀ, DI IDONEITÀ A UN PARTICOLARE SCOPO E GARANZIE O CONDIZIONI DI NON VIOLAZIONE. I prodotti IBM sono coperti da garanzia in accordo con termini e condizioni dei contratti sulla base dei quali vengono forniti.

L'effettiva capacità di archiviazione disponibile può essere segnalata sia per i dati non compressi che per quelli compressi e può variare e potrebbe essere inferiore a quella dichiarata.

Nota: l'immagine dello spazio principale nel case study è una foto d'archivio.