Inicio
Casos de éxito
La Universidad de Queensland
La Universidad de Queensland (UQ), una institución de investigación de categoría mundial, buscaba simplificar la captura, el almacenamiento, el análisis y la gestión de datos para su entorno informático de alto rendimiento (HPC). En colaboración con Sundata, Business Partner de IBM, la Universidad desarrolló una estructura de datos unificada con el software IBM Storage Scale, lo que aceleró significativamente las cargas de trabajo de IA y uso intensivo de imágenes.
Para acelerar la colaboración en la investigación, incluso para proyectos complejos impulsados por IA, UQ necesitaba una solución de almacenamiento que admitiera cientos de terabytes de datos generados diariamente.
UQ creó una estructura de datos de alto rendimiento impulsada y gestionada de forma centralizada con IBM Storage Scale al añadir recientemente una solución IBM Storage Scale System para dar soporte a su entorno HPC más rápido.
¿Cómo podemos utilizar las tecnologías de ultrasonido para que los anticuerpos terapéuticos puedan superar la barrera hematoencefálica y frenar la enfermedad de Alzheimer? ¿Qué pueden enseñarnos los circuitos neuronales de las moscas de la fruta sobre el diseño de movimientos robóticos? ¿Por qué la inflamación celular conduce al cáncer y cómo podemos aprender más mediante la obtención de imágenes de células vivas a tamaño nanométrico en tiempo real? En toda la UQ, investigadores creativos abordan estas y otras cuestiones difíciles, lo que a menudo conduce a descubrimientos que pueden cambiar el mundo y la vida de las personas.
Los equipos de investigación dedicados a estas cuestiones utilizan el ordenador más rápido de la Universidad, acelerado mediante GPU, para llevar a cabo su trabajo de vanguardia. Diseñado específicamente para cargas de trabajo de ciencia e IA que requieren un uso intensivo de imágenes, este superordenador, junto con otros sistemas HPC de la Universidad, necesita un almacenamiento de datos extremadamente rápido, escalable y flexible disponible en cualquier momento y lugar.
Para crear un camino más rápido desde la ingesta hasta la información, el Research Computing Centre (RCC) de UQ buscaba implementar una estrategia y una arquitectura de almacenamiento uniformes y de alto rendimiento para respaldar y gestionar eficazmente la captura y el análisis de datos en toda la universidad.
El RCC quería una solución que no solo pudiera adaptarse al crecimiento exponencial del volumen, la velocidad y la variedad de los datos, sino que también proporcionara un acceso rápido a los datos. Los investigadores de la Universidad generan datos estructurados y no estructurados utilizando una variedad de sistemas informáticos, desde computadoras de escritorio hasta clústeres de HPC, y a partir de una enorme gama de instrumentos científicos, como escáneres de resonancia magnética, microscopios ópticos y secuenciadores de ADN, explica el profesor David Abramson, director del RCC. "Nuestro paradigma en torno a los datos consiste en conservar una copia lógica de los mismos y, a continuación, presentarlos de muchas formas distintas para que estén disponibles cuando un investigador los necesite y donde los necesite", afirma. Al evaluar las posibles soluciones, el RCC también buscó tecnologías que pudieran expandirse en línea con las necesidades de la Universidad en el futuro.
El RCC creó una estructura de almacenamiento de datos de alto rendimiento conocida como MeDiCI (Infraestructura de almacenamiento en caché de datos en caché), impulsada por IBM Storage Scale y gestionada de forma centralizada. "Para que los investigadores impulsen la innovación, deben ser capaces de realizar investigaciones de alta calidad de manera oportuna, escalable y progresiva, aprovechando la infraestructura informática de investigación de vanguardia. Nuestra asociación con IBM ayuda a satisfacer estas necesidades", explica Jake Carroll, director de Tecnología del Centro de Computación de Investigación de la UQ. "Con MeDiCI, los investigadores y estudiantes de toda la Universidad y de otros institutos internacionales pueden trabajar sin problemas con los datos almacenados en cualquier clúster informático de la UQ y colaborar".
"Cuando los investigadores se sientan, ven todos sus datos. No se dan cuenta de que en realidad se está moviendo a través de cables ópticos a velocidad ciega desde un centro de datos remoto”, dice Abramson.
Además, el ecosistema MeDiCI es compatible con una variedad de plataformas, instrumentos y datos. "El software IBM Storage Scale nos permite unificar todos nuestros diferentes silos de fuentes de almacenamiento en una infraestructura de almacenamiento integrada e inteligente y, a continuación, renderizar los datos en cualquier protocolo que sea adecuado, lo que se traduce en una analítica más rápida y una mayor utilidad de los recursos", afirma Abramson. MeDiCI también captura automáticamente los metadatos del proyecto, incluidos los usuarios, los instrumentos y los parámetros de datos.
El equipo del RCC sigue desarrollando la infraestructura MeDiCI y, más recientemente, la ha implementado como solución de almacenamiento para UQ HPC Wiener (enlace externo a ibm.com). El objetivo es que los investigadores puedan hacer más en el mismo tiempo gracias al mayor rendimiento que proporciona la plataforma. "Necesitábamos una solución que no sólo pudiera soportar un ancho de banda bastante considerable desde el punto de vista de gigabytes por segundo, sino también un requisito de IOPS muy alto para soportar cantidades masivas de datos procedentes de sistemas de disco y almacenamiento flash simultáneamente a un ritmo sin precedentes", explica Carroll.
"Queríamos [una plataforma de hardware con] IBM Storage Scale porque su funcionalidad es bastante única", explica Carroll. “Con la solución IBM Storage Scale System, obtenemos todos los beneficios de un sistema de archivos paralelo de alta velocidad dentro de un superordenador con la transparencia de gestión de datos que brindan AFM y otras funciones de IBM Storage Scale. Esa integración se adapta al flujo de trabajo de nuestros usuarios y, en los resultados científicos, el flujo de trabajo es fundamental. Por eso aprovechamos el almacenamiento definido por software”, añade.
Con la solución IBM Storage Scale System, UQ puede soportar volúmenes masivos de datos con hasta 40 GB de rendimiento y la capacidad de escalar a exabytes de almacenamiento, y su modelo de nube híbrida proporciona un acceso rápido a los metadatos. Con la función de codificación de IBM Storage Scale, la solución está diseñada para admitir altos niveles de fiabilidad, disponibilidad y rendimiento de almacenamiento. Combinado con AFM, también permite al RCC agilizar el acceso a los datos dentro de flujos de trabajo de proyectos específicos, manteniendo al mismo tiempo una arquitectura de almacenamiento única y común.
Los equipos técnicos de ventas de IBM Systems Lab Services e IBM Systems en Australia trabajaron con Sundata y RCC para implementar rápido la solución IBM Storage Scale System GH14S en una red InfiniBand e integrarla con la arquitectura MeDiCI integral. Los equipos trabajaron de forma cohesiva y prestaron atención a los detalles en cada etapa, implementando la matriz en cinco días.
El RCC ha implementado recientemente la oferta de IBM Storage Insights , la gestión del almacenamiento basado en la nube y la plataforma de soporte con análisis predictivos. Proporciona al equipo una visibilidad más profunda y coherente en toda la infraestructura, lo que permite un mayor rendimiento mediante una resolución de problemas más rápida.
IBM ha instalado recientemente un nuevo IBM Storage Scale System 5000 en la UQ para someterlo a pruebas y evaluaciones exhaustivas. Abramson afirma que IBM se ha asociado con RCC porque se ha labrado una reputación por ampliar las tecnologías existentes.
"Ya hemos demostrado una innovación significativa en la aplicación de Storage Scale en la Universidad. Hemos podido dar nuestra opinión sobre lo bien que funciona en nuestro entorno y dónde puede mejorarse", explica Abramson. "Estoy muy entusiasmado por poder probar el otro hardware de vanguardia de IBM para satisfacer nuestras necesidades de investigación más exigentes".
Con una estructura de datos uniforme que incorpora tecnologías IBM Storage Scale como la gestión activa de archivos (AFM) para acceder a los archivos de toda la universidad, el RCC puede optimizar el tiempo de los investigadores y los recursos de la universidad, al tiempo que centraliza la gestión de datos y controla los costes de TI. En la UQ, los investigadores disponen ahora de amplias capacidades informáticas y de almacenamiento para soportar la creación de cantidades masivas de datos a escala y ejecutar cargas de trabajo complejas.
Con la ampliación del ancho de banda y las IOPS disponibles en el dispositivo IBM Storage Scale System, los equipos de investigación que confían en el sistema Wiener HPC pueden procesar datos a velocidades sin precedentes. "El machine learning y la inteligencia artificial ocupan un lugar central en el IBM Storage Scale System GH14S, que potencia el uso de las GPU de nuestro superordenador, lo que permite a los investigadores hacer más en el mismo tiempo y acelera los descubrimientos y descubrimientos", afirma Carroll. De hecho, la nueva cabina de almacenamiento proporcionó un ROI en sólo dos horas, gracias a las mejoras de rendimiento que ahorran a los investigadores de imágenes médicas de la UQ cientos de horas de procesamiento cada semana.
En el Instituto Queensland Brain de UQ (QBI), por ejemplo, los neurocientíficos que estudian la enfermedad de Alzheimer redujeron el tiempo necesario para ejecutar su carga de trabajo de proyecto, conocido como análisis de elementos finitos, en aproximadamente un 74 por ciento, reduciendo el tiempo de ejecución hasta 18,72 horas. Con una comprensión más profunda de la distribución de las ondas de ultrasonido en el cráneo humano, los investigadores pueden desarrollar la tecnología necesaria para superar la barrera hematoencefálica para la administración de fármacos. "Es una tarea muy compleja y necesita una enorme cantidad de potencia de computación y almacenamiento", explica Carroll.
En otro caso, QBI y otros investigadores que estudiaban los circuitos neuronales de las moscas de la fruta desarrollaron métodos genéticos para etiquetar y manipular tipos de neuronas individuales. Con Wiener, pueden procesar rápidamente terabytes de videos de alta velocidad de los pequeños insectos en movimiento, midiendo movimientos precisos de las antenas, el abdomen y las articulaciones en seis patas. Con una nueva visión del papel de cada neurona, pueden comprender mejor los principios que rigen tareas motoras complejas, como el comportamiento de caminar y volar.
En el Instituto de Biociencia Molecular de la UQ, los investigadores que estudian la inflamación celular emplean microscopía de lámina de luz de celosía para capturar imágenes 4D de alta resolución de procesos celulares vivos. Vistas mediante un proceso de modelado matemático conocido como microscopía de deconvolución, las imágenes proporcionan una visión sin precedentes en tiempo real de cómo se forma el cáncer. La solución de almacenamiento Wiener contribuye a hacerlo posible, entre otras cosas reduciendo el tiempo de deconvolución en más de un 70 por ciento. El RCC ahorró tiempo adicional a los investigadores al crear un portal fácil de usar para agilizar las tareas de deconvolución.
"Tenemos que proporcionar la mejor infraestructura posible para respaldar una enorme variedad de esfuerzos de investigación. Dado el crecimiento exponencial de los datos, también necesitamos lograr economías de escala", dice Carroll. "IBM y Sundata ayudan a hacerlo posible".
Durante más de un siglo,la Universidad de Queensland (UQ) (enlace externo a ibm.com) ha mantenido una reputación global por ofrecer liderazgo en conocimiento para un mundo mejor. Las clasificaciones más prestigiosas y reconocidas de universidades del mundo sitúan sistemáticamente a la UQ entre las mejores universidades del mundo. La UQ también ha ganado más premios nacionales de enseñanza que cualquier otra universidad australiana. Este compromiso con la enseñanza de calidad capacita a nuestros 53 600 alumnos actuales, que estudian en los tres campus de la UQ, para crear un cambio positivo para la sociedad. Nuestra investigación tiene una repercusión mundial, llevada a cabo por una comunidad de investigación interdisciplinaria de más de 1500 investigadores en nuestras seis facultades, ocho institutos de investigación y más de 100 centros de investigación.
© Copyright IBM Corporation 2020. IBM corporation, IBM systems hardware, New Orchard road road, Armonk, NY 10504.
Producido en los Estados Unidos de América, octubre de 2020.
IBM, el logotipo de IBM e ibm.com son marcas registradas de International Business Machines Corp., registradas en muchas jurisdicciones del mundo.Los demás nombres de productos y servicios pueden ser marcas registradas de IBM u otras empresas.Puede consultar una lista de las actuales marcas registradas de IBM en la web, en el apartado "Información sobre derechos de autor y marcas registradas" en www.ibm.com/es-es/legal/copytrade.shtml.
Este documento se actualizó por última vez en la fecha inicial de publicación e IBM puede modificarlo en cualquier momento. Los socios comerciales de IBM establecen sus propios precios, que pueden variar. No todas las ofertas están disponibles en todos los países en los que opera IBM.
Los datos de rendimiento y ejemplos de clientes mencionados se presentan únicamente con fines ilustrativos.Los datos reales de rendimiento pueden variar en función de las configuraciones y condiciones de funcionamiento específicas.Es responsabilidad del usuario evaluar y verificar el funcionamiento de cualquier otro producto o programa con los productos y programas de IBM. LA INFORMACIÓN DE ESTE DOCUMENTO SE OFRECE "TAL CUAL ESTÁ" SIN NINGUNA GARANTÍA, NI EXPLÍCITA NI IMPLÍCITA, INCLUIDAS, ENTRE OTRAS, LAS GARANTÍAS DE COMERCIALIZACIÓN, ADECUACIÓN A UN FIN CONCRETO Y CUALQUIER GARANTÍA O CONDICIÓN DE INEXISTENCIA DE INFRACCIÓN.Los productos de IBM están sujetos a garantía según los términos y condiciones de los acuerdos bajo los que se proporcionan.
La capacidad de almacenamiento real disponible puede indicarse tanto para datos comprimidos como sin comprimir y puede variar y ser inferior a la indicada.
Nota: la imagen del espacio principal en el caso práctico es una foto de archivo.