La Universidad de Queensland
Obtener información de forma rápida con el almacenamiento de datos de IA de alto rendimiento para la investigación
Más información
Dos personas analizan datos en una tableta

University of Queensland (UQ), una institución de investigación de primer nivel, buscaba simplificar la captura, el almacenamiento, el análisis y la gestión de datos para su entorno de informática de alto rendimiento (HPC). En colaboración con Sundata, asociado de negocios de IBM, la universidad desarrolló un tejido de datos unificado con el software IBM Spectrum Scale, lo que aceleró de forma significativa las cargas de trabajo de IA y uso intensivo de imágenes.

Desafío empresarial

Para acelerar la colaboración en la investigación, incluso para proyectos complejos impulsados por IA, UQ necesitaba una solución de almacenamiento que admitiera cientos de terabytes de datos generados diariamente.

Transformación

UQ creó un tejido de datos de alto rendimiento impulsado y gestionado de forma centralizada con IBM Spectrum Scale, y recientemente añadió una solución IBM Elastic Storage System (ESS) para dar soporte a su entorno HPC con mayor rapidez.

Resultados 2 horas para lograr el ROI en el almacenamiento definido por software
que ahorra a los investigadores cientos de horas de procesamiento por semana
Tiempos de ejecución ~74 % más rápidos para el análisis de imágenes médicas
para ayudar a acelerar el tiempo de descubrimiento en investigaciones críticas
Volúmenes de datos que crecen de forma exponencial
respaldado por una estructura de almacenamiento sumamente escalable y rentable
Historia de desafío empresarial
A la vanguardia de la investigación impulsada por la IA de la UQ

¿Cómo podemos utilizar las tecnologías de ultrasonido para que los anticuerpos terapéuticos puedan superar la barrera hematoencefálica y frenar la enfermedad de Alzheimer? ¿Qué pueden enseñarnos los circuitos neuronales de las moscas de la fruta sobre el diseño de movimientos robóticos? ¿Por qué la inflamación celular provoca cáncer y cómo podemos aprender más al imaginar células vivas, a escala nanométrica, en tiempo real? En toda UQ, los investigadores creativos abordan estas y otras preguntas difíciles, que a menudo conducen a descubrimientos que pueden cambiar el mundo y la vida de las personas.

Los equipos de investigación que se concentran en estas preguntas confían en la computadora acelerada, con la GPU más rápida de la universidad, para llevar a cabo su trabajo de vanguardia. Diseñada específicamente para cargas de trabajo de ciencias e IA que requieren un uso intensivo de imágenes, esta supercomputadora, junto con otros sistemas HPC de la universidad, necesita un almacenamiento de datos extremadamente rápido, escalable y flexible, disponible en cualquier momento y lugar.

Para crear una ruta más rápida desde la ingesta hasta la información, el Centro Informático de Investigación (RCC) de la UQ buscaba implantar una estrategia de almacenamiento uniforme y de alto rendimiento, así como una arquitectura para apoyar y gestionar de manera eficaz la captura y el análisis de datos en toda la universidad.

El RCC quería una solución que no solo pudiera adaptarse al crecimiento exponencial del volumen, la velocidad y la variedad de los datos, sino que también proporcionara un acceso rápido a los datos. Los investigadores de la universidad generan datos estructurados y no estructurados utilizando una variedad de sistemas informáticos, desde computadoras de escritorio hasta HPC Cluster, y a partir de una enorme gama de instrumentos científicos, como escáneres de resonancia magnética, microscopios ópticos y secuenciadores de ADN, explica el profesor David Abramson, director del RCC. "Nuestro paradigma en torno a los datos es mantener una copia lógica y luego entregarla de muchas maneras diferentes, haciendo que los datos estén disponibles cuando un investigador los necesite, en el lugar que los necesite", dice. Al evaluar las posibles soluciones, el RCC también buscó tecnologías que pudieran ampliarse en consonancia con las necesidades de la universidad en el futuro.

Con la solución ESS, obtenemos todos los beneficios de un sistema de archivos paralelo, de alta velocidad, dentro de una supercomputadora, con la transparencia en la gestión de datos que proporcionan AFM y otras características de IBM Spectrum Scale. Jake Carroll Director de tecnología, centro informático de investigación La Universidad de Queensland
Historia de transformación
Almacenamiento HPC con acceso bajo demanda

El RCC creó un tejido de almacenamiento de datos de alto rendimiento conocido como MeDiCI (infraestructura metropolitana para el almacenamiento de datos en caché), con tecnología y gestión centralizada de IBM Spectrum Scale. “Para que los investigadores impulsen la innovación, deben ser capaces de llevar a cabo investigaciones de gran calidad de manera oportuna, escalable y que traspase los límites, aprovechando la infraestructura informática de investigación de vanguardia. Nuestra asociación con IBM ayuda a satisfacer estas necesidades”, explica Jake Carroll, director de tecnología del centro informático de investigación de UQ. “Con MediCI, los investigadores y estudiantes de toda la universidad, y de otros institutos internacionales, pueden trabajar sin problemas con los datos almacenados en cualquier clúster de computación en la UQ y colaborar”.

“Cuando los investigadores se sientan, ven todos sus datos. No se dan cuenta de que en realidad se están moviendo a través de cables ópticos, a una velocidad vertiginosa, desde un centro de datos remoto”, dice Abramson.

Además, el ecosistema MeDiCI admite una variedad de plataformas, instrumentos y datos. "El software IBM Spectrum Scale nos permite unificar todos nuestros diferentes silos de fuentes de almacenamiento en una infraestructura de almacenamiento inteligente integrada y, luego, entregar los datos en cualquier protocolo apropiado, lo que da como resultado un análisis más rápido y un mayor aprovechamiento de los recursos", dice Abramson. MeDiCI también captura de forma automática los metadatos del proyecto, por ejemplo, usuarios, instrumentos y parámetros de datos.

El equipo del RCC continúa evolucionando la infraestructura MeDiCI. Recientemente, se implementó como una solución de almacenamiento para UQ HPC Wiener (enlace externo a ibm.com). El objetivo es permitir que los investigadores hagan más en el mismo plazo gracias al mayor rendimiento que proporciona la plataforma. "Necesitábamos una solución que no solo pudiera sostener un ancho de banda considerable, desde una perspectiva de gigabytes por segundo, sino también un requisito muy alto de IOPS para admitir las cantidades masivas de datos que llegan a un ritmo sin precedentes desde sistemas de disco y almacenamiento flash de forma simultanea", explica Carroll.

"Queríamos [una plataforma de hardware con] IBM Spectrum Scale porque su funcionalidad es excepcional", explica Carroll. "Con la solución ESS, obtenemos todos los beneficios de un sistema de archivos paralelo, de alta velocidad, dentro de una supercomputadora, con la transparencia en la gestión de datos que proporcionan AFM y otras características de IBM Spectrum Scale. Esa integración se adapta al flujo de trabajo de nuestros usuarios, y en los resultados científicos, el flujo de trabajo es el rey. Es por eso que aprovechamos el almacenamiento definido por software", añade.

Con la solución ESS, UQ puede admitir volúmenes de datos masivos con hasta 40 GB de rendimiento y la capacidad de escalar a exabytes de almacenamiento. Además, su modelo de nube híbrida proporciona acceso rápido a los metadatos. Con la función de programación de borrado IBM Spectrum Scale RAID, la solución está diseñada para admitir altos niveles de confiabilidad, disponibilidad y rendimiento del almacenamiento. Combinada con AFM, también permite que el RCC optimice el acceso a los datos dentro de flujos de trabajo específicos del proyecto sin dejar de mantener una única arquitectura de almacenamiento común.

Los equipos técnicos de ventas de IBM Systems Lab Services e IBM Systems en Australia trabajaron con Sundata y RCC para implementar rápidamente la solución ESS GH14S en una red InfiniBand e integrarla con la arquitectura de TI de MediCI de extremo a extremo. Los equipos trabajaron en colaboración y con atención al detalle durante cada etapa, implementando el arreglo en cinco días.

El CCR ha implantado recientemente la oferta IBM Storage Insights , una plataforma de gestión y soporte del almacenamiento basada en la nube con análisis predictivo. Proporciona al equipo una visibilidad más profunda y coherente en toda la infraestructura, lo que permite un mayor rendimiento a través de una resolución más rápida de los problemas.

Recientemente, IBM instaló un nuevo ESS 5000 en UQ para realizar pruebas y evaluaciones extensas. Abramson dice que IBM se está asociando al RCC, ya que ha ganado prestigio por expandir las tecnologías existentes.

"Ya hemos demostrado una innovación significativa en la aplicación de Spectrum Scale en la universidad. Hemos podido proporcionar comentarios sobre cómo funciona en nuestro entorno y dónde se puede mejorar", explica Abramson. "Me entusiasma la posibilidad de probar otro hardware de vanguardia de IBM en nuestras necesidades de investigación más exigentes".

Con la solución ESS, obtenemos todos los beneficios de un sistema de archivos paralelo, de alta velocidad, dentro de una supercomputadora, con la transparencia en la gestión de datos que proporcionan AFM y otras características de IBM Spectrum Scale. Esa integración se ajusta al flujo de trabajo de nuestros usuarios, y en los resultados científicos, el flujo de trabajo es el rey. Por eso aprovechamos el almacenamiento definido por software. Jake Carroll Director de tecnología, centro informático de investigación La Universidad de Queensland
Historia de resultados
Tiempo de descubrimiento más rápido

Con una estructura de datos uniforme que cuenta con tecnologías IBM Spectrum Scale, como la gestión activa de archivos (AFM) para acceder a los archivos de toda la universidad, el RCC puede optimizar el tiempo y los recursos universitarios de los investigadores, al tiempo que centraliza la gestión de datos y controla los costos de TI. En toda UQ, los investigadores ahora cuentan con capacidades integrales de cómputo y almacenamiento para respaldar la creación de cantidades masivas de datos a escala y ejecutar cargas de trabajo complejas.

Con el ancho de banda ampliado y las IOPS disponibles en el dispositivo ESS, los equipos de investigación que dependen del sistema Wiener HPC pueden procesar datos a velocidades sin precedentes. "El aprendizaje automático y la inteligencia artificial ocupan un lugar central en el ESS GH14S, que potencia el uso de las GPU de nuestra supercomputadora, lo que permite a los investigadores hacer más en el mismo tiempo y acelera los tiempos de descubrimiento", afirma Carroll. De hecho, la nueva matriz de almacenamiento proporcionó un ROI en solo dos horas, basado en mejoras de rendimiento que ahorran a los investigadores de imágenes médicas de UQ cientos de horas de procesamiento cada semana.

En el Queensland Brain Institute (QBI), por ejemplo, los neurocientíficos que estudian la enfermedad de Alzheimer redujeron el tiempo necesario para ejecutar la carga de trabajo del proyecto, conocida como un análisis de elementos finitos, en aproximadamente un 74 por ciento, reduciendo el tiempo de ejecución hasta 18.72 horas. Con una comprensión más profunda de la distribución por ondas de ultrasonido en el cráneo humano, los investigadores pueden desarrollar la tecnología necesaria para superar la barrera cerebral sanguínea para la administración de medicamentos. "Es una tarea muy compleja, y necesita una enorme cantidad de potencia de cómputo y almacenamiento", explica Carroll.

En otro caso, QBI y otros investigadores que estudiaban los circuitos neuronales de las moscas de la fruta desarrollaron métodos genéticos para etiquetar y manipular tipos de neuronas individuales. Con Wiener, pueden procesar rápidamente terabytes de videos de alta velocidad de los pequeños insectos en movimiento, midiendo movimientos precisos de las antenas, el abdomen y las articulaciones en seis piernas. Con nuevos conocimientos sobre el papel que desempeña cada neurona, pueden comprender mejor los principios que rigen las tareas motoras complejas, como el comportamiento de caminar y volar.

En el Instituto de Biociencia Molecular de la UQ, los investigadores que estudian la inflamación celular emplean microscopía con lámina de luz para capturar imágenes 4D de alta resolución de procesos celulares vivos. Vistas mediante un proceso de modelado matemático conocido como microscopía de deconvolución, las imágenes proporcionan una visión sin precedentes y en tiempo real de cómo se forma el cáncer. La solución de almacenamiento de Wiener ayuda a hacer esto posible, incluida la reducción del tiempo de deconvolución en más del 70 por ciento. El RCC ahorró tiempo adicional a los investigadores al crear un portal fácil de usar para agilizar las tareas de deconvolución.

"Tenemos que proporcionar la mejor infraestructura posible para respaldar una enorme gama de esfuerzos de investigación. Dado el crecimiento exponencial de los datos, también necesitamos lograr economías de escala", dice Carroll. "IBM y Sundata ayudan a hacerlo posible". 

Logotipo de la Universidad de Queensland Australia con escudo en color violeta
La Universidad de Queensland

Para más de un siglo, University of Queensland (UQ) (enlace externo a ibm.com) ha mantenido el prestigio internacional por brindar liderazgo en el conocimiento para un mejor mundo. La mayoría de las universidades más prestigiosas y ampliamente reconocidas del mundo sitúan a UQ entre las principales universidades del mundo. Además, UQ es la universidad que ha obtenido la mayor cantidad de premios a la enseñanza a nivel nacional en Australia. Este compromiso para ofrecer enseñanza de calidad potencia a los 53 600 estudiantes que actualmente asisten a UQ en sus tres sedes, con el fin de hacer un cambio positivo en la sociedad. La investigación que se desarrolla en la universidad tiene impacto global, con una comunidad de más de 1500 investigadores de diversas disciplinas que trabajan en las seis facultades, ocho institutos de investigación y más de 100 centros de investigación.  

Dé el siguiente paso

Para obtener más información sobre las soluciones IBM Storage, comuníquese con su representante o asociado de negocios de IBM, o visite el siguiente sitio web: ibm.com/storage

Acerca de Sundata

Sundata, empresa fundada en 1986 y asociada de negocios de IBM, ayuda a empresas corporativas, gobiernos e instituciones educativas a alinear su estrategia empresarial con la tecnología. La empresa, un integrador y distribuidor de sistemas de tamaño medio con sede en Brisbane, ofrece una amplia gama de servicios de planificación, instalación, soporte y financiación.

Encuentre más casos de estudio aquí Centro de excelencia de IBM@UQ
Legal

© Copyright IBM Corporation 2020. IBM Corporation, IBM Systems Hardware, New Orchard Road, Armonk, NY 10504
Producido en los Estados Unidos, octubre de 2020.

IBM, el logotipo de IBM, ibm.com, IBM Elastic Elastic Storage e IBM Spectrum son marcas de International Business Machines Corp., registradas en muchas jurisdicciones de todo el mundo. Otros nombres de productos y servicios pueden ser marcas registradas de IBM u otras empresas. Puede consultar una lista actual de marcas comerciales de IBM en la web, en "Información sobre derechos de autor y marca registrada" en www.ibm.com/mx-es/legal/copytrade.shtml.

Este documento está actualizado a la fecha inicial de publicación e IBM puede modificarlo en cualquier momento. Los socios de negocios de IBM establecen sus propios precios, que pueden variar. No todas las ofertas están disponibles en todos los países en los que opera IBM.

Los datos de rendimiento y los ejemplos de clientes citados se presentan solo con fines ilustrativos. Los resultados de rendimiento reales pueden variar según las configuraciones específicas y las condiciones de funcionamiento. Es responsabilidad del usuario evaluar y verificar el funcionamiento de cualquier otro producto o programa con los productos y programas de IBM.LA INFORMACIÓN CONTENIDA EN ESTE DOCUMENTO SE PROPORCIONA “TAL CUAL”, SIN NINGUNA GARANTÍA, EXPRESA O IMPLÍCITA, INCLUIDAS LAS GARANTÍAS DE COMERCIABILIDAD, IDONEIDAD PARA UN FIN DETERMINADO Y CUALQUIER GARANTÍA O CONDICIÓN DE NO INFRACCIÓN. Los productos de IBM están garantizados de conformidad con los términos y condiciones de los acuerdos bajo los cuales se proveen.

La capacidad real de almacenamiento disponible puede informarse tanto para datos comprimidos como sin comprimir, la cual variará y puede ser menor de lo establecido.

Nota: La imagen del espacio principal en el estudio de caso es una foto de archivo.