Universidade de Queensland
Tempo mais rápido para insights com armazenamento de dados de alta performance para pesquisa em IA
Saiba mais
Duas pessoas analisando dados em um tablet

Uma instituição de pesquisa de classe mundial, a Universidade de Queensland (UQ) buscou simplificar a captura, armazenamento, análise e gerenciamento de dados para seu ambiente de computação de alta performance (HPC). Colaborando com a parceira de negócios da IBM, Sundata, a universidade desenvolveu uma malha de dados unificada com o software IBM Spectrum Scale, acelerando significativamente as cargas de trabalho intensivas em imagem e em IA.

Desafio de negócio

Para acelerar a colaboração em pesquisa, incluindo para projetos complexos impulsionados por IA, a UQ precisava de uma solução de armazenamento que suportasse centenas de terabytes de dados gerados diariamente.

Transformação

A UQ construiu uma malha de dados de alta performance alimentada e gerenciada centralmente com o IBM Spectrum Scale, adicionando recentemente uma solução do IBM Elastic Storage System (ESS) para suportar seu ambiente HPC mais rápido.

Resultados 2 horas para obter ROI em armazenamento definido por software
que economiza aos pesquisadores centenas de horas de tempo de processamento por semana
Tempos de execução aproximadamente 74% mais rápidos para análise de imagens médicas
para ajudar a acelerar o tempo até a descoberta para pesquisas críticas
Volumes de dados que aumentam exponencialmente
suportados por um tecido de armazenamento altamente escalável e custo-efetivo
História de desafio de negócios
Na vanguarda da pesquisa orientada por IA da UQ

Como podemos usar tecnologias de ultrassom para que anticorpos terapêuticos possam superar a barreira sangue-cérebro e desacelerar a doença de Alzheimer? O que os circuitos neurais de moscas da fruta podem nos ensinar sobre o design de movimentos robóticos? Por que a inflamação celular leva ao câncer e como podemos aprender mais ao imaginar células vivas em tamanho nanométrico em tempo real? Na UQ, pesquisadores criativos enfrentam essas e outras questões difíceis, muitas vezes levando a descobertas que podem mudar o mundo e a vida das pessoas.

As equipes de pesquisa focadas nessas questões contam com o computador mais rápido da universidade, acelerado por GPU, para realizar seu trabalho de ponta. Projetado especificamente para ciência intensiva em imagem e cargas de trabalho em IA, esse supercomputador, junto com outros sistemas HPC na Universidade, precisa de armazenamento de dados extremamente rápido, escalável e flexível disponível a qualquer hora, em qualquer lugar.

Para criar um caminho mais rápido da ingestão aos insights, o Centro de Computação para Pesquisa (RCC) na UQ buscou implementar uma estratégia e arquitetura de armazenamento uniforme e de alta performance para suportar e gerenciar eficazmente a captura e análise de dados em toda a universidade.

O RCC queria uma solução que pudesse não apenas acomodar o crescimento exponencial em volume de dados, velocidade e variedade, mas também fornecer acesso rápido aos dados. Pesquisadores da Universidade geram dados estruturados e não estruturados usando uma variedade de sistemas de computadores – de desktops a HPC Clusters – e de uma enorme gama de instrumentos científicos, como scanners de ressonância magnética (MRI), microscópios ópticos e sequenciadores de DNA, explica o professor David Abramson, diretor no RCC. "Nossa paradigma em torno dos dados é manter uma cópia lógica dele e então renderizá-lo de várias maneiras diferentes, tornando os dados disponíveis quando um pesquisador precisa, onde ele precisa," ele diz. Ao avaliar soluções potenciais, o RCC também buscou tecnologias que pudessem expandir-se em linha com as necessidades da Universidade para o futuro.

Com a solução ESS, obtemos todos os benefícios de um sistema de arquivos paralelo de alta velocidade dentro de um supercomputador com a transparência de gerenciamento de dados que o AFM e outros recursos do IBM Spectrum Scale fornecem. Jake Carroll Diretor de Tecnologia, Centro de Computação para Pesquisa Universidade de Queensland
História de transformação
Armazenamento HPC com acesso sob demanda

O RCC construiu uma malha de armazenamento de dados de alta performance conhecido como MeDiCI (Metropolitan Data Caching Infrastructure), alimentado e gerenciado centralmente com o IBM Spectrum Scale. "Para os pesquisadores impulsionarem a inovação, eles precisam ser capazes de realizar pesquisas de alta qualidade de maneira oportuna, escalável e inovadora, aproveitando a infraestrutura de computação para pesquisa de ponta. Nossa parceria com a IBM ajuda a atender essas necessidades," explica Jake Carroll, diretor de tecnologia do Centro de Computação para Pesquisa na UQ. "Com o MeDiCI, pesquisadores e estudantes em toda a Universidade e em outros institutos internacionais podem trabalhar de forma transparente com dados armazenados em qualquer cluster de computação na UQ e colaborar."

"Quando os pesquisadores se sentam, eles veem todos os seus dados. Eles não percebem que os dados estão se movendo através de fios ópticos a uma velocidade impressionante de um data center remoto," afirma Abramson.

Além disso, o ecossistema MeDiCI suporta uma variedade de plataformas, instrumentos e dados. "O software IBM Spectrum Scale nos permite unificar todos os nossos diferentes silos de fontes de armazenamento em uma infraestrutura de armazenamento integrada e inteligente e então renderizar os dados no protocolo apropriado, resultando em análises mais rápidas e maior utilidade de recursos," diz Abramson. O MeDiCI também captura automaticamente metadados do projeto, incluindo usuários, instrumentos e parâmetros de dados.

A equipe do RCC continua a evoluir a infraestrutura MeDiCI, mais recentemente implementando-a como uma solução de armazenamento para o UQ HPC Wiener (link fora de ibm.com). O objetivo é permitir que os pesquisadores façam mais no mesmo período de tempo, dado o aumento de throughput que a plataforma fornece. "Precisávamos de uma solução que pudesse não apenas sustentar uma largura de banda bastante substancial de uma perspectiva de gigabytes por segundo, mas também um requisito de IOPS muito alto para suportar quantidades massivas de dados chegando a uma taxa sem precedentes de sistemas de disco e armazenamento flash simultaneamente," explica Carroll.

"Queríamos [uma plataforma de hardware com] IBM Spectrum Scale porque sua funcionalidade é quase única," explica Carroll. "Com a solução ESS, obtemos todos os benefícios de um sistema de arquivos paralelo de alta velocidade dentro de um supercomputador com a transparência de gerenciamento de dados que o AFM e outras funcionalidades do IBM Spectrum Scale fornecem. Essa integração se encaixa no fluxo de trabalho de nossos usuários, e em outputs científicos, o fluxo de trabalho é o mais importante. É por isso que aproveitamos o armazenamento definido por software," ele adiciona.

Com a solução ESS, a UQ pode suportar volumes massivos de dados com até 40 GB de throughput e a capacidade de escalar para exabytes de armazenamento, e seu modelo de nuvem híbrida fornece acesso rápido a metadados. Com o recurso de codificação de eliminação de erros IBM Spectrum Scale RAID, a solução foi projetada para oferecer suporte a altos níveis de confiabilidade, disponibilidade e desempenho de armazenamento. Combinado com o AFM, também permite ao RCC otimizar o acesso aos dados dentro de fluxos de trabalho de projetos específicos — mantendo ainda uma única arquitetura de armazenamento comum.

As equipes de vendas técnicas do IBM Systems Lab Services e da IBM Systems na Austrália trabalharam com a Sundata e o RCC para implementar rapidamente a solução ESS GH14S em uma rede InfiniBand e integrá-la à arquitetura de TI MeDiCI de ponta a ponta. As equipes trabalharam de forma coesa e com atenção aos detalhes em cada etapa, implementando o array em cinco dias.

O RCC implementou recentemente a oferta IBM Storage Insights , uma plataforma de gerenciamento e suporte de armazenamento baseada na nuvem com análise preditiva. Ela fornece à equipe uma visibilidade mais profunda e coesa em toda a infraestrutura, possibilitando um desempenho mais alto por meio da resolução mais rápida de problemas.

A IBM recentemente colocou um novo ESS 5000 na UQ para testes extensivos e avaliação. Abramson diz que a IBM está se associando ao RCC pois desenvolveu uma reputação por estender as tecnologias existentes.

"Já demonstramos inovação significativa na aplicação do Spectrum Scale na Universidade. Conseguimos fornecer feedback sobre como ele funciona em nosso ambiente e onde pode ser aprimorado," explica Abramson. "Estou muito animado para poder testar outros hardwares de ponta da IBM em nossas necessidades de pesquisa mais exigentes."

Com a solução ESS, obtemos todos os benefícios de um sistema de arquivos paralelo de alta velocidade dentro de um supercomputador com a transparência de gerenciamento de dados que o AFM e outros recursos do IBM Spectrum Scale fornecem. Essa integração se encaixa no fluxo de trabalho de nossos usuários, e em outputs científicos, o fluxo de trabalho é o principal. É por isso que utilizamos o armazenamento definido por software. Jake Carroll Diretor de Tecnologia, Centro de Computação para Pesquisa Universidade de Queensland
História de resultados
Tempo de descoberta mais rápido

Com uma malha de dados uniforme apresentando tecnologias do IBM Spectrum Scale como o gerenciamento ativo de arquivos (AFM) para acessar arquivos em toda a universidade, o RCC pode otimizar o tempo dos pesquisadores e os recursos da universidade enquanto centraliza o gerenciamento de dados e controla os custos de TI. Em toda a UQ, os pesquisadores agora têm recursos abrangentes de computação e armazenamento para apoiar a criação de grandes quantidades de dados em escala e executar cargas de trabalho complexas.

Com a largura de banda expandida e IOPS disponíveis do dispositivo ESS, as equipes de pesquisa que dependem do sistema HPC Wiener podem processar dados em velocidades sem precedentes. "A aprendizagem de máquina e IA estão no centro, com o ESS GH14S potencializando como as GPUs do nosso supercomputador são utilizadas, permitindo que os pesquisadores façam mais no mesmo período de tempo e acelerando o tempo para descoberta," diz Carroll. De fato, o novo array de armazenamento entregou um ROI em apenas duas horas, baseado em melhorias de desempenho que economizam centenas de horas de processamento a cada semana para pesquisadores de imagens médicas em toda a UQ.

No Queensland Brain Institute (QBI) da UQ, por exemplo, neurocientistas estudando a doença de Alzheimer reduziram o tempo necessário para executar sua carga de trabalho do projeto, conhecida como análise de elemento finito, em aproximadamente 74%, reduzindo o tempo de execução para 18,72 horas. Com um entendimento mais profundo da distribuição de ondas de ultrassom no crânio humano, os pesquisadores podem desenvolver a tecnologia necessária para superar a barreira sangue-cérebro para a entrega de medicamentos. "É um empreendimento muito complexo, e necessita de uma enorme quantidade de poder de computação e armazenamento," explica Carroll.

Em outro caso, o QBI e outros pesquisadores observando circuitos neurais em moscas da fruta desenvolveram métodos genéticos para rotular e manipular tipos individuais de neurônios. Com o Wiener, eles podem processar rapidamente terabytes de vídeos de alta velocidade dos minúsculos insetos em movimento, medindo movimentos precisos das antenas, abdômen e articulações nas seis pernas. Com novas percepções sobre o papel de cada neurônio, eles podem entender melhor os princípios que regem tarefas motoras complexas, como comportamento de caminhar e voar.

No Instituto de Biociências Moleculares da UQ, pesquisadores estudando inflamação celular empregam microscopia de folha de luz de grade para capturar imagens 4D de alta resolução de processos celulares vivos. Vistas através de um processo de modelagem matemática conhecido como microscopia de deconvolução, as imagens fornecem um olhar sem precedentes, em tempo real, sobre como o câncer se forma. A solução de armazenamento Wiener ajuda a tornar isso possível, incluindo a redução do tempo de deconvolução em mais de 70%. O RCC economizou tempo adicional dos pesquisadores construindo um portal amigável para simplificar tarefas de deconvolução.

Temos que fornecer a melhor infraestrutura possível para apoiar uma enorme gama de empreendimentos de pesquisa. Dado o crescimento exponencial dos dados, também precisamos alcançar economias de escala," diz Carroll. "A IBM e a Sundata ajudam a tornar isso possível." 

Logotipo da Universidade de Queensland, Austrália, com brasão em roxo
Universidade de Queensland

Por mais de um século, a Universidade de Queensland (UQ) (link fora de ibm.com) manteve uma reputação global por entregar liderança de conhecimento para um mundo melhor. Os rankings mais prestigiados e amplamente reconhecidos das universidades mundiais consistentemente colocam a UQ entre as melhores universidades do mundo. A UQ também ganhou mais prêmios nacionais de ensino do que qualquer outra universidade australiana. Esse compromisso com o ensino de qualidade empodera nossos 53.600 alunos atuais, que estudam nos três campi da UQ, para criar mudanças positivas para a sociedade. Nossa pesquisa tem um impacto global, entregue por uma comunidade de pesquisa interdisciplinar de mais de 1500 pesquisadores em nossas seis faculdades, oito institutos de pesquisa e mais de 100 centros de pesquisa. 

Dê o próximo passo

Para saber mais sobre as soluções IBM Storage, entre em contato com seu representante da IBM, com o parceiro de negócios da IBM ou visite o seguinte site: ibm.com/storage

Sobre a Sundata

Fundada em 1986, a parceira de negócios da IBM, Sundata, ajuda empresas corporativas, governos e instituições educacionais a alinhar sua estratégia de negócios com a tecnologia. Uma integradora de sistemas e revendedora de porte médio sediada em Brisbane, a empresa oferece uma ampla gama de serviços de planejamento, instalação, suporte e financiamento.

Encontre mais estudos de caso aqui IBM@UQ Centre of Excellence
Legal

© Copyright IBM Corporation 2020. IBM Corporation, IBM Systems Hardware, New Orchard Road, Armonk, NY 10504. 
Produzido nos Estados Unidos da América, outubro de 2020.

IBM, o logotipo IBM, ibm.com, IBM Elastic Storage e IBM Spectrum são marcas comerciais da International Business Machines Corp., registradas em diversas jurisdições em todo o mundo. Outros nomes de produtos e serviços podem ser marcas comerciais da IBM ou de outras empresas. Uma lista atual de marcas registradas da IBM está disponível na web em “Copyright and trademark information" em www.ibm.com/br-pt/legal/copytrade.shtml.

Este documento é atual na data de sua publicação inicial, podendo ser alterado pela IBM a qualquer momento. Os parceiros de negócios da IBM definem seus próprios preços, que podem variar. Nem todas as ofertas estão disponíveis em todos os países em que a IBM opera.

Os dados de desempenho e os exemplos de clientes citados são apresentados apenas para fins ilustrativos. Os resultados reais de desempenho podem variar de acordo com configurações e condições operacionais específicas. É responsabilidade do usuário avaliar e verificar a operação de qualquer outro produto ou programa com produtos e programas IBM. AS INFORMAÇÕES CONTIDAS NESTE DOCUMENTO SÃO FORNECIDAS NO ESTADO EM QUE SEM ENCONTRAM, SEM QUALQUER GARANTIA, EXPRESSA OU IMPLÍCITA, INCLUINDO SEM QUAISQUER GARANTIAS DE COMERCIALIZAÇÃO, ADEQUAÇÃO A DETERMINADO FIM E QUALQUER GARANTIA OU CONDIÇÃO DE NÃO INFRAÇÃO. Os produtos IBM têm garantia de acordo com os termos e condições dos contratos sob os quais são fornecidos.

A capacidade de armazenamento disponível real pode ser relatada para dados não compactados e compactados e variará e poderá ser menor do que o indicado.

Observação: a imagem do espaço de lead no estudo de caso é uma foto profissional.