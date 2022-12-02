A computação de alto desempenho (HPC) é uma tecnologia que usa clusters de processadores potentes que trabalham em paralelo para processar conjuntos de dados multidimensionais maciços, também conhecidos como big data, e resolver problemas complexos em velocidades extremamente altas. A HPC resolve alguns dos problemas de computação mais complexos da atualidade em tempo real.
Os sistemas HPC normalmente são executados a velocidades mais de um milhão de vezes mais rápidas do que os sistemas de desktop, laptop ou servidor de commodities mais rápidos.
Durante décadas, os supercomputadores — computadores específicos que incorporam milhões de processadores ou núcleos de processador — foram fundamentais na computação de alto desempenho. Os supercomputadores ainda estão conosco; nesta escrita, o supercomputador mais rápido é a Frontier baseada nos EUA (link reside fora de ibm.com), com uma velocidade de processamento de 1,102 exaflops ou operações de ponto flutuante quintillião por segundo (flops). Mas hoje, mais organizações estão executando serviços de HPC em clusters de servidores de computador de alta velocidade, hospedados no local ou na nuvem.
As cargas de trabalho de HPC revelam novos insights importantes que aprimoram o conhecimento humano e criam vantagens competitivas significativas. Por exemplo, a HPC sequencia o DNA, automatiza a negociação de ações e executa simulações e algoritmos de inteligência artificial (IA), como aqueles que habilitam automóveis autônomos, que analisam terabytes de streaming de dados de sensores de IoT, radar e sistemas GPS em tempo real para tomar decisões de segundos dividida.
Um sistema de computação padrão resolve problemas principalmente usando computação serial — ele divide a carga de trabalho em uma sequência de tarefas e, em seguida, executa as tarefas uma após a outra no mesmo processador.
Em contraste, a HPC usa:
Computação massivamente paralela
A computação paralela executa várias tarefas simultaneamente em vários servidores ou processadores de computador. A computação massivamente paralela é a computação paralela que usa dezenas de milhares a milhões de processadores ou núcleos de processador.
Clusters de computadores (também chamados de clusters HPC)
Um cluster HPC consiste em vários servidores de computador de alta velocidade conectados em rede, com um agendador centralizado que gerencia a carga de trabalho de computação paralela. Os computadores, chamados de nós, usam CPUs multi-core de alto desempenho ou, mais provavelmente hoje em dia, GPUs, que são adequadas para cálculos matemáticos rigorosos, modelos de aprendizado de máquina e tarefas com uso intensivo de gráficos. Um único cluster HPC pode incluir 100 mil nós ou mais.
Componentes de alto desempenho
Todos os outros recursos de computação em um cluster de HPC, como rede, memória, armazenamento e sistemas de arquivos, são de alta velocidade e alto rendimento. Eles também são componentes de baixa latência que podem acompanhar o ritmo dos nós e otimizar a capacidade de computação e o desempenho do cluster.
Recentemente, há uma década, o alto custo da HPC, que envolvia possuir ou alugar um supercomputador ou construir e hospedar um cluster de HPC em um data center local, colocou a HPC fora do alcance da maioria das organizações.
Hoje, a HPC na nuvem — às vezes chamada de HPC como serviço ou HPCaaS — oferece uma maneira significativamente mais rápida, escalável e acessível para as empresas aproveitarem a HPC. A HPCaaS normalmente inclui acesso a clusters de HPC e infraestrutura hospedados no data center de um provedor de serviços de nuvem, além de recursos de rede (como IA e análise de dados) e experiência em HPC.
Atualmente, três tendências convergentes impulsionam a HPC na nuvem:
Demanda crescente
Organizações de todos os setores estão se tornando cada vez mais dependentes dos insights em tempo real e da vantagem competitiva que resultam da solução de problemas complexos que somente os aplicativos de HPC podem resolver. Por exemplo, a detecção de fraudes de cartão de crédito, algo em que todos nós confiamos e que a maioria de nós já experimentou em um momento ou outro, depende cada vez mais da HPC para identificar fraudes mais rapidamente e reduzir falsos positivos irritantes, mesmo quando a atividade de fraude se expande e as táticas dos fraudadores mudam constantemente.
Prevalência de redes RDMA de menor latência e maior taxa de transferência
O acesso remoto direto à memória (RDMA) permite que um computador em rede acesse a memória de outro computador em rede sem envolver o sistema operacional do computador ou interromper o processamento de qualquer um dos computadores. Isso ajuda a minimizar a latência e maximizar o rendimento. As malhas emergentes de RDMA de alto desempenho, incluindo InfiniBand, arquitetura de interface virtual e RDMA sobre Ethernet convergente, estão essencialmente tornando possível a HPC baseada em nuvem.
Disponibilidade generalizada de HPCaaS em nuvem pública e nuvem privada
Hoje, todos os principais provedores de serviços de nuvem pública oferecem serviços de HPC. E embora algumas organizações continuem a executar cargas de trabalho de HPC altamente regulamentadas ou sensíveis no local, muitas estão adotando ou migrando para serviços de HPC em nuvem privada oferecidos por fornecedores de hardware e soluções.
Os aplicativos de HPC tornaram-se sinônimos de aplicativos de IA em geral, e de aplicativos de aprendizado de máquina e deep learning em particular; hoje, a maioria dos sistemas HPC é criada com essas cargas de trabalho em mente. Essas aplicações de HPC estão impulsionando a inovação contínua em:
Saúde, genômica e ciências da vida
A primeira tentativa de sequenciar um genoma humano levou 13 anos; hoje, os sistemas HPC podem fazer o trabalho em menos de um dia. Outras aplicações de HPC na área da saúde e ciências biológicas incluem descoberta e design de medicamentos, diagnóstico rápido de câncer e modelagem molecular.
Serviços financeiros
Além da negociação automatizada e detecção de fraudes, a HPC alimenta aplicativos em simulação Monte Carlo e outros métodos de análise de risco.
Governo e defesa
Dois casos de uso crescentes de HPC nessa área são a previsão do tempo e a modelagem climática, que envolvem o processamento de grandes quantidades de dados meteorológicos históricos e milhões de mudanças diárias em pontos de dados relacionados ao clima. Outras aplicações governamentais e de defesa incluem pesquisa energética e trabalho de inteligência.
Energia
Em alguns casos que se sobrepõem ao governo e à defesa, as aplicações de HPC relacionadas à energia incluem processamento de dados sísmicos, simulação e modelagem de reservatórios, análise geoespacial, simulação de vento e mapeamento de terreno.
