O acelerador de IA poderoso, econômico e aberto para cargas de trabalho de IA generativa.
Libere, inove e implemente novas soluções de IA com os aceleradores de IA Intel® Gaudi® 3 na IBM Cloud®, projetados para ajudar você a escalar de forma econômica as demandas de IA corporativa com alto desempenho, flexibilidade na implementação e desenvolvimento aberto.
Ofereça suporte a uma ampla gama de aplicações e frameworks de inferência de IA generativa, incluindo grandes modelos de linguagem (LLM) e modelos multimodais (MMM). Comece rapidamente com a implementação dos IBM Cloud Virtual Servers for VPC. O suporte para IBM watsonx®, Red Hat® OpenShift® Kubernetes Service e uma implementação automatizada baseada em Terraform estão planejados para o primeiro semestre de 2025. O suporte para clusters Red Hat OpenShift AI, IBM Cloud Kubernetes Service e arquiteturas implementáveis na IBM Cloud estão planejados para o segundo semestre de 2025.Saiba mais sobre a tecnologia Intel Gaudi 3
Os aceleradores de IA Intel® Gaudi® 3 são combinados com processadores Intel® Xeon® de 5ª geração nos IBM Cloud Virtual Servers for VPC.
Os aceleradores de IA Intel Gaudi 3 podem ser implementados por meio dos IBM Cloud Virtual Servers for VPC para instâncias de nuvem. A IBM Cloud VPC foi projetada para alta resiliência e segurança dentro de uma rede definida por software, onde os clientes podem criar nuvens privadas isoladas, mantendo os benefícios essenciais da nuvem pública. A instância de nuvem Intel Gaudi 3, que também oferece suporte a imagens de IA Red Hat Enterprise Linux, é ideal para clientes com stacks de software altamente especializadas ou para aqueles que exigem controle total sobre seu servidor subjacente.
Os aceleradores de IA Intel® Gaudi® 3 na IBM Cloud® foram projetados para cargas de trabalho de IA com alto desempenho, com 64 núcleos de processamento tensorial (TPCs) e oito mecanismos de multiplicação de matrizes (MMEs) para acelerar cálculos de redes neurais profundas. Os aceleradores de IA Intel® Gaudi® 3 no IBM Cloud também contam com 128 GB de memória HBM2E e oferecem até 3,7 TB/s de largura de banda, com suporte à conectividade Ethernet com padrão do setor em 24 portas de 200 GbE, totalizando 9,6 Tbps de largura de banda bidirecional para interconexão escalável de sistemas.
Os aceleradores de IA Intel® Gaudi® 3 oferecem amplo suporte a aplicações de IA, incluindo inferência, geração 3D, geração de texto, classificação, geração de vídeo, análise de sentimento, tradução, geração de imagens, resumo e perguntas e respostas, com foco em grandes modelos de linguagem (LLM), modelos multimodais e geração aumentada por recuperação (RAG).
Com 128 GB de memória HBM2E e até 3,7 TB/s de largura de banda de memória, os aceleradores de IA Intel® Gaudi® 3 na IBM Cloud ajudam a garantir uma rápida taxa de transferência de dados, reduzindo gargalos e permitindo que os desenvolvedores processem grandes conjuntos de dados de forma mais rápida e eficiente.
Os aceleradores de IA Intel® Gaudi® 3 na IBM Cloud estão instalados nos IBM Cloud Virtual Servers na IBM Cloud Virtual Private Cloud (VPC). A IBM Cloud VPC é uma rede definida por software (SDN) altamente resiliente e segura, na qual você pode construir nuvens privadas isoladas, mantendo os benefícios essenciais da nuvem pública. O perfil de Virtual Server Intel® Gaudi® 3 na IBM Cloud VPC é uma combinação pré-configurada de vCPU, RAM e armazenamento para iniciar rapidamente uma instância de Virtual Server.
Os aceleradores de IA
Intel® Gaudi® 3 na IBM Cloud são compatíveis com frameworks populares, incluindo,
PyTorch, ONNX e DeepSpeed. Mais de 400 mil modelos estão disponíveis no Hugging Face, otimizados para uso com a
biblioteca de software Optimum Habana. O pacote completo de software Intel® Gaudi®
e o suporte ao framework foram projetados para facilitar a migração,
permitindo que os desenvolvedores integrem os modelos existentes com alterações mínimas no código.