GPU AMD Instinct MI300X na IBM Cloud

Projetada para fornecer desempenho de liderança para cargas de trabalho de IA generativa e aplicações de HPC
Infraestrutura IBM Cloud para IA
A GPU AMD Instinct MI300X oferece 192 GB de memória HBM3

Essa GPU avançada oferece desempenho de ponta para o data center, em qualquer escala. Essas GPUs são ideais para impulsionar até mesmo as cargas de trabalho mais exigentes de IA e HPC, oferecendo desempenho computacional excepcional, alta densidade de memória, memória de alta largura de banda e suporte a formatos de dados especializados.

O suporte para IBM watsonx®, Red Hat® OpenShift® Kubernetes Service e uma implementação automatizada baseada em Terraform estão planejados para o primeiro semestre de 2025. O suporte para clusters Red Hat OpenShift AI, IBM Cloud® Kubernetes Service e arquiteturas implementáveis na IBM Cloud estão planejados para o segundo semestre de 2025.

Benefícios
Gráficos e tabelas exibidos em uma ilustração de fundo limpa
Menor TCO em escala

Os 192 GB de memória HBM3 oferecem desempenho eficiente em IA generativa para modelos de IA maiores ou em maior número, reduzindo a necessidade de GPUs.

Um ícone de nuvem que representa documentos, processos e ilustrações integradas
Alto desempenho em IA e HPC

A GPU foi otimizada para operações com matrizes e tensores em precisão FP8, FP16, BF16 e INT8, equilibrando desempenho e precisão.

Aplicação exibindo uma variedade de cores em diferentes seções e ilustração de funcionalidades
Desenvolvimento aberto

O software aberto AMD-ROCm inclui uma ampla variedade de modelos de programação, ferramentas, compiladores, bibliotecas e tempos de execução. Ao oferecer suporte a APIs implementadas por líderes do setor, os desenvolvedores podem facilmente transferir o código de desenvolvimento.

A instância do MI300X na IBM Cloud
A instância na IBM Cloud vem com as seguintes especificações
  • 208 vCPUs
  • 1792 GB de RAM
  • 8 x 3,2 TB de armazenamento de instância
  • 8 x GPU AMD Instinct MI300X
Implemente conforme sua infraestrutura e seus requisitos de software

As GPUs AMD Instinct MI300X são combinadas com os processadores Intel de 4ª geração Xeon® nos IBM Cloud® Virtual Servers for VPC.

Infraestrutura IBM Cloud para IA
Provisione um servidor autônomo na IBM Cloud Virtual Private Cloud (VPC)

As GPUs AMD Instinct MI300X podem ser implementadas por meio de instâncias em nuvem do IBM Cloud Virtual Servers for VPC. O IBM Cloud VPC foi projetado para alta resiliência e segurança em uma rede definida por software (SDN), onde os clientes podem criar nuvens privadas isoladas e aproveitar os principais benefícios da nuvem pública. A instância em nuvem com GPU AMD Instinct MI300X, que também oferece suporte a imagens Red Hat Enterprise Linux AI, é ideal para clientes com pilhas de software altamente especializadas ou que precisem de controle total sobre o servidor subjacente.

Configure, precifique e cote
Recursos
Ilustração abstrata representando um globo
Demonstração do IBM watsonx.ai
Faça um tour pelo estúdio de desenvolvedor watsonx.ai®. Crie prompts, experimente modelos de base e crie modelos de ML.
Assista a este vídeo curto sobre IA Red Hat OpenShift na IBM Cloud.
Design azul e branco com círculos.
Documentação do IBM Cloud VPC
Saiba mais sobre o IBM Cloud Virtual Private Cloud. Explore guias de provisionamento, tutoriais e muito mais.
Produtos relacionados
Watsonx com logotipo da submarca
IBM watsonx
Explore um portfólio completo de produtos de IA que ampliam o impacto da IA generativa em fluxos de trabalho essenciais, impulsionando a produtividade.
Ilustração de um desenvolvedor trabalhando em um notebook usando tecnologias de nuvem híbrida, incluindo Redhat OpenShift, Kubernetes e IBM Cloud.
IA da Red Hat na IBM Cloud
Traga aplicações e iniciativas de IA de missão crítica ao mercado com o Red Hat AI InstructLab™, o Red Hat OpenShift AI e o Red Hat Enterprise Linux® AI.
Equipe de dois empreendedores criativos discute a estratégia de crescimento enquanto analisa um notebook.
IBM Cloud Kubernetes Service
Escolha uma solução Kubernetes certificada e gerenciada, projetada para criar um cluster de hosts de computação para implementar aplicativos em contêineres na IBM Cloud. A IBM gerencia a instância primária, liberando você do sistema operacional do host, do tempo de execução e dos processos de atualização de versão .
Programador profissional de TI trabalhando em um data center em um computador desktop com três monitores.
Arquiteturas implementáveis na IBM Cloud® 
Acelere a inovação, aumente a eficiência e mantenha a segurança e a conformidade, otimizando os custos.
Um fluxograma numerado rotulado com ícones e números.
Padrão de geração aumentada de recuperação (RAG) na IBM Cloud
Automatize a implementação de RAG com os serviços de suporte do IBM Cloud e do watsonx, integrando seus dados corporativos a soluções de IA generativa.
Um corredor em uma sala de servidores
IBM Cloud Virtual Servers for VPC
Use máquinas virtuais altamente escaláveis, locatário único e múltiplos locatários que podem ser iniciadas rapidamente, garantindo máximo isolamento e controle de rede.
Introdução

Explore as instâncias da GPU AMD MI300X na IBM Cloud.

 

Configuração e preço Explore a documentação