El acelerador de IA potente, rentable y abierto para las cargas de trabajo de IA generativas.
Desbloquee, innove e implemente nuevas soluciones de IA con los aceleradores de IA Intel Gaudi 3 en IBM Cloud, diseñados para ayudarle a escalar de forma rentable para satisfacer las demandas de IA de su empresa con un alto rendimiento, flexibilidad en la implementación y desarrollo abierto.
Admite una amplia gama de aplicaciones y marcos de inferencia de IA generativa, incluidos modelos de lenguaje de gran tamaño (LLM) y modelos multimodales (MMM). Comience rápidamente con IBM® Cloud Virtual Server for VPC o Red Hat OpenShift Kubernetes Service. El soporte para IBM® watsonx, los clústeres de IA de Red Hat OpenShift, IBM® Cloud Kubernetes Service, las arquitecturas desplegables en IBM Cloud y una implementación automatizada basada en Terraform están previstos para el segundo semestre de 2025.
Más información sobre la tecnología Intel Gaudi 3
Los aceleradores de IA Intel Gaudi 3 se combinan con procesadores Intel Xeon de 5.ª generación en IBM Cloud Virtual Servers for VPC.
Los aceleradores de IA Intel Gaudi 3 se pueden implementar a través de IBM Cloud Virtual Server for VPC para instancias de nube VPC. IBM Cloud VPC está diseñado para ofrecer una alta resiliencia y seguridad dentro de una red definida por software en la que los clientes pueden crear nubes privadas aisladas y, al mismo tiempo, mantener los beneficios esenciales de la nube pública. La instancia en la nube Intel Gaudi 3, que también admite imágenes de IA de Red Hat Enterprise Linux, es ideal para clientes con pilas de software altamente especializadas o para aquellos que requieren un control total sobre su servidor subyacente.
Los aceleradores Intel Gaudi 3 AI en IBM Cloud están diseñados para cargas de trabajo de IA de alto rendimiento y cuentan con 64 núcleos de procesamiento tensorial (TPC) y ocho motores de multiplicación de matrices (MME) para ayudar a acelerar los cálculos de redes neuronales profundas. Los aceleradores de IA Intel Gaudi 3 en IBM Cloud también están equipados con 128 GB de memoria HBM2E y ofrecen hasta 3,7 TB/s de ancho de banda de memoria, además de ser compatibles con redes Ethernet estándar del sector con 24 puertos de 200 GbE, lo que proporciona 9,6 Tbps de ancho de banda bidireccional para una interconectividad de sistemas escalable.
Los aceleradores de IA Intel Gaudi 3 ofrecen una amplia compatibilidad con aplicaciones de IA, incluyendo inferencia, generación 3D, generación de texto, clasificación, generación de vídeo, sentimiento, traducción, generación de imágenes, resumen y preguntas y respuestas, con especial atención a los modelos multimodales, los modelos de lenguaje de gran tamaño (LLM) y la generación aumentada por recuperación (RAG).
Con 128 GB de memoria HBM2E y hasta 3,7 TB/s de ancho de banda de memoria, los aceleradores de IA Intel Gaudi 3 en IBM Cloud ayudan a garantizar un procesamiento de datos rápidos, reducir los cuellos de botella y permitir a los desarrolladores procesar enormes conjuntos de datos de manera más rápida y eficaz.
Los aceleradores de IA Intel Gaudi 3 en IBM Cloud se integran en IBM Cloud Virtual Servers en IBM Cloud Virtual Private Cloud (VPC). IBM Cloud VPC es una red definida por software (SDN) altamente resiliente y segura en la que puede crear nubes privadas aisladas sin renunciar a los beneficios esenciales de la nube pública. El perfil de servidor virtual Intel Gaudi 3 en IBM Cloud VPC es una combinación preconfigurada de vCPU, RAM y almacenamiento para iniciar rápidamente una instancia de servidor virtual.
Los aceleradores de IA Intel Gaudi 3 en IBM Cloud son compatibles con marcos populares,
como PyTorch, ONNX y DeepSpeed. Hay más de 400 000 modelos disponibles en Hugging Face, optimizados para su uso con la
biblioteca de software Optimum Habana. El conjunto completo de software Intel Gaudi
y la compatibilidad con marcos están diseñados para facilitar la migración,
lo que permite a los desarrolladores integrar los modelos existentes con cambios mínimos en el código.