Red Hat IA on IBM Cloud

Soluciones preparados para la IA de Red Hat e IBM Cloud

Red Hat AI on IBM Cloud proporciona una forma coherente y segura de crear, entrenar, personalizar y desplegar cargas de trabajo de IA y machine learning en entornos de nube híbrida. La cartera combina la innovación de código abierto con una infraestructura en la nube de nivel empresarial, lo que ayuda a los equipos de TI a reducir la complejidad operativa y acelerar la adopción de la IA. Esta cartera está diseñada para organizaciones que necesitan una infraestructura de IA confiable y una ruta más rápida desde el prototipo hasta la producción.

Personalización

Personalice los modelos con sus propios datos empresariales y luego impleméntelos de manera eficiente en producción con capacidades integradas de ajuste de modelos, compresión e inferencia.

Cargas de trabajo de IA

Despliegue cargas de trabajo de IA en una plataforma de nube híbrida congruente, que incluye inferencia escalable y de alto rendimiento para aplicaciones agénticas y en tiempo real.

Optimizado para GPU

Amplíe la capacidad de entrenamiento e inferencia con una infraestructura optimizada para GPU y tiempos de ejecución de inferencia distribuidos que maximizan el rendimiento y la rentabilidad en una amplia gama de aceleradores.

Gobernanza

Aplique seguridad, gobernanza y cumplimiento en todos los entornos, desde la creación de modelos hasta la inferencia de producción, para garantizar operaciones de IA confiable.

Soluciones de Red Hat AI en IBM Cloud

Una plataforma de IA abierta, híbrida y de nivel empresarial.

Profundice en nuestro resumen de la solución Red Hat AI en IBM Cloud

Red Hat AI Inference on IBM Cloud
OpenShift AI on IBM Cloud
Red Hat Enterprise Linux AI on IBM Cloud
InstructLab on IBM Cloud

Ofrece una inferencia de IA de alto rendimiento y escalable en cualquier lugar

Red Hat® AI Inference ofrece una plataforma congruente y de alto rendimiento para ejecutar modelos de IA generativa en entornos de nube híbrida. Construido sobre Red Hat OpenShift AI e impulsado por vLLM y llm-d, permite una inferencia rápida, previsible y rentable para cargas de trabajo en tiempo real y agénticas.

Capacidades clave

Despliegue de cualquier modelo y acelerador en la nube híbrida
Inferencia distribuida para servicios de producción de baja latencia y alto rendimiento
Optimización y compresión de modelos para reducir el costo por token
Telemetría específica de IA generativa para mayor rendimiento, confiabilidad y seguimiento de SLA
Gobernanza, seguridad y observabilidad de nivel empresarial

Red Hat AI Inference ofrece una base escalable y regulada para implementar la inferencia lista para producción en todos los equipos, aplicaciones y entornos.

Leer el anuncio

Leer documentación

Un cerebro digital luminoso que flota sobre una red azul de nodos conectados

Cree, despliegue y gestione aplicaciones de IA a escala

OpenShift AI on IBM Cloud combina Red Hat OpenShift con herramientas integradas de MLOps e IA generativa. Ofrece una plataforma coherente basada en Kubernetes para gestionar cargas de trabajo de IA en entornos de nube híbrida.

Capacidades clave:

Infraestructura optimizada para el entrenamiento y la inferencia de IA
Pipelines integrados para la gestión del ciclo de vida del modelo de extremo a extremo
Opciones de computación habilitadas para GPU con autoescalado inteligente
Seguridad, cumplimiento y observabilidad de nivel empresarial
Soporte unificado proporcionado conjuntamente por IBM y Red Hat

OpenShift AI proporciona una base confiable y segura para las operaciones de IA y el despliegue de producción.

Un sistema operativo seguro y de alto rendimiento para cargas de trabajo de IA

Red Hat Enterprise Linux AI (RHEL AI) ofrece un entorno estable para ejecutar y personalizar LLM en la nube, el centro de datos y las ubicaciones perimetrales. Incluye la familia de modelos de código abierto Granite y las herramientas InstructLab, lo que brinda a los equipos un entorno de desarrollo y despliegue de IA listo para usar.

Capacidades clave:

Seguridad empresarial y gestión del ciclo de vida
Soporte optimizado para GPU y aceleradores de IA
Despliegues portátiles en la nube híbrida
Operaciones constantes alineadas con los procesos estándar de RHEL

RHEL AI proporciona una base segura y previsible para las cargas de trabajo de IA empresarial.

Personalice los modelos de IA empresarial con un servicio gestionado

Red Hat AI InstructLab on IBM Cloud es un servicio totalmente gestionado que le permite personalizar modelos de lenguaje grandes sin necesidad de un reentrenamiento completo. Utiliza la generación de instrucciones sintéticas para agregar nuevos comportamientos, habilidades y conocimientos de dominio, lo que ayuda a reducir los costos de GPU y acelerar el desarrollo de modelos.

Capacidades clave de InstructLab:

Personalización de modelos con datos empresariales
Menores requisitos de infraestructura que el ajuste tradicional
Entorno seguro de IBM Cloud para la protección de datos
Flujos de trabajo estandarizados entre equipos

InstructLab proporciona una forma más rápida de crear modelos de IA que se adapten a las necesidades de su negocio y a los requisitos de gobernanza.

Por qué Red Hat IA on IBM Cloud

Red Hat AI on IBM Cloud ofrece una base segura, coherente y escalable para trasladar las cargas de trabajo de IA de la fase piloto a la producción en su nube híbrida.

Acelere la adopción de la IA

Pase del piloto a la producción más rápido con herramientas optimizadas, flujos de trabajo automatizados e inferencia de alto rendimiento lista para ejecutar.

Coherencia híbrida en todas partes

Ejecute cualquier modelo en cualquier acelerador compatible con una experiencia unificada en entornos on premises y en la nube.

Seguridad empresarial y cumplimiento

Proteja las cargas de trabajo confidenciales con gobernanza integrada, controles de acceso, auditabilidad y operaciones de inferencia seguras.

Infraestructura escalable de IA

La computación, el almacenamiento y las redes optimizados para GPU ofrecen el rendimiento necesario para el entrenamiento y la inferencia a escala.

IA confiable y precisa

Los datos de alta calidad, los modelos validados y las sólidas opciones de despliegue ayudan a mejorar la precisión del sistema y la toma de decisiones.

Menores costos operativos

Optimice el uso de recursos y reduzca el costo por token con procesamiento por lotes inteligente, compresión de modelos y utilización eficiente del acelerador.

Creados para la protección

Los controles de seguridad y privacidad contribuyen a cumplir con los requisitos normativos.

Plataforma de IA integral

Una pila completa, desde la infraestructura hasta el ciclo de vida del modelo y la inferencia de producción, reduce la complejidad y acelera la adopción empresarial.