Modelos de código abierto de OpenAI disponibles en IBM® watsonx.ai

espacio de liderazgo de IA generativa

Autores

Armand Ruiz

Vice President, Product Management - AI Platform (watsonx.ai & watsonx.gov)

IBM

Nisarg Patel

Product Manager, watsonx.ai

IBM

OpenAI ha lanzado dos modelos de inteligencia artificial, que permiten a los desarrolladores y empresas descargarlos, ejecutarlos y personalizarlos libremente. Uno de los modelos ahora está alojado en el estudio de desarrolladores watsonx.ai de IBM.

Es la primera vez que OpenAI toma una medida de este tipo desde 2019. En los últimos cinco años, la empresa se ha centrado casi por completo en ofrecer sus modelos más potentes, como GPT-4, GPT-4o y sus modelos de razonamiento o3 y o4-mini, a través de interfaces estrictamente controladas. Esta última versión pone un par de modelos potentes directamente en manos de los usuarios, que pueden ejecutarlos localmente o en su propia infraestructura sin restricciones de uso comercial.

Por qué utilizar modelos OpenAI en watsonx.ai

Uno de los dos modelos, el gpt-oss-120b más grande, está disponible hoy en la plataforma watsonx.ai de IBM. IBM dijo que el modelo puede implementarse de forma segura dentro de la infraestructura empresarial, personalizarse utilizando datos internos e integrarse en flujos de trabajo del mundo real en sectores como la sanidad, los servicios financieros y el soporte legal. El segundo modelo, gpt-oss-20b, también se añadirá pronto a la plataforma. Los equipos de desarrollo también podrán aprovechar pronto estos modelos de watsonx.ai al crear agentes dentro de watsonx Orchestrate.

IBM watsonx.ai permite a las empresas desarrollar, implementar y escalar aplicaciones de IA en una plataforma de desarrollo unificada. Brinda a los desarrolladores la flexibilidad y la opción de personalizar un modelo fundacional, acceder a una amplia gama de herramientas prediseñadas, personalizadas y de código abierto, beneficiarse de los marcos líderes y utilizar opciones de implementación híbrida para la nube y en las instalaciones, lo que permite la experimentación rápida y acelera el tiempo de obtención de valor para que la empresa pueda personalizar un modelo fundacional, acceder a una amplia gama de herramientas prediseñadas, personalizadas y de código abierto, aprovechar los marcos de trabajo líderes y utilizar opciones de implementación híbridas para la nube y las instalaciones, lo que permite una rápida experimentación y acelera el tiempo de obtención de valor para la empresa. 

La disponibilidad de gpt-oss en watsonx.ai añade otra opción a un menú cada vez mayor de modelos abiertos alojados en la plataforma y añadirá más opciones para los equipos que crean agentes en watsonx Orchestrate. Al ofrecer a los usuarios acceso a modelos abiertos de primer nivel en watsonx, incluidos modelos de terceros como Meta y Mistral y el propio Granite de IBM, el objetivo es fomentar una cultura de colaboración y flexibilidad para los clientes que implementan IA generativa.

Construido para la flexibilidad

El modelo más grande, gpt-oss-120b, contiene 116 800 millones de parámetros y utiliza una arquitectura Mixture of Experts (MoE), lo que significa que solo una parte del modelo está activa en cualquier momento. Este diseño le permite funcionar de manera eficiente en una sola GPU NVIDIA H100, que se utiliza ampliamente en los centros de datos. El modelo más pequeño, gpt-oss-20b, está optimizado para dispositivos de consumo como ordenadores portátiles con 16 GB de memoria.

Ambos modelos admiten niveles de razonamiento ajustables, bajo, medio o alto, para que los usuarios puedan equilibrar la calidad de output con el coste y la velocidad. The models also output full chains of reasoning, allowing users to see how a conclusion was reached, rather than receiving only the final answer. OpenAI dice que esto mejora la transparencia y hace que los modelos sean más fáciles de depurar y confiar.

OpenAI publicó puntuaciones de referencia que muestran que el modelo más grande funciona de manera competitiva en varias tareas de razonamiento y matemáticas. En la referencia MMLU, una prueba estándar de conocimientos generales, obtuvo una puntuación de 90. En la referencia científica GPQA, obtuvo una puntuación de 80,1. En la prueba de matemáticas AIME 2025, obtuvo una puntuación de 97,9, lo que sugiere una gran capacidad de razonamiento simbólico.

Los modelos no incluyen comprensión de imágenes, audio o vídeo, y no están equipados con filtros de contenido ni sistemas de moderación. Son solo de texto y se espera que los usuarios implementen sus propias salvaguardas dependiendo de cómo se implementen los modelos. Los usuarios pueden aprovechar Granite Guardian junto con gpt-oss para que sirva como un modelo de guardarraíl que ayude a detectar riesgos en las instrucciones y respuestas.

Auge del código abierto

El lanzamiento de gpt-oss llega en un momento en el que los modelos abiertos están ganando impulso, y subraya aún más la estrategia abierta y multimodelo de IBM, así como el compromiso de la empresa por proporcionar tanto a desarrolladores como a usuarios empresariales acceso a las tecnologías de IA más avanzadas disponibles. Al igual que Granite de IBM, LLaMA de Meta, Mistral y la familia Qwen de Alibaba han encontrado una amplia adopción entre desarrolladores e investigadores que buscan herramientas que puedan auditarse, mejorarse e implementarse de forma independiente.

Los modelos de peso abierto ofrecen una alternativa a los sistemas comerciales de caja negra, lo que permite un mayor escrutinio del comportamiento del modelo.

Para OpenAI, el lanzamiento de gpt-oss indica su voluntad de participar en estas dinámicas, incluso cuando continúa ofreciendo sus sistemas más avanzados solo a través de interfaces comerciales. La licencia Apache 2.0 ofrece a los usuarios una amplia libertad para construir sobre los modelos, sin restricciones de redistribución o uso en aplicaciones propietarias.

"El futuro es híbrido", dijo Bruno Aziza, vicepresidente de estrategia de datos, IA y análisis de IBM, en un episodio reciente del podcast Mixture of Experts . "No habrá un único modelo que lo domine todo... no será solo cerrado o abierto. La empresa tendrá ambos".

Comience hoy mismo

Al hacer que gpt-oss-120B esté disponible en watsonx.ai, IBM está capacitando a desarrolladores, científicos de datos y empresas para:

  • Implementar modelos abiertos en su propia infraestructura con control total sobre los datos y la computación
  • Personalizar y afinar el modelo para casos de uso especializados, desde atención médica hasta finanzas y atención al cliente
  • Crear aplicaciones de IA que aprovechen las capacidades nativas de uso de herramientas del modelo

Tanto si está creando asistentes internos, como automatizando flujos de trabajo o explorando nuevos casos de uso para la IA generativa, gpt-oss-120B en watsonx.ai ofrece la flexibilidad y la potencia para hacerlo todo, de forma segura y transparente. 

Explore gpt-oss-120B en watsonx.ai y comience a construir con uno de los modelos abiertos más capaces disponibles.